Subclass Classification of Gliomas Using MRI Fusion Technique
该研究提出了一种基于多模态 MRI 图像融合(T1、T2、T1ce 和 FLAIR)的胶质瘤亚类分类方法,通过结合 2D 与 3D UNET 分割及加权平均融合技术,并利用预训练 ResNet50 模型进行分类,在 BraTS 数据集上实现了 99.25% 的高准确率,显著优于现有方法。
3730 篇论文
该研究提出了一种基于多模态 MRI 图像融合(T1、T2、T1ce 和 FLAIR)的胶质瘤亚类分类方法,通过结合 2D 与 3D UNET 分割及加权平均融合技术,并利用预训练 ResNet50 模型进行分类,在 BraTS 数据集上实现了 99.25% 的高准确率,显著优于现有方法。
该研究提出了一种基于 U-Net、Inception 和 ResNet 架构的深度学习混合模型,旨在平衡 2D 与 3D 卷积在计算效率与空间精度间的权衡,通过在 BraTS 数据集上的实验验证,该模型在 3D 和 2D 胶质瘤分割任务中分别实现了 98.91% 和 99.77% 的高准确率,为临床脑肿瘤自动诊断提供了有效解决方案。
该论文提出了一种名为“留一法 PPO"(LOOP)的新型强化学习方法,通过结合 REINFORCE 的方差缩减技术与 PPO 的鲁棒性及样本效率优势,有效解决了文本到图像扩散模型微调中样本效率与最终性能之间的权衡难题。
本文针对现有基于大语言模型的多智能体系统在动态环境(如 Minecraft)中因串行执行导致的响应延迟问题,提出了一种具备可中断执行能力的双线程并行规划 - 行动框架,通过中央记忆系统同步规划线程与技能库驱动的递归执行线程,显著提升了系统的实时响应与适应能力。
该研究提出了一种名为 GlucoLens 的可解释机器学习系统,它利用可穿戴设备、饮食及工作日志等多模态数据,结合大语言模型来预测餐后血糖曲线下面积及高血糖风险,并能通过反事实解释为个体提供个性化的行为干预建议。
该研究提出了一种结合解剖学标志点与 Transformer 架构的新型图卷积神经网络,利用四面体网格处理 sMRI 数据,在无需昂贵 PET 扫描的情况下显著提升了阿尔茨海默病诊断及脑淀粉样蛋白阳性(尤其是中风险人群)的预测精度。
该研究利用 CGScholar 平台对 36 名哈萨克斯坦学者进行调查,发现人工智能工具的熟悉度与接受反馈的意愿呈中等正相关,而研究写作经验则与对同行反馈(尤其是方法论方面)的期望呈强正相关,表明将 AI 辅助与传统同行反馈相结合能有效提升学术写作质量。
本文提出了 ViLAM 方法,通过将大型视觉 - 语言模型的推理能力蒸馏为空间注意力图,从而生成具备社会意识的导航代价地图,显著提升了机器人在真实场景中的社会合规导航成功率。
本文提出了 IMPACT 框架,利用视觉语言模型推断环境语义以生成各向异性接触成本图,并结合接触感知 A*规划器,实现在杂乱环境中高效且安全的接触式运动规划。
本文介绍了 iProg 工具,它通过结合大语言模型与人类反馈的交互式结构化归纳编程方法,将科学数据分析任务分解为数据流图并生成代码,从而在开发速度、代码质量和系统性能上显著优于传统的低代码/无代码方案。
该研究通过自由叙事评估框架发现,尽管大型语言模型因微调技术导致女性角色在职业分布上被过度代表,但其生成的职业性别比例仍比现实数据更贴近人类刻板印象,揭示了当前缓解性别偏见措施面临的悖论与挑战。
该论文提出了一种从 2D 对齐到 3D 合理性的统一框架,通过融合异构基础模型先验进行 2D 结构对齐,并引入无穿透扩散模型优化 3D 空间交互,从而在单目图像中实现抗遮挡、无穿透且符合物理真实性的双手重建。
本文提出了熵驱动不确定性过程奖励模型(EDU-PRM),该框架通过利用高预测熵自动锚定推理步骤边界,无需昂贵的人工标注即可在 ProcessBench 基准测试中超越现有强基线,并仅用 1.5% 的训练数据实现了与 SOTA 模型相当的性能及更高效的推理。
该研究介绍了名为 MediTools 的基于大语言模型的医疗教育原型应用,通过提供皮肤科病例模拟、AI 增强版 PubMed 文献分析及医疗新闻摘要等工具,旨在革新医学教育并提升临床决策能力,同时通过针对医疗从业者的调查验证了其初步效果。
本文提出了一种名为 MetaBoost 的混合框架,通过集成多种数据平衡技术与反事实分析,不仅显著提升了代谢综合征预测模型的准确性,还识别出血糖和甘油三酯为关键风险因素,为临床干预提供了可操作的见解。
该论文系统整合了2019至2025年间评估大语言模型与自主智能体的碎片化工作,提出了涵盖约60个基准的统一分类法,综述了智能体框架、跨领域应用及关键协作协议,并针对未来研究方向提出了具体建议。
本文提出了一种名为 SFIBA 的空间全目标不可见后门攻击方法,通过结合频域注入、形态约束及局部空间区域限制,在确保触发器视觉不可见性和针对所有类别的特定性的同时,实现了高效的黑盒多目标攻击并有效规避现有防御。
本文介绍了 DCASE 2025 挑战赛中的第五项任务,即一个涵盖生物声学、时间声景和复杂问答等多领域的音频问答基准,旨在通过多样化的数据集和评估协议推动音频语言模型在声学内容推理方面的发展,使其具备接近人类水平的感知与交互能力。
该研究通过引入认知负荷理论,分析了 34 位金融专业人士在利用 GPT-4o 完成复杂估值任务时的表现,发现 AI 生成内容能提升工作质量,但由模型发起的任务切换等引发的外在认知负荷对绩效的负面影响最大,且这种负面影响会随经验不足而加剧。
该论文提出了名为 Ready2Unlearn 的元学习优化方法,通过在训练阶段前瞻性地赋予模型“可遗忘就绪”状态,使其在面对未来的数据删除请求时,能够比传统反应式方法更高效、更规范地执行机器遗忘。