K-MaT: Knowledge-Anchored Manifold Transport for Cross-Modal Prompt Learning in Medical Imaging

本文提出了 K-MaT(知识锚定流形传输)框架,通过结合临床文本锚定提示并采用融合 Gromov-Wasserstein 最优传输技术对齐流形,实现了无需低质量模态训练数据即可将大型生物医学视觉 - 语言模型从高端成像(如 CT)有效迁移至低质量模态(如 X 光),从而在多个跨模态基准测试中取得了优于现有方法的性能并缓解了灾难性遗忘问题。

Jiajun Zeng, Shadi Albarqouni2026-03-09🤖 cs.AI

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

本文提出了名为 CLAIRE 的混合深度学习框架,通过结合无监督深度表征学习与监督分类,并利用博弈论可解释性技术分析潜在空间,有效解决了高维工业环境中传感器数据噪声大、冗余多的问题,显著提升了智能制造系统中的故障检测精度与可解释性。

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

ESAA-Security: An Event-Sourced, Verifiable Architecture for Agent-Assisted Security Audits of AI-Generated Code

本文提出了 ESAA-Security 架构,这是一种专为 AI 生成代码安全审计设计的、基于事件溯源的验证性框架,它通过将代理认知与确定性状态变更分离,并采用追加日志、约束输出及重放验证机制,将安全审查从自由形式的对话转化为可追溯、可复现且基于证据的治理流程。

Elzo Brito dos Santos Filho2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

该论文针对科学工作流中确定性与灵活性难以兼得的矛盾,提出了一种通过机器可验证的“模式门控”将对话自由与执行严格相分离的架构,并验证了多模型评分在系统评估中的有效性,旨在实现既灵活又可复现的代理式 AI 科学工作流。

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

Physical Simulator In-the-Loop Video Generation

该论文提出了物理模拟器内循环视频生成(PSIVG)框架,通过将物理模拟器与视频扩散过程相结合,利用模拟的 4D 场景轨迹引导生成过程,并辅以测试时纹理一致性优化技术,从而在保持视觉质量的同时显著提升了生成视频对重力、惯性和碰撞等基本物理定律的遵循程度。

Lin Geng Foo, Mark He Huang, Alexandros Lattas, Stylianos Moschoglou, Thabo Beeler, Christian Theobalt2026-03-09🤖 cs.AI

Prosodic Boundary-Aware Streaming Generation for LLM-Based TTS with Streaming Text Input

该论文提出了一种基于弱时间对齐数据的 Prosodic Boundary-Aware 后训练策略,使 LLM 驱动的 TTS 模型能够在流式文本输入下实现基于内容边界的早期停止与滑动窗口推理,从而有效解决了流式合成中韵律不自然和长文本崩溃的问题,显著降低了长文本合成的词错误率并提升了说话人与情感相似度。

Changsong Liu, Tianrui Wang, Ye Ni, Yizhou Peng, Eng Siong Chng2026-03-09🤖 cs.AI

Do Foundation Models Know Geometry? Probing Frozen Features for Continuous Physical Measurement

该论文通过探针实验证明,冻结的视觉 - 语言模型底层特征中蕴含的连续几何信息远超其文本输出能力,且这种“表示 - 表达”差距源于训练路径而非表征缺失,不同架构的编码器虽表征相似性低却实现了功能收敛,表明无需微调即可利用冻结骨干网络作为多任务几何传感器。

Yakov Pyotr Shkolnikov2026-03-09🤖 cs.AI

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

PONTE 是一种人机协同框架,通过闭环验证与自适应机制,结合偏好建模、基于结构化 XAI 产物的生成以及多重验证模块,为不同用户生成既个性化又可信的自然语言解释,有效解决了现有可解释人工智能方法中缺乏个性化及大模型易产生幻觉的问题。

Vittoria Vineis, Matteo Silvestri, Lorenzo Antonelli, Filippo Betello, Gabriele Tolomei2026-03-09🤖 cs.AI

Artificial Intelligence for Detecting Fetal Orofacial Clefts and Advancing Medical Education

该研究提出了一种基于超过 4.5 万张超声图像训练的人工智能系统,其诊断胎儿口面裂的准确率媲美资深放射科医生,不仅能显著提升初级医生的诊断敏感性,还能加速罕见病临床专家的培养,为医疗资源匮乏地区提供了兼顾精准诊断与专业教育的可扩展解决方案。

Yuanji Zhang, Yuhao Huang, Haoran Dou, Xiliang Zhu, Chen Ling, Zhong Yang, Lianying Liang, Jiuping Li, Siying Liang, Rui Li, Yan Cao, Yuhan Zhang, Jiewei Lai, Yongsong Zhou, Hongyu Zheng, Xinru Gao, Cheng Yu, Liling Shi, Mengqin Yuan, Honglong Li, Xiaoqiong Huang, Chaoyu Chen, Jialin Zhang, Wenxiong Pan, Alejandro F. Frangi, Guangzhi He, Xin Yang, Yi Xiong, Linliang Yin, Xuedong Deng, Dong Ni2026-03-09🤖 cs.AI