cs.LG 篇论文 | Gist.Science

From Semantic To Instance: A Semi-Self-Supervised Learning Approach

该论文提出了一种名为 GLMask 的半自监督学习方法，通过最小化人工标注并专注于形状与纹理特征，成功将语义分割转化为实例分割，在小麦穗实例分割任务中达到了 98.5% 的 mAP@50 的 SOTA 性能，并在 COCO 数据集上实现了超过 12.6% 的显著提升。

Keyhan Najafian, Farhad Maleki, Lingling Jin, Ian Stavness2026-03-10🤖 cs.LG

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

本文针对直接偏好优化（DPO）中数据选择忽视模型演化状态的问题，提出了名为 SamS 的自适应批处理样本调度算法，该算法能根据模型学习反馈动态调整训练样本，从而在不修改核心算法且计算开销极小的情况下显著提升大语言模型的泛化性能。

Zixuan Huang, Yikun Ban, Lean Fu, Xiaojie Li, Zhongxiang Dai, Jianxin Li, Deqing Wang2026-03-10🤖 cs.LG

DemoDiffusion: One-Shot Human Imitation using pre-trained Diffusion Policy

DemoDiffusion 提出了一种无需特定任务训练或人机配对数据即可实现单样本人类模仿的机器人操作新方法，该方法通过运动学重定向将人类手势转化为粗略轨迹，并利用预训练扩散策略将其修正为符合机器人动作分布的可行轨迹，在 8 项真实世界任务中取得了 83.8% 的平均成功率。

Sungjae Park, Homanga Bharadhwaj, Shubham Tulsiani2026-03-10🤖 cs.LG

Adopting a human developmental visual diet yields robust, shape-based AI vision

该研究提出了一种受人类视觉发育启发的“发展性视觉饮食”（DVD）课程，通过模拟人类从婴儿期到成年的视觉成熟过程（如视力、对比度和色彩感知的发展），成功引导 AI 模型从依赖纹理特征转向依赖形状信息，从而显著提升了其在形状识别、抗干扰及对抗攻击方面的鲁棒性，实现了更类人且高效的视觉系统。

Zejin Lu, Sushrut Thorat, Radoslaw M Cichy, Tim C Kietzmann2026-03-10🤖 cs.LG

Noisy PDE Training Requires Bigger PINNs

该论文通过理论推导与实验验证，揭示了在含噪数据下训练物理信息神经网络（PINN）时，若要使经验风险低于噪声方差，网络规模必须满足特定的下界约束，从而证明了单纯增加噪声样本数量无法降低误差。

Sebastien Andre-Sloan, Anirbit Mukherjee, Matthew Colbrook2026-03-10🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

本文提出了名为 TableEG 的框架，该框架利用经过微调的大语言模型和三元组表示法，在多个真实世界数据集上生成高度逼真的表格错误，从而有效弥合了合成数据与真实错误分布之间的差距，并为数据清洗技术的评估建立了稳健的基准。

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin Tong2026-03-10🤖 cs.LG

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

本文提出了一种名为 MCULoRA 的鲁棒不完整多模态低秩适应框架，通过模态组合感知低秩适应（MCLA）模块解耦共享信息与模态特性，并利用动态参数微调（DPFT）模块基于表征空间可分性优化训练比例，从而有效解决了多模态情感识别中因模态缺失导致的梯度冲突问题并显著提升了预测性能。

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

该论文揭示了多模态大语言模型（MLLM）作为验证器时普遍存在的“同意偏差”问题，并提出了一种名为自我 grounded 验证（SGV）的两步生成方法，通过先独立生成行为先验再评估轨迹，显著提升了验证准确性及智能体在网页导航、计算机操作和机器人等领域的任务完成表现。

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt Kira2026-03-10🤖 cs.LG

Flow Matching Meets Biology and Life Science: A Survey

这篇论文作为首份全面综述，系统梳理了流匹配（Flow Matching）的理论基础及其在生物序列建模、分子生成与设计和蛋白质生成等生命科学领域的最新应用进展，并总结了相关数据集、工具及未来发展方向。

Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models

该论文提出了一种基于树结构的弱到强泛化方法，通过利用蒙特卡洛树搜索构建包含成功与失败轨迹的层次化表示，在复杂决策环境中有效提升了强模型的推理与决策能力。

Ruimeng Ye, Zihan Wang, Yang Xiao, Zinan Ling, Manling Li, Bo Hui2026-03-10🤖 cs.LG

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

本文揭示了恶意审计对象如何利用最优传输等数学策略，从原本不公平的数据分布中构造出既满足公平性指标又看似具有代表性的样本以制造“公平假象”，并提出了基于分布距离统计检验的防御机制来识别此类操纵攻击。

Valentin Lafargue, Adriana Laurindo Monteiro, Emmanuelle Claeys, Laurent Risser, Jean-Michel Loubes2026-03-10🤖 cs.LG

Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models

该论文提出了一种动态、自动且系统的红队测试（DAS）框架，通过实时压力测试揭示了医疗大语言模型在静态基准测试中表现优异但在动态鲁棒性、隐私、公平性和幻觉等关键安全维度上存在严重脆弱性的“基准差距”，从而为构建可信赖的医疗 AI 提供了必要的评估基础。

Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG

cs.LG

From Semantic To Instance: A Semi-Self-Supervised Learning Approach

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

DemoDiffusion: One-Shot Human Imitation using pre-trained Diffusion Policy

Adopting a human developmental visual diet yields robust, shape-based AI vision

Noisy PDE Training Requires Bigger PINNs

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

Flow Matching Meets Biology and Life Science: A Survey

Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

GraphProp: Training the Graph Foundation Models using Graph Properties

Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

CbLDM: A Diffusion Model for recovering nanostructure from atomic pair distribution function

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders