Raising Bars, Not Parameters: LilMoo Compact Language Model for Hindi

本文介绍了专为印地语设计的 0.6B 参数语言模型 LilMoo,该模型通过从零开始训练、构建高质量印地语语料库(GigaLekh)及双语增强策略,在有限算力下实现了超越同规模多语言基线模型的性能,证明了针对特定语言优化的小模型能有效缩小低资源语言在自然语言处理中的差距。

Shiza Fatimah, Aniket Sen, Sophia Falk + 3 more2026-03-05🤖 cs.AI

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

本文提出了一套针对多智能体消费助手(特别是生产级 AI 杂货购物助手)的构建、评估与优化蓝图,通过引入多维评估体系、校准的 LLM 裁判流水线,以及基于 GEPA 的代理级与系统级提示词优化策略,系统性地解决了多轮交互评估与紧密耦合多智能体系统优化的难题。

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

MIND: Unified Inquiry and Diagnosis RL with Criteria Grounded Clinical Supports for Psychiatric Consultation

该论文提出了 MIND 框架,通过构建基于诊断标准的心理推理库并结合强化学习中的过程奖励与轨迹修正机制,有效解决了精神科咨询中因症状模糊和共病复杂性导致的诊断依据不足及问诊策略漂移问题,显著提升了诊断准确性、共情交互质量与可解释性。

Guoyi Li, Shihao Xu, Jiatong Ma + 3 more2026-03-05🤖 cs.AI

Semantic Bridging Domains: Pseudo-Source as Test-Time Connector

该论文针对源域未知且目标域无标签的分布偏移问题,提出了一种将伪源域视为连接源与目标语义桥梁的逐步语义对齐(SSA)方法,通过利用通用语义修正伪源特征并结合分层特征聚合与置信度感知互补学习策略,在无需源域数据的情况下显著提升了模型在图像分割和分类任务中的性能。

Xizhong Yang, Huiming Wang, Ning Xu + 1 more2026-03-05💬 cs.CL