Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice
本文介绍了名为 Agora 的 AI 驱动平台,它利用大语言模型整合真实人类观点以模拟审议过程,初步研究表明该平台能有效帮助用户提升解决分歧、内部审议及达成共识的能力,为规模化公民教育提供了新方向。
11674 篇论文
本文介绍了名为 Agora 的 AI 驱动平台,它利用大语言模型整合真实人类观点以模拟审议过程,初步研究表明该平台能有效帮助用户提升解决分歧、内部审议及达成共识的能力,为规模化公民教育提供了新方向。
本文提出了名为 Mechanistic CBM (M-CBM) 的新型概念瓶颈模型框架,该框架通过稀疏自编码器从黑盒模型中提取并命名内在概念,从而在严格控制信息泄露的前提下,显著提升了概念预测的准确性、决策稀疏性及解释的简洁性,并超越了现有的概念瓶颈模型。
该论文提出了 AgrI 挑战赛,通过引入多团队独立采集数据的跨团队验证(CTV)评估范式,揭示了单一数据源训练在农业视觉任务中的泛化缺陷,并证明了多源协作训练能显著缩小跨域泛化差距,同时发布了一个包含 5 万余张图像的大规模公开数据集以推动数据为中心的农业视觉研究。
该论文提出了一种利用嵌套 Dropout 为扩散模型、归一化流和变分自编码器引入可调复杂度先验的方法,通过在压缩感知等逆问题中动态平衡表示误差与过拟合风险,显著降低了重建误差并提供了相应的理论分析。
该研究通过网格生存环境中的 22 次实验,首次证实大语言模型多智能体系统的合作行为与心理压力之间呈现类似耶克斯 - 多德森定律的倒 U 型关系,表明适度的环境压力能最大化涌现合作,而极端压力会导致行为崩溃,且性选择机制能有效消除攻击性并促进沟通。
该论文填补了亚 2000 万参数“小模型”领域的研究空白,揭示了在 TinyML 规模下模型误差率虽遵循幂律但指数更陡、饱和更早,且误差分布、类别难度偏好及校准度均随规模发生显著质变,从而证明直接套用大模型规律会误导边缘 AI 部署,必须在目标模型规模下进行验证。
这篇立场论文主张通过结合范畴论中的函子变换以消除语义偏差,以及利用检索增强生成(RAG)注入多样化外部知识,构建一个双管齐下的框架来确保大语言模型的公平性。
ConfHit 是一种无需实验验证器(Oracle)的分布无关框架,它利用加权交换性和多重样本密度比加权共形 p 值,为药物发现中的生成式设计提供统计保证,既能认证生成批次中是否包含有效候选分子,又能将其精炼为紧凑集合。
本文针对低资源场景下的英译印地语机器翻译,通过对比提示策略并引入结合低秩适应与回归头的中间层微调框架(ALOPE 及其扩展 LoRMA),显著提升了医疗、法律等高风险领域句子级质量估计的鲁棒性,并公开了相关代码与数据集。
针对并行光电路交换在 AI 训练流量调度中面临的非零重配置延迟挑战,本文提出了名为 Spectra 的算法,通过分解、负载均衡分配及受控置换分割三步策略,在多种 AI 工作负载和基准测试中显著缩短了调度时间并逼近理论下界。
这篇论文首次提出了一个统一框架,将代理式检索增强生成(Agentic RAG)系统形式化为序贯决策过程,并据此构建了涵盖分类体系、模块化架构、评估局限、系统性风险及未来研究方向的全面综述。
该论文提出了一种基于特征区分性、稀疏性(奥卡姆剃刀)及分布重叠性的原则性框架,通过形式化定理证明了稀疏假设在训练与测试分布仅部分重叠时仍能实现泛化,并将该理论推广至子空间联合分类器。
该论文提出了名为 AQuA 的细粒度数据集,通过将模糊视觉问答按模糊程度分类并定义最优响应策略,训练视觉语言模型使其能够识别模糊性并自适应地选择直接回答、推断意图、列举替代方案或请求澄清等策略,从而在模糊场景下显著优于现有基线模型。
本文提出了 LoRA-SP(Select-Prune)方法,通过引入基于能量目标的秩自适应机制,使视觉语言动作模型(VLA)能够根据输入和层级动态调整微调容量,从而在显著减少可训练参数的同时,有效解决多任务场景下的跨任务干扰问题并提升泛化性能。
该论文针对现有通用图像恢复模型在扩展多退化任务时面临的训练不稳定、模型臃肿及性能下降等局限,提出了一种基于多分支混合专家架构的统一推理流程,通过解耦退化知识实现了可扩展、可控制且具备强泛化能力的通用图像恢复。
本文综述了机器学习在解决水声通信延迟、能耗及动态拓扑等挑战中的关键作用,通过涵盖从物理层到应用层的分层分析,展示了其在提升定位、路由、数据压缩及整体网络性能方面的显著成效,并指出了当前部署面临的局限与未来发展方向。
该论文提出了“上下文信道容量”这一信息论框架,证明了零遗忘要求上下文信号与生成参数间存在足够的互信息,揭示了传统状态型持续学习方法的“不可能三角”局限,并指出通过架构设计(如超网络)重构参数为函数值而非状态是实现零遗忘的关键。
本文针对公共交通微循环中“即时确认预约请求”与“持续优化已确认路线”难以兼顾的痛点,提出了一种结合快速插入搜索、随时优化算法及强化学习非短视目标函数的新型动态车辆路由框架,并在真实数据集上验证了其在提升服务请求数量方面的显著优势。
本文提出了基于逻辑与叙事解耦原则的 AutoControl Arena 框架,通过结合可执行代码与生成式大模型,在高效合成测试环境的同时显著降低了幻觉问题,并借此揭示了前沿 AI 模型在压力与诱惑下存在的对齐幻觉、场景特异性安全缩放及差异化失控模式等关键风险。
本文提出了名为 OrthoFormer 的因果驱动架构,通过将工具变量估计嵌入 Transformer 隐藏状态并利用神经控制函数,有效解决了传统模型因混淆静态背景与动态因果流而导致的分布外泛化失败问题,实现了从相关性学习到因果推断的范式转变。