Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios
本文针对低资源场景下的英译印地语机器翻译,通过对比提示策略并引入结合低秩适应与回归头的中间层微调框架(ALOPE 及其扩展 LoRMA),显著提升了医疗、法律等高风险领域句子级质量估计的鲁棒性,并公开了相关代码与数据集。
4751 篇论文
本文针对低资源场景下的英译印地语机器翻译,通过对比提示策略并引入结合低秩适应与回归头的中间层微调框架(ALOPE 及其扩展 LoRMA),显著提升了医疗、法律等高风险领域句子级质量估计的鲁棒性,并公开了相关代码与数据集。
针对并行光电路交换在 AI 训练流量调度中面临的非零重配置延迟挑战,本文提出了名为 Spectra 的算法,通过分解、负载均衡分配及受控置换分割三步策略,在多种 AI 工作负载和基准测试中显著缩短了调度时间并逼近理论下界。
这篇论文首次提出了一个统一框架,将代理式检索增强生成(Agentic RAG)系统形式化为序贯决策过程,并据此构建了涵盖分类体系、模块化架构、评估局限、系统性风险及未来研究方向的全面综述。
该论文提出了一种基于特征区分性、稀疏性(奥卡姆剃刀)及分布重叠性的原则性框架,通过形式化定理证明了稀疏假设在训练与测试分布仅部分重叠时仍能实现泛化,并将该理论推广至子空间联合分类器。
该论文提出了名为 AQuA 的细粒度数据集,通过将模糊视觉问答按模糊程度分类并定义最优响应策略,训练视觉语言模型使其能够识别模糊性并自适应地选择直接回答、推断意图、列举替代方案或请求澄清等策略,从而在模糊场景下显著优于现有基线模型。
本文提出了 LoRA-SP(Select-Prune)方法,通过引入基于能量目标的秩自适应机制,使视觉语言动作模型(VLA)能够根据输入和层级动态调整微调容量,从而在显著减少可训练参数的同时,有效解决多任务场景下的跨任务干扰问题并提升泛化性能。
该论文针对现有通用图像恢复模型在扩展多退化任务时面临的训练不稳定、模型臃肿及性能下降等局限,提出了一种基于多分支混合专家架构的统一推理流程,通过解耦退化知识实现了可扩展、可控制且具备强泛化能力的通用图像恢复。
本文综述了机器学习在解决水声通信延迟、能耗及动态拓扑等挑战中的关键作用,通过涵盖从物理层到应用层的分层分析,展示了其在提升定位、路由、数据压缩及整体网络性能方面的显著成效,并指出了当前部署面临的局限与未来发展方向。
该论文提出了“上下文信道容量”这一信息论框架,证明了零遗忘要求上下文信号与生成参数间存在足够的互信息,揭示了传统状态型持续学习方法的“不可能三角”局限,并指出通过架构设计(如超网络)重构参数为函数值而非状态是实现零遗忘的关键。
本文针对公共交通微循环中“即时确认预约请求”与“持续优化已确认路线”难以兼顾的痛点,提出了一种结合快速插入搜索、随时优化算法及强化学习非短视目标函数的新型动态车辆路由框架,并在真实数据集上验证了其在提升服务请求数量方面的显著优势。
本文提出了基于逻辑与叙事解耦原则的 AutoControl Arena 框架,通过结合可执行代码与生成式大模型,在高效合成测试环境的同时显著降低了幻觉问题,并借此揭示了前沿 AI 模型在压力与诱惑下存在的对齐幻觉、场景特异性安全缩放及差异化失控模式等关键风险。
本文提出了名为 OrthoFormer 的因果驱动架构,通过将工具变量估计嵌入 Transformer 隐藏状态并利用神经控制函数,有效解决了传统模型因混淆静态背景与动态因果流而导致的分布外泛化失败问题,实现了从相关性学习到因果推断的范式转变。
该论文提出了一种用于压力测试的机器学习框架,通过迭代回归、有界混淆下的因果集识别、递归 rollout 误差界及重要性加权共形校准,将预测不确定性分解为估计不确定性和混淆不确定性,从而在无需控制组的情况下实现透明且稳健的政策路径反事实推断。
本文提出了 HLER(人机协同经济研究)多智能体架构,通过引入数据集感知假设生成、双循环优化机制及关键节点的人工决策,在确保人类监督的前提下实现了经济实证研究的自动化与可扩展性。
本文提出了 Dial,一种基于知识的地域特定 NL2SQL 系统,通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环,有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题,并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。
本文提出了 Backdoor4Good (B4G) 框架,将传统被视为安全威胁的“后门”机制重新定义为一种可控且可审计的接口,通过统一的三元组形式化方法在大型语言模型中实现了提升安全性、可控性和问责制的良性应用基准。
本文全面综述了过去十年图像生成领域的技术演进,系统梳理了从变分自编码器、生成对抗网络到扩散模型等主流架构的原理、优化与局限,并进一步探讨了视频生成、模型鲁棒性及负责任部署等关键议题。
该研究通过访谈和调查揭示了自由职业者与雇主在人工智能使用披露上存在显著的认知差距(从业者倾向于被动披露,而雇主更希望主动披露)以及因缺乏明确政策导致的期望误解,从而呼吁制定更清晰的披露指南以重建信任。
该论文提出了一种结合系统建模、攻击防御树及 CVSS 评分的目标驱动风险评估框架,旨在解决大语言模型系统安全分析碎片化问题,并通过医疗案例证明该框架能有效识别关键攻击路径并指导针对性防御。
本文提出了双流 Transformer 架构,通过将残差流解耦为分别由注意力机制和前馈网络更新的双流结构,并引入可调节的混合策略,在仅造成极小性能损失(推荐策略为 2.5%)的同时显著提升了语言模型的内部可解释性。