Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language
该论文针对现有对话情感识别方法难以捕捉复杂微妙情感状态的局限,提出了“对话情感转录”(ETC)新任务,并构建了包含日语自然语言情感描述及分类标签的数据集,旨在推动更富表现力的对话情感理解研究。
2864 篇论文
该论文针对现有对话情感识别方法难以捕捉复杂微妙情感状态的局限,提出了“对话情感转录”(ETC)新任务,并构建了包含日语自然语言情感描述及分类标签的数据集,旨在推动更富表现力的对话情感理解研究。
本文提出了一种名为 DCTR 的细粒度表格检索机制,通过细粒度类型查询分解和全局连通性感知,有效解决了开放域复杂查询场景下关系数据库问答中的检索挑战,并在行业基准测试中展现了其针对高复合查询和密集连接数据库的鲁棒性。
该论文提出了一种在推理阶段通过最大化模型内部“自我确定性”来最小化不确定性的新方法,该方法在思维层面而非词元层面进行选择,以少量采样显著提升了大语言模型在数学推理任务中的表现,并揭示了早期推理步骤的确定性对最终准确性的关键预测作用。
该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法,在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力,但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。
该论文针对现有方法在记录创意活动轨迹时缺乏意图与高层级创意决策关联的问题,提出了三种互补方案,分别通过节点式界面管理生成式 AI 状态、构建可视化创作词汇以及将语义历史嵌入交互状态,以更好地捕捉和解读跨领域的创意实践。
本文针对自主智能体面临的提示注入等执行层漏洞,提出了包含沙箱隔离、意图验证、零信任授权及审计日志的四层治理架构(LGA),并通过构建双语基准测试与多模型实验,验证了该架构在保持低延迟的同时能有效拦截绝大多数恶意工具调用。
该论文提出了“重解强化学习”(Re²)方法,通过让大语言模型在推理过程中学会灵活放弃低效路径并重新解题,从而在无需监督微调的情况下显著提升其推理性能并解决过度思考问题。
该论文提出了一种融合丘脑、杏仁核、前额叶及小脑等脑区模拟模块的微型脑 Transformer 架构,并通过实验揭示了一个反直觉的关键发现:仅有抑制性胼胝体耦合无法实现海马体功能侧化,必须依赖前额叶工作记忆缓冲器打破对称性,才能触发侧化状态的急剧相变。
该论文提出了 VINO 框架,通过利用结构先验生成非语义视图并构建不对称蒸馏任务,有效解决了视频自监督学习中因前景与背景协同运动导致的上下文捷径问题,从而学习到具有强物体中心不变性的鲁棒特征表示。
该论文提出了一种基于学习排序(LTR)的混合推荐系统,通过利用深度学习技术挖掘 Stack Overflow 中的社交上下文嵌入,帮助开发者在软件社区中高效检索并推荐最相关的软件缺陷解决方案,其在推荐前 10 个答案时达到了约 78% 的准确率。
该论文针对卫星遥感预计算嵌入中几何不匹配及标准插值失效的问题,提出了一种学习几何等变性的预测架构(LEPA),通过直接预测几何变换后的嵌入而非简单插值,显著提升了 NASA/USGS HLS 影像及 ImageNet-1k 数据集上的几何调整精度(MRR 从低于 0.2 提升至 0.8 以上)。
该论文针对具有异质目标的智能体协作场景,提出了一种结合模仿学习与强化学习的分层方法,使智能体能够自主判断何时合作或单独行动,从而在扩展的协作环境中显著优于基线方法。
本文提出了一种将车辆运动学信息融入观察编码器并引入几何感知监督的 RSSM 潜在世界模型框架,通过增强潜在空间的结构化动力学表示,显著提升了自动驾驶策略学习的样本效率和长程想象保真度。
VisualDeltas 提出了一种轻量级的偏好学习框架,通过利用多模态数据中的视觉质量扰动自动生成监督信号,从而在不依赖人工标注的情况下提升模型的视觉感知与推理能力。
该研究通过实证分析发现,在部署约束下,四种主流大语言模型生成的学术引用存在率极低(最高仅 47.5%),且大量“未解决”的引用实为虚构,因此强烈建议在将其用于软件工程文献综述或工具链前必须进行事后引用验证。
该论文提出了专为鸟类物种设计的多模态对话助手 MAviS,通过构建包含图像、音频和文本的大规模数据集(MAviS-Dataset)及评估基准(MAviS-Bench),训练出在细粒度物种理解与多模态问答方面表现优于现有开源模型(如 MiniCPM-o-2.6)的 MAviS-Chat,从而推动了生物多样性保护与生态监测领域的智能化发展。
该论文提出了一种受大脑皮层启发的模块化感知人工智能架构,旨在通过借鉴神经科学中的模块化、预测处理和跨模态整合原理,解决当前单体模型在可解释性、组合泛化及自适应鲁棒性方面的不足,从而实现更透明且与人类认知对齐的推理系统。
该论文提出了一种基于广义傅里叶变换的谱分析框架,通过检测不可约表示中由连续对称性诱导的结构化稀疏模式,从而无需优化生成元即可有效发现未知的一参数子群对称性。
本文探讨了智能辅导系统中基于历史行为数据生成下一步提示、路径点及子目标,并优化提示时机,同时展望了结合大语言模型进行数据驱动自适应教学的未来潜力。
该论文针对部分可观测强化学习中的潜在初始状态分布偏移问题,提出了对抗性潜在初始状态 POMDP 框架,通过理论证明最小最大原理并设计迭代最佳响应训练策略,在 Battleship 基准测试中显著降低了策略的鲁棒性差距,证实了结构化对抗暴露能有效缓解最坏情况下的脆弱性。