Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing
该论文提出情感是塑造大语言模型注意力机制与推理过程的关键潜在因素,通过构建情感均衡的 AURA-QA 数据集并引入情感正则化框架,揭示了情感语调对注意力几何结构的影响,并显著提升了模型在情感变化及分布偏移场景下的阅读理解性能。
2393 篇论文
该论文提出情感是塑造大语言模型注意力机制与推理过程的关键潜在因素,通过构建情感均衡的 AURA-QA 数据集并引入情感正则化框架,揭示了情感语调对注意力几何结构的影响,并显著提升了模型在情感变化及分布偏移场景下的阅读理解性能。
该论文构建了一个宏观金融压力测试框架,论证了快速 AI 采纳引发的核心风险并非生产力崩溃或生存危机,而是由于经济制度仍锚定于人类认知稀缺性,导致 AI 创造的供给过剩与因劳动收入下降、货币流通速度减缓及中介业务崩溃而引发的需求不足之间出现结构性错配,进而可能触发私人信贷与抵押贷款市场的连锁危机。
本文提出了名为 PrivPRISM 的自动化框架,通过结合语言模型与静态代码分析,系统性地检测 Google Play 应用的数据安全声明与隐私政策之间的不一致性,研究发现大量流行应用存在披露矛盾、通用模板滥用及敏感数据未充分披露等严重合规问题。
该论文提出了一种基于全身体肌肉骨骼模型与强化学习的可扩展人体仿真框架,通过模拟人机耦合系统获取内部生物力学指标,实现了交互式机器人结构与控制策略的协同优化。
该论文提出了基于布鲁姆分类学的 BD-FDG 框架,通过结构化知识组织、认知分层问题建模及自动化质量控制,构建了包含 23 万样本的 SSA-SFT 数据集并微调出 SSA-LLM-8B 模型,显著提升了大语言模型在空间态势感知领域的专业表现,同时保持了通用能力。
BridgeDiff 提出了一种基于扩散模型的虚拟试穿框架,通过服装条件桥接模块和扁平结构约束模块,有效弥合了人体观测与扁平服装合成之间的差距,实现了更高质量且结构稳定的服装重建。
该论文提出了通过构建对抗性基准 ToMBench-Hard 并结合监督完整推理过程的多维奖励强化学习框架 Social-R1,成功训练出参数量仅为 4B 却能在社会推理任务上超越更大模型并具备强泛化能力的高效模型。
该研究提出了一种结合预训练与定制神经网络的单模型方法,通过数据增强、图像归一化和迁移学习等技术,利用 GTSRB 及 Udacity 模拟器等多源数据集,系统性地实现了交通标志识别、车辆与车道检测及行为克隆,从而提升了自动驾驶系统的感知能力与决策可靠性。
本文提出了名为 Logos 的紧凑型分子推理模型,它通过分阶段训练将多步逻辑推理与严格的化学一致性相结合,在确保生成结构化学有效性的同时实现了可解释的理性分子设计,其性能在多个基准测试中媲美甚至超越了参数量大得多的通用语言模型。
本文提出了受树突计算机制启发的 DendroNN 模型,通过无梯度的重连机制识别时空脉冲序列,并设计了基于时间轮的异步数字硬件架构,从而在事件驱动数据处理中实现了比现有神经形态硬件高 4 倍的能效。
该论文提出了 DenoiseSplat,一种针对含噪多视图图像的自监督前馈 3D 高斯泼溅方法,通过在大规模构建的 RE10K 噪声基准上仅利用干净 2D 渲染进行端到端训练,实现了在噪声环境下优于现有基线的 3D 场景重建与新颖视图合成性能。
该论文指出大语言模型的口头置信度评分存在严重的离散化倾向,并证明将置信度量表从标准的 0-100 调整为 0-20 能显著提升其元认知效率,表明量表设计应被视为评估大模型不确定性时的关键变量。
该论文通过揭示大语言模型激活空间中存在显著的非线性几何扭曲,挑战了传统的线性干预假设,并提出了一种基于多项式核主成分分析的“曲线球(Curveball)”非线性干预方法,从而在控制模型行为方面取得了优于线性方法的性能。
本文提出了 CLoE 框架,通过引入模态专家与区域专家的双重一致性学习目标及可靠性感知特征重校准机制,有效解决了多模态医学图像分割中因模态缺失导致的专家分歧与融合不稳定问题,显著提升了模型在缺失模态场景下的性能及临床关键结构的鲁棒性。
本文提出了名为 SpaceSense-Bench 的大规模多模态基准数据集,该数据集基于虚幻引擎 5 生成,包含 136 种卫星模型的高保真同步 RGB、深度及 LiDAR 数据与精细标注,旨在解决航天器感知与位姿估计中真实数据匮乏的问题,并通过基准测试揭示了小部件感知与零样本泛化等关键挑战及数据规模对性能提升的重要性。
该论文提出了一种将语音情感识别模型推断的情绪标签作为显式上下文注入大语言模型驱动的社会化 VR 代理的交互流程,并通过用户研究证实该方法显著提升了对话质量、自然度及用户参与度,使 93.3% 的参与者更倾向于选择具备情感感知能力的代理。
本文提出了基于 Gram 矩阵的纹理共振检索(TRR)方法,通过利用 Wav2Vec2 激活的投影 Gram 矩阵来弥合用户感知意图与低层音频效果参数之间的语义鸿沟,并在吉他效果基准测试中证明了其在生成可编辑插件配置方面的优越性能。
本文提出了 STAR 基准,这是一个基于多智能体零和博弈的评估框架,旨在揭示大型语言模型在静态推理之外,将战略深度转化为实时决策执行能力时存在的显著差距,并强调在动态对抗环境中平衡推理质量与响应速度的重要性。
本文提出了 TaSR-RAG 框架,通过将查询和文档表示为关系三元组并结合轻量级分类体系进行结构化推理,有效解决了传统检索增强生成(RAG)系统在多跳推理中存在的上下文冗余、信息密度低及推理脆弱等问题,在多个多跳问答基准测试中显著提升了性能。
本文提出了一种名为鲁棒正则化策略迭代(RRPI)的新方法,通过将离线强化学习建模为在转移不确定性下的鲁棒策略优化问题,利用 KL 正则化将不可解的双层优化转化为可处理的单目标问题,从而在 D4RL 基准测试中实现了优于现有基线的性能并有效避免了分布外状态下的不可靠动作。