Motion Illusions Generated Using Predictive Neural Networks Also Fool Humans
该论文提出了一种基于视频预测神经网络的生成模型 EIGen 来创造视觉运动错觉,并通过人类实验证实了这些错觉的有效性,从而支持了“错觉运动源于大脑对预测的感知而非原始视觉输入”的假设,同时倡导利用人工智能模仿生物系统的“动机性失败”来推动相关研究。
6864 篇论文
该论文提出了一种基于视频预测神经网络的生成模型 EIGen 来创造视觉运动错觉,并通过人类实验证实了这些错觉的有效性,从而支持了“错觉运动源于大脑对预测的感知而非原始视觉输入”的假设,同时倡导利用人工智能模仿生物系统的“动机性失败”来推动相关研究。
本文提出了 EHRSQL,这是一个基于 222 名医院工作人员真实需求构建的、涵盖复杂查询、时间表达及不可回答问题识别的电子病历(EHR)文本转 SQL 实用基准数据集,旨在推动该技术在医疗领域的实际部署。
本文综述了利用深度学习近似解决机制设计中多目标冲突问题的技术细节与关键成果,并通过车联网能效管理、移动网络资源分配及农业投入品采购拍卖三个案例展示了该方法的有效性。
本文提出了名为 FEP-Nav 的生物启发框架,通过结合自上而下的解码器与自适应归一化机制,在无需梯度更新的情况下实时最小化变分自由能,从而显著提升了机器人在噪声和感官突变环境下的视觉导航鲁棒性。
该论文提出了一种名为“对比提示”(Contrastive Prompting)的新方法,通过仅需在提示中添加“给出一个正确和一个错误答案”的指令,即可显著提升大语言模型在算术、常识和符号推理等复杂任务上的零样本表现,其效果在多数场景下超越了现有的零样本和少样本思维链方法。
该论文提出了一种结合模型无关强化学习与监督学习的两阶段新方法,通过利用特权信息蒸馏 LKH 启发式算法生成的专家轨迹知识,实现了比 LKH 快约 50 倍且能完整覆盖所有任务点的非完整约束车辆邻域旅行商问题(DTSPN)快速求解。
本文提出了并行分割学习中的全局采样(GPSL)方案,通过服务器驱动的全局固定批次与基于池化比例的客户端调度,解决了传统并行分割学习中有效批次随客户端数量增长及非独立同分布数据导致的偏差问题,在无需额外开销的情况下实现了接近集中式训练的精度并显著缩短了训练时间。
该论文提出了一种基于生物体自然选择与自我组织的意识形式化理论,论证了价值(效价)优先于中性属性表征,并确立了“死亡赋予意义”这一核心观点,从而为构建更接近人类事实的意识科学奠定了基础。
该论文提出了一种名为“路径规划”(Path Planning, P2)的新型推理采样策略,通过将生成步骤分解为规划与去噪两个子阶段,使掩码扩散模型能够迭代优化已生成的令牌,从而在理论上扩展了证据下界,并在蛋白质、RNA、数学推理、故事生成及代码生成等多个领域实现了显著的性能提升。
本文提出了基于场协调的联邦学习(FBFL)框架,通过分布式空间领导者选举和自组织分层架构有效解决了数据非独立同分布(non-IID)及中心化瓶颈问题,并在非 IID 场景下展现出优于 FedAvg、FedProx 和 Scaffold 等现有方法的性能与容错能力。
本文提出了一种基于“控制即推理”概率框架的生成式决策新范式,通过变分分解将生成模型划分为控制器、建模器、优化器和评估器四大功能角色,系统梳理了其在具身智能、自动驾驶及科学 AI 等高风险领域的应用现状、潜在风险及迈向通用物理智能的未来挑战。
该研究通过对 16 名游戏设计师与开发者的用户研究,揭示了 AI 生成工具在游戏管线中的集成需求与使用偏好,并据此提出了一套以用户为中心的设计启发式准则,以指导此类工具更好地融入现有开发流程。
本文介绍了名为 StudyChat 的公开数据集,该数据集记录了学生在 AI 课程中与 LLM 辅导聊天机器人的真实交互,并通过分析发现,寻求概念理解和编程帮助的学生成绩更优,而利用 LLM 撰写报告或规避学习目标的学生考试成绩则较差。
本文提出了一种名为 BACE-RUL 的双向对抗网络模型,该模型仅利用当前生命周期内的传感器测量数据,通过协变量编码和条件生成机制来预测机械设备的剩余使用寿命,并在多个真实数据集上展现出优于现有方法的性能。
该论文揭示了监督微调在视觉语言模型安全对齐中因强化虚假相关性而导致的“安全幻象”缺陷,并提出利用机器遗忘技术替代传统微调,从而在显著降低攻击成功率的同时大幅减少误拒现象。
该研究通过佐治亚理工学院与埃默里大学联合项目为期三年的案例,展示了一种针对生物医学人工智能优化的进阶问题式学习(PBL)框架,有效克服了学生背景差异、资源限制及数据隐私等挑战,显著提升了学生的批判性思维、科研产出及解决真实生物医学问题的能力。
本文提出了首个大规模实证评估框架,通过向真实程序注入未见过的故障并应用语义保持变异来测试大语言模型的故障定位鲁棒性,发现模型在 78% 的情况下因过度依赖与语义无关的语法特征而失效,从而揭示了当前 LLM 在程序逻辑推理方面的根本局限。
本文提出了多尺度 Mamba(ms-Mamba)架构,通过集成具有不同采样率的多个 Mamba 块来捕捉多时间尺度信息,在多个基准测试中实现了优于现有 Transformer 及 Mamba 模型的性能,同时显著降低了参数量、显存占用和计算开销。
本文提出了一种逻辑增强生成(LAG)框架,通过结合语义知识图谱与提示启发式方法,有效提升了大语言模型在跨模态数据上的类比推理能力,并在隐喻检测与理解任务中展现出超越基线模型及人类的表现,同时揭示了当前隐喻理解与评估中存在的局限性。
本文提出了 Foam-Agent,这是一个利用大语言模型和检索增强生成技术、通过多智能体协作实现从网格生成到后处理全流程自动化的计算流体力学(CFD)框架,在无需专家干预的情况下将 110 个模拟任务的执行成功率提升至 88.2%。