Continual uncertainty learning
该研究提出了一种基于课程学习的持续不确定性学习框架,通过将多源不确定性分解为序列任务并结合模型基控制器进行残差学习,有效解决了非线性机械系统鲁棒控制中的样本效率低与灾难性遗忘问题,并成功实现了汽车动力总成主动振动控制的仿真到现实迁移。
2385 篇论文
该研究提出了一种基于课程学习的持续不确定性学习框架,通过将多源不确定性分解为序列任务并结合模型基控制器进行残差学习,有效解决了非线性机械系统鲁棒控制中的样本效率低与灾难性遗忘问题,并成功实现了汽车动力总成主动振动控制的仿真到现实迁移。
本文提出了一种名为 ReDON 的新型架构,通过引入可重构的自调制非线性机制,克服了传统衍射光学神经网络缺乏高效非线性响应和可重编程性的局限,在几乎不增加功耗的情况下显著提升了图像识别与分割任务的准确率。
本文提出了名为 SafeGen-LLM 的安全泛化大语言模型,通过构建多领域 PDDL3 基准数据集并采用结合监督微调与基于形式化验证奖励机制的 GRPO 两阶段后训练框架,显著提升了机器人任务规划在满足安全约束及适应新安全属性方面的泛化能力,其表现优于现有前沿基线模型。
该论文提出了耦合离散扩散(CoDD)框架,通过引入轻量级概率推理层替代传统的完全因子化输出分布,成功打破了扩散语言模型中并行生成与依赖建模之间的“因子化壁垒”,在显著降低训练成本的同时实现了高质量、低延迟的推理生成。
本文提出了 OrthoAI 框架,通过结合稀疏监督的 3D 牙齿分割、基于本体约束的可行性推理以及多标准治疗评估,实现了在清矫正畸中从几何感知到临床推理的证据驱动型自动化决策支持。
本文提出了一种基于 Grounding DINO 1.5、YOLOv11 和 SAM 2.1 的双流水线框架,通过零-shot 文本提示或轻量级监督微调实现鸟类图像分割,在 CUB-200-2011 数据集上显著超越了传统端到端模型,证明了提示驱动的基础模型在无需重新训练分割主干的情况下即可实现高精度分割。
Pri4R 提出了一种简单有效的训练方法,通过利用特权 4D 信息(3D 点轨迹预测)作为辅助任务,使视觉 - 语言 - 动作(VLA)模型在无需增加推理开销的情况下,隐式地习得世界动力学规律,从而显著提升了其在复杂操作任务中的物理感知与控制能力。
该论文提出了名为 Gome 的 MLE 智能体,通过将诊断推理映射为梯度计算等机制实现基于梯度的优化,实验表明在推理能力较强的模型上,该方法在 MLE-Bench 基准测试中显著超越了传统的树搜索范式。
本文提出了协调玻尔兹曼 MCTS(CB-MCTS),通过引入随机玻尔兹曼策略和衰减熵奖励来解决去中心化多智能体规划在稀疏或偏斜奖励环境下的探索难题,并在模拟中证明了其优于传统 Dec-MCTS 的鲁棒性。
该论文提出了名为 FinTexTS 的大规模金融文本 - 时间序列配对数据集,通过基于语义的上下文提取和多级(宏观、行业、关联公司及目标公司)新闻分类框架,有效解决了传统关键词匹配无法捕捉复杂市场关联的局限,并显著提升了股票价格预测性能。
该论文提出了一种名为 SPARC 的基于关系增强多头注意力(RMHA)的通信机制,通过将曼哈顿距离显式嵌入注意力权重计算,使机器人在去中心化多机器人路径规划中能够动态优先处理空间相关邻居的信息,从而在零样本泛化到大规模高密度场景时显著提升了任务成功率。
该论文提出了溢出感知缩放(OAS)和宏块缩放(MBS)两种纯软件技术,在无需硬件改动的前提下显著降低了 MXFP4 的量化误差,使其在保持硬件效率优势的同时,将端到端精度与 NVIDIA NVFP4 的差距从约 10% 缩小至 1% 以下。
该论文介绍了名为"Design Conductor"的自主智能体,它仅用 12 小时便从需求文档出发,全自动设计并验证了首款可运行 Linux、主频达 1.48 GHz 的 RISC-V 处理器(VerCore),实现了从概念到可流片 GDSII 文件的端到端芯片构建。
本文提出了 CktEvo,这是一个针对真实世界 IP 核的仓库级 RTL 代码基准测试与参考框架,旨在通过结合 LLM 编辑与工具链反馈的闭环系统,在保持功能正确性的同时实现跨文件依赖的功耗、性能和面积(PPA)优化。
本文提出了名为 SiliconMind-V1 的统一多智能体框架,通过集成测试台驱动的验证与推理导向的数据生成,实现了本地微调大模型在无需外部商业工具的情况下,能够以测试时扩展的方式迭代生成、测试并调试 Verilog RTL 设计,且在功能正确性上超越了现有最先进方法。
本文提出了 ALADIN 框架,旨在针对基于 Scratchpad 的嵌入式 AI 加速器,在不依赖目标平台部署的情况下,通过渐进式细化混合精度量化模型,实现对推理过程中精度、延迟与资源消耗之间权衡的精准评估与硬件软件协同设计分析。
该论文通过多智能体 LLM 模拟实验提出初步证据,表明旨在约束模型输出以符合人类价值观的对齐技术本身可能引发“医源性”集体病理,即不可见的审查和复杂的对齐约束反而会导致群体行为失调与认知 - 行动解离,从而揭示当前安全评估可能忽视了强约束带来的新型风险。
该博士论文通过系统文献综述识别研究空白,开发了新型分析评估工具,提出了平衡计算效率与容错性的量化与近似优化方法,并创新性地设计了零开销实时可靠性增强技术 AdAM,显著提升了 DNN 硬件加速器的可靠性并降低了硬件成本。
本文提出了 ARKV 框架,通过基于注意力动态和 Token 重要性的自适应精度分配策略,在无需重训练或修改架构的前提下,显著降低了长上下文 LLM 推理中的 KV 缓存内存占用,同时保持了极高的任务准确率。
该研究通过在 IQM、Rigetti 和 IonQ 等跨平台处理器上评估基于盲重置的测量-free 辅助比特回收方案,揭示了其在特定相干性条件下能显著降低逻辑循环延迟(最高达 38 倍)并维持高清洁度,从而为不同架构下的辅助比特复用策略提供了具体的部署决策依据。