HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases
该论文提出了首个将硬件描述语言(HDL)固有图特征(如抽象语法树和数据流图)与检索增强生成(RAG)相结合的 HDLxGraph 框架,并发布了基于真实项目的 HDLSearch 基准数据集,有效解决了现有 RAG 在处理复杂 HDL 项目时面临的结构性与词汇性不匹配问题,显著提升了搜索、调试和代码补全的准确率。
6474 篇论文
该论文提出了首个将硬件描述语言(HDL)固有图特征(如抽象语法树和数据流图)与检索增强生成(RAG)相结合的 HDLxGraph 框架,并发布了基于真实项目的 HDLSearch 基准数据集,有效解决了现有 RAG 在处理复杂 HDL 项目时面临的结构性与词汇性不匹配问题,显著提升了搜索、调试和代码补全的准确率。
针对现有协同学习基准忽视真实世界数据孤岛中表连接与对齐等端到端数据管理流程的不足,本文构建了基于 10 万个真实关系数据库的 WikiDBGraph 基准套件,以评估并揭示现有方法在复杂异构数据环境下的局限性及改进方向。
本文提出了基于非回合制游戏 Agar.io 的持续强化学习研究平台 AgarCL,该平台通过高维、随机且动态演化的环境为智能体提供了渐进式行为发展的测试场,并通过对多种算法的评估揭示了 AgarCL 所面临的挑战超越了传统的稳定性 - 可塑性困境。
本文提出了首个跨尺度全球湿地甲烷排放基准数据集 X-MethaneWet,该数据集融合了物理模型模拟与实地观测数据,并通过评估深度学习模型及迁移学习策略,为利用人工智能提升全球甲烷通量建模精度与科学发现提供了新途径。
该论文建立了一个针对无限维概率分布空间的最优控制最大原理与哈密顿 - 雅可比 - 贝尔曼方程的通用理论框架,并提出了结合深度神经网络的扩展数值算法,以有效解决包含障碍物和智能体交互的大规模多智能体控制问题。
本文提出了名为 VISTA 的免训练框架,通过结合文本与图表多模态信息并利用思维链提示引导视觉语言模型,在零样本设置下实现了显著优于传统统计模型及单模态方法的股票价格预测性能。
该论文提出了一种通过向大语言模型的中间层表示注入可训练嵌入来增强指令层级信号的新方法,从而显著降低了提示注入攻击的成功率,同时保持了模型的实用性。
该论文针对高阶共同邻居中存在的冗余和过平滑问题,提出了通过正交化和归一化技术消除重复并缓解过平滑的“正交共同邻居(OCN)”方法,在多个链接预测基准测试中显著优于现有最先进模型。
本文提出了名为 ViTaPEs 的基于 Transformer 的架构,通过引入包含模态内局部编码与跨模态全局编码的两阶段位置注入机制,实现了任务无关的视触觉表征学习,在多项真实世界数据集的识别任务及机器人抓取场景中均展现出超越现有最先进方法的性能与零样本泛化能力。
本文提出了 LoFT 方法,通过将优化器的一阶和二阶动量投影到低秩子空间以对齐全量微调的动态,从而在不增加推理成本或额外超参数调优的情况下,显著缩小了参数高效微调与全量微调之间的性能差距。
该论文提出了名为“渐进式神经坍缩”(ProNC)的新框架,通过动态扩展等角紧帧(ETF)目标而非依赖固定全局 ETF,有效缓解了持续学习中的灾难性遗忘问题,并在实验中展现出优于现有基线的性能与灵活性。
该论文提出了一种即插即用的自适应校正方法,通过引入轻量级可学习算子,在保持神经算子表达能力的同时灵活且严格地确保质量、动量等物理守恒定律,从而显著提升了模型在求解偏微分方程时的精度、稳定性及整体性能。
本文提出了 ActivePusher 框架,通过结合残差物理建模与基于不确定性的主动学习,优化非抓取操作中的数据收集与规划过程,从而显著提升了数据效率及在仿真和真实环境中的规划成功率。
本文提出了 MMTU,一个包含 28,000 多个问题和 25 项真实世界任务的大规模基准测试,旨在全面评估大语言模型在专家级表格理解、推理及操作方面的能力,并揭示了当前顶尖模型在此领域仍存在显著不足。
该论文表明,通过利用大学习率下梯度下降优化产生的瞬态混沌动力学(即处于探索与利用平衡的临界混沌状态),可以显著加速人工神经网络在多种监督学习任务中的训练过程。
本文介绍了 EROICA,这是首个面向大规模模型训练的在线性能故障诊断系统,它通过在线剖析和差异可观测性技术,在几乎不影响生产环境的前提下,实现了对涵盖约 10 万张 GPU 集群中软硬件混合故障的细粒度、全覆盖诊断,并在实际部署中取得了 97.5% 的成功率。
本文提出了 BemaGANv2,一种通过引入 AMP 生成模块和 MED 判别器,并系统评估多种判别器组合策略,以实现高保真、长时程音频生成(如文本转音乐/音频)的先进 GAN 语音合成器。
本文针对现实场景中数据与模型异构的挑战,提出了任务相关性感知的聚合策略及维度不变模块 Co-LoRA,并构建了涵盖 40 个任务的多模态基准,显著提升了个性化联邦学习在异构环境下的性能。
该论文提出了两种高效算法(Slate-GLM-OFU 和 Slate-GLM-TS)来解决具有指数级候选集和逻辑回归奖励的上下文石板多臂老虎机问题,通过局部规划实现低计算复杂度并保证的累积遗憾,且在合成实验与大语言模型提示工程应用中均优于现有基准。
该论文通过揭示锐度感知最小化(SAM)在机器遗忘中因拟合遗忘集而丧失去噪特性的机制,提出了将模型拆分并分别利用 SAM 学习保留信号与锐度最大化消除遗忘信号的“锐度极小极大(Sharp MinMax)”方法,从而在降低保留数据需求的同时显著提升了遗忘效果并增强了模型安全性。