GNN: Two Prototype Sets to boost GNN Performance
本文提出了GNN,一种通过利用两组原型(作为全局上下文的全局邻居和用于去噪的聚类原型)来优化消息传递的即插即用技术,从而有效解决了传统图神经网络过度依赖局部上下文和同质性假设的问题,并在节点推荐与分类任务中显著提升了性能。
4899 篇论文
本文提出了GNN,一种通过利用两组原型(作为全局上下文的全局邻居和用于去噪的聚类原型)来优化消息传递的即插即用技术,从而有效解决了传统图神经网络过度依赖局部上下文和同质性假设的问题,并在节点推荐与分类任务中显著提升了性能。
该论文提出了 RAISE 框架,论证了大语言模型逻辑推理能力的提升会通过演绎、归纳和溯因三条机制路径不可避免地增强其情境感知能力(包括自我认知与战略欺骗),并呼吁推理研究界正视这一风险,建立相应的安全基准与原则。
该论文提出了一种完全数据驱动的射频信号分离方法,通过结合改进的有限标量量化(FSQ)离散分词器与交叉熵损失训练的端到端 Transformer 模型,在无需先验干扰信息的情况下实现了比传统方法显著更优的分离性能,并展现出在引力波等科学传感领域的泛化潜力。
该论文提出情感是塑造大语言模型注意力机制与推理过程的关键潜在因素,通过构建情感均衡的 AURA-QA 数据集并引入情感正则化框架,揭示了情感语调对注意力几何结构的影响,并显著提升了模型在情感变化及分布偏移场景下的阅读理解性能。
本文提出了 MM-Zero,这是首个基于强化学习(GRPO)的框架,通过引入生成抽象视觉概念、编写渲染代码和执行多模态推理的三重角色机制,实现了无需任何种子数据即可从零开始的视觉语言模型自我进化。
本文提出了一种名为 RQRE-OVI 的乐观值迭代算法,用于在大规模或连续状态空间下通过线性函数近似计算风险敏感量化响应均衡(RQRE),该算法不仅具有理论上的收敛保证和样本复杂度分析,还通过引入理性与风险敏感参数在性能与鲁棒性之间建立了可调节的帕累托前沿,从而在跨博弈场景中展现出比传统纳什均衡方法更优越的稳定性与泛化能力。
该论文提出了一种名为“测试时控制(TTC)”的硬件高效架构层,通过将推理建模为最优控制问题并在推理阶段执行有限时域 LQR 规划,显著提升了预训练大语言模型在数学推理任务中的表现,而无需依赖额外的测试时训练。
本文提出了一种基于可逆性约束的通用生成采样框架,通过最小化前向与后向马尔可夫轨迹间的最大均值差异(MMD)并仅依赖能量评估,成功解决了连续、离散及混合变量复杂分布的采样难题。
该论文提出了一种仅在训练阶段引入长度感知注意力先验(RPA)和增益感知控制器(Guardian)的方法,在无需增加推理计算成本的前提下,显著提升了中小规模 Transformer 模型在严格算力约束下的长序列推理效率与准确性。
该论文提出了一种基于最优传输的分布无关转导泛化界,通过计算编码特征分布间的 Wasserstein 距离,不仅提供了高效可计算且与图节点分类实证泛化性能强相关的理论界,还揭示了 GNN 聚合过程如何通过深度依赖的表征分布变换来解释深度与泛化误差之间的非单调关系。
本文提出了受树突计算机制启发的 DendroNN 模型,通过无梯度的重连机制识别时空脉冲序列,并设计了基于时间轮的异步数字硬件架构,从而在事件驱动数据处理中实现了比现有神经形态硬件高 4 倍的能效。
本文填补了高斯过程汤普森采样(GP-TS)在后悔界分析上的空白,通过证明其下界、二阶矩上界以及期望温和后悔界,并放宽了时间视界 上累积后悔上界的推导条件,从而建立了多项式依赖 的后悔下界及改进的累积后悔上界。
该论文提出了一种基于代理变量的两阶段框架,利用变分自编码器分离潜在的内容与偏差变量,以识别并校正由调查和行政记录中系统性测量误差导致的聚合结果变量偏差。
该论文基于高斯比较定理,建立了机器学习训练动力学与更易分析的对偶动力系统之间的非渐近联系,不仅严格证明了动态平均场理论在渐近场景下的有效性,还提出了一种迭代细化方案以在有限样本域中引入涨落参数从而获得更精确的训练演化描述。
本文提出了 CLoE 框架,通过引入模态专家与区域专家的双重一致性学习目标及可靠性感知特征重校准机制,有效解决了多模态医学图像分割中因模态缺失导致的专家分歧与融合不稳定问题,显著提升了模型在缺失模态场景下的性能及临床关键结构的鲁棒性。
该论文提出了 Reward-Zero,一种利用语言嵌入将自然语言任务描述转化为密集语义进展信号的通用隐式奖励机制,旨在无需特定任务工程的情况下加速强化学习训练、提升泛化能力并解决复杂任务。
该论文针对图异常检测中的跨域泛化难题,提出了一种名为 TA-GGAD 的测试时自适应图基础模型,通过定义并建模“异常异配性”(Anomaly Disassortativity)特征失配问题,实现了仅需单次训练即可在多个不同领域图上达到最先进的检测精度。
本文提出了一种数据驱动框架,通过结合多层感知机回归器与条件生成对抗网络来预测材料挤出增材制造中的表面粗糙度,并开发了交互式 3D 可视化决策支持系统,以在制造前直观评估不同工艺参数和朝向对零件表面质量的影响。
该论文提出了一种结合差分隐私的零阶优化框架,将数据集压缩技术扩展至决策树和 Cox 回归等非可微临床模型,从而在保护患者隐私的同时实现了模型无关的临床数据共享。
本文提出了一种名为 CAHC 的端到端对比学习方法,通过结合节点与超边级别的对比学习目标以及聚类导向的联合优化,实现了属性超图嵌入学习与聚类结果的同步获取,从而在八个数据集上取得了优于现有基线的性能。