Inverse Neural Operator for ODE Parameter Optimization
本文提出了逆神经算子(INO)框架,通过结合条件傅里叶神经算子重构轨迹与摊销漂移模型在参数空间进行无梯度优化,实现了从稀疏观测中高效、准确地反演常微分方程参数,在保持高精度的同时将推理速度提升了 487 倍。
3523 篇论文
本文提出了逆神经算子(INO)框架,通过结合条件傅里叶神经算子重构轨迹与摊销漂移模型在参数空间进行无梯度优化,实现了从稀疏观测中高效、准确地反演常微分方程参数,在保持高精度的同时将推理速度提升了 487 倍。
该论文提出了一种面向多站部署的 WiFi 信道状态信息(CSI)感知框架,通过结合跨模态自监督预训练以学习对站点特征缺失具有不变性的表征,并引入站点级掩码增强策略,有效解决了实际应用中站点特征缺失与标注数据稀缺的双重挑战。
该论文通过识别时间序列预测中的三大分布偏移挑战,利用消融研究揭示可逆实例归一化(RevIN)中部分组件的冗余或负面影响,从而提出了提升其鲁棒性与泛化能力的新视角。
FlexRec 是一种基于强化学习的后训练框架,通过引入基于反事实交换的因果项级奖励和不确定性感知的批评引导缩放机制,有效解决了大语言模型推荐系统在序列奖励稀疏噪声下的训练难题,从而实现了针对动态需求的灵活适应与显著性能提升。
该论文针对多治疗场景下的个体治疗效应估计难题,提出了一种基于最优压缩的因果表示学习框架,通过推导新的泛化界确定最优平衡权重,并设计了具有 O(1) 可扩展性的“治疗聚合”策略及生成式架构 Multi-Treatment CausalEGM,在显著降低计算复杂度的同时实现了高精度的估计效果。
本文提出了 EnTransformer,一种将随机学习范式"engression"与 Transformer 架构相结合的新型深度生成式框架,通过引入随机噪声并优化基于能量的评分目标,在不依赖参数假设的情况下实现了多变量时间序列的相干概率预测,并在多个基准数据集上展现出优于现有模型的校准性能。
该论文针对现有化学理解任务局限于静态分子表征的不足,提出了旨在将 4D 分子轨迹转化为可解释自然语言描述的“化学动力学理解(ChemDU)”新任务,并构建了首个相关基准数据集 Chem4DBench 及统一模型 Chem4DLLM,以推动动态化学理解与多模态科学推理的研究。
本文提出了面向移动端算子生成的评估框架 MobileKernelBench 及多智能体系统 MoKA,旨在解决大模型在移动端内核生成中面临的编译失败率高和性能提升有限等挑战,实验表明 MoKA 能将编译成功率提升至 93.7% 并使 27.4% 的生成算子实现加速。
该论文提出了 ProtoSR 方法,通过利用指令微调大语言模型从海量非结构化放射学报告中挖掘细粒度知识并构建多模态原型库,进而指导结构化报告生成模型进行预测修正,从而在 Rad-ReStruct 基准上实现了细粒度图像理解与结构化报告生成的最先进性能。
该研究通过对 Geneformer 单细胞基础模型进行全电路映射、高阶组合消融和因果轨迹引导实验,揭示了其内部存在严重的特征冗余、重尾枢纽架构以及未注释的生物学偏差,并证实了模型层位置对细胞分化方向具有因果控制作用。
本文针对多处理设置下合成最近邻(SNN)方法因各处理组数据不足而失效的问题,提出了混合合成最近邻(MSNN)估计量,通过跨处理组整合信息,在保持有限样本误差界和渐近正态性保证的同时显著提升了数据稀缺场景下的因果矩阵补全效果。
该论文提出了一种名为有效电阻重连(ERR)的无参数拓扑修正策略,通过利用有效电阻这一全局指标识别并优化结构瓶颈,在缓解图神经网络过挤压问题的同时,揭示了其与过平滑之间的权衡关系,并证明结合归一化技术可进一步提升模型性能。
该论文提出将沃罗诺伊镶嵌引入概率电路以捕捉数据局部几何结构,并通过构建近似推断框架与特定结构条件来解决由此引发的可处理性难题,同时设计了可微松弛方法以支持梯度学习。
本文提出了名为 SLIP 的开源框架,通过结合对比对齐与传感器条件化描述生成,利用预训练语言模型实现了跨不同传感器配置的语言对齐表征学习,在零样本迁移、信号描述及问答任务中显著优于现有基线方法。
本文提出了局部邻接谱嵌入(LASE)方法,通过加权谱分解揭示网络中的局部低维结构,在理论上证明了其能平衡局部化统计成本与截断误差,并在实验中展示了其在局部重建、可视化及构建高保真全局视图方面的优越性。
该论文将表示学习的稳定性形式化为统计与结构可辨识性,提出了模型无关的-近可辨识性定义,证明了非线性解码器模型中间表示的统计近可辨识性,并验证了通过独立成分分析(ICA)后处理可有效实现解耦,从而在合成数据及细胞显微基础模型上显著提升了下游泛化能力。
本文通过将输入空间从紧集上的连续函数推广到任意豪斯多夫局部凸空间,利用对偶空间中的连续线性泛函构建拓扑分支 - 主干网络,证明了连续算子在该框架下仍可被拓扑 DeepONets 一致逼近,从而将经典的 Chen-Chen 算子逼近定理推广至更广泛的拓扑空间设置中。
本文首次建立了多轮次预条件随机梯度下降(PSGD)的平均算法稳定性理论,揭示了人口风险曲率、噪声几何与预条件策略之间的权衡关系,并证明了不当的预条件选择会导致基于有效维度的泛化与优化性能次优。
本文提出了 BTZSC 基准,通过涵盖 22 个数据集对跨编码器、嵌入模型、重排序器及大语言模型进行了系统的零样本文本分类评估,发现现代重排序器性能最佳,而传统 NLI 跨编码器则表现停滞。
该论文提出了一种名为 FedFew 的个性化联邦学习算法,通过将问题重构为“少数模型服务多数客户端”的优化框架,仅需维护少量共享服务器模型即可在无需人工聚类或精细调参的情况下,自动实现接近最优的个性化效果并显著提升可扩展性。