EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution
本文提出了 EvoSchema 基准,通过引入涵盖十种列级和表级扰动的新颖模式演化分类法,系统评估并提升了文本转 SQL 模型在真实世界数据库模式动态变化下的鲁棒性。
2316 篇论文
本文提出了 EvoSchema 基准,通过引入涵盖十种列级和表级扰动的新颖模式演化分类法,系统评估并提升了文本转 SQL 模型在真实世界数据库模式动态变化下的鲁棒性。
本文提出了流形上的黎曼平均流(RMF)方法,通过利用平行输运构建平均速度场并采用对数映射表示,实现了无需数值积分的流形生成模型单步采样,在球面、环面和 SO(3) 等数据集上显著降低了采样成本并提升了生成质量。
本文提出了一种名为“采样与搜索”的高效算法,通过引入预测器预处理和高维采样策略,显著降低了学习增强型-均值聚类问题的计算复杂度并改善了聚类成本。
本文提出了 CacheSolidarity 系统,通过动态监控并选择性隔离可疑的跨租户前缀缓存共享,在有效防御大语言模型多租户服务中自动前缀缓存(APC)引发的时序侧信道攻击的同时,避免了现有防御方案因完全隔离用户而导致的性能损失,实现了高达 70% 的缓存复用率提升和 30% 的推理延迟降低。
该论文通过对比蒙特卡洛 Dropout 与共形预测两种方法在 Fashion-MNIST 数据集上的表现,指出尽管 H-CNN VGG16 精度更高但存在过度自信问题,而 GoogLeNet 校准性更优且共形预测能提供统计保证的预测集,从而强调了在深度学习系统中超越准确率、重视可靠性与不确定性评估的重要性。
该论文针对数据泄露问题,提出了一种将监督学习生命周期分解为 7 个核心原语并施加运行时硬约束的结构化语法方案,通过强制性的评估边界在调用时自动拒绝选择泄露和记忆泄露,从而有效防止了文档指南无法解决的常见失败。
本文提出了 CUPID 框架,这是一种无需修改或重新训练基础模型即可灵活插入任意层、同时估计偶然性和认知性不确定性的通用插件模块,旨在提升高风险领域 AI 决策的透明度与可信度。
该论文提出了一种基于自编码器的深度随机化分布式函数计算(DeepRDFC)框架,旨在利用数据样本最小化模拟分布与未知目标分布之间的总变差距离,从而在公共随机性受限的场景下,实现相比传统数据压缩方法更显著的通信负载增益和函数计算性能。
该论文提出了一种利用物理不可克隆函数(PUF)将神经网络模型权重与特定硬件唯一属性绑定的方法,从而确保模型仅在原始硬件上能保持高精度运行,有效防止了知识产权在克隆硬件上的非法复制。
该论文提出了一种名为 Sign-Prioritized FL (SP-FL) 的新型无线联邦学习框架,通过优先传输梯度符号并基于数据包与设备层面的重要性差异进行分层资源分配,有效解决了无线资源受限下的通信不可靠问题,显著提升了模型训练精度。
该论文提出了一种融合动力学机制的深度学习框架,通过自适应低维子空间高效计算瞬态不稳定性特征作为可解释前兆,并利用 Transformer 模型显著提升了高维混沌系统中极端事件的长时预测能力。
该论文提出了一种名为“超级神经元”(Super Neurons)的免训练方法,通过直接探测视觉语言模型浅层中生成的标量激活值来构建分类器,从而在显著提升分类性能的同时实现高达 5.10 倍的推理加速。
本文提出了一种结合上下文感知两阶段划分策略与残差空间误差校正的 AI 框架,通过解决空间自相关导致的泄漏问题,显著提升了 5G/6G 网络规划中细粒度蜂窝流量需求预测的准确性与泛化能力。
该论文提出了一种基于图注意力网络(HR-GAT)的层级多分辨率模型,利用公开部署数据在细粒度空间尺度上准确估算频谱需求,从而有效降低空间自相关并提升泛化能力,为频谱共享与分配决策提供了可靠支持。
该论文提出了名为 MCCOP 的框架,通过在预训练扩散模型引导的连续潜在空间中进行流形约束优化,生成兼具生物合理性、最小突变数且能实现目标属性(如稳定性或活性)的蛋白质序列反事实,从而为蛋白质工程提供可解释的机制洞察和具体的设计指导。
该论文提出并评估了一种基于随机平滑的防御机制,证明其能在不牺牲正常场景下预测精度的前提下,有效且低成本地提升多种轨迹预测模型在自动驾驶场景中对对抗攻击的鲁棒性。
ReTabSyn 是一种基于强化学习的表格数据合成框架,它通过优化条件分布 而非全联合分布,在小样本、类别不平衡及分布偏移等场景下显著提升了合成数据的下游任务效用。
针对数据稀缺的 NPU 内核合成领域,本文提出了名为 EvoKernel 的自进化智能体框架,通过基于价值的记忆检索机制实现从冷启动草稿到持续优化的自动化流程,显著提升了大模型在特定硬件生态中的代码正确率与执行效率。
本文提出了模型,通过实时统计检验动态融合通用价值模型先验与稀疏采样经验均值,在极低方差下构建鲁棒优势基线,从而在数学推理任务中显著超越 GRPO 和 DAPO 并实现更快的收敛。
本文介绍了一个名为 6ABOS 的开源 Python 框架,该框架基于 6S 辐射传输模型并结合 Google Earth Engine 动态大气参数检索,实现了 EnMAP 高光谱影像的自动化大气校正,并在不同营养状态的地表水体中验证了其高精度反演水体离水反射率的能力。