Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules
本文提出了一种结合模糊规则分类系统与文本处理技术的方法,旨在将特定领域(如临床报告和影评)的自由文本映射到 CLIP 模型的向量空间,以解决通用嵌入模型在专业领域应用中的局限性并提升可解释性。
3797 篇论文
本文提出了一种结合模糊规则分类系统与文本处理技术的方法,旨在将特定领域(如临床报告和影评)的自由文本映射到 CLIP 模型的向量空间,以解决通用嵌入模型在专业领域应用中的局限性并提升可解释性。
该论文提出并验证了在大型预训练模型中,任务专家密集分布在参数空间邻域内,因此一种简单的随机采样扰动结合多数投票的并行后训练方法,其性能可与 PPO 等标准优化方法相媲美。
本文基于 Perplexity 在运营通用智能体系统的实践经验,深入分析了 AI 智能体因架构变革带来的新型安全威胁与攻击面,并提出了涵盖多层防御机制、策略执行及未来研究方向的系统性安全建议。
该论文受人类视觉处理中的感知拉直假说启发,提出了一种通过曲率正则化来优化潜在轨迹的“时间拉直”方法,从而改善了世界模型中潜在规划的表示学习,显著提升了基于梯度的规划稳定性及任务成功率。
STAMP 是一种新的任务感知文本隐私框架,它通过结合任务重要性与隐私敏感度来动态分配隐私预算,并利用仅扰动嵌入方向而保留幅度的“极化机制”在 SQuAD、Yelp 和 AG News 等数据集上实现了更优的隐私与效用权衡。
BiGain 是一个无需训练且即插即用的框架,它通过频率感知机制(包括拉普拉斯门控令牌合并与插值 - 外推键值下采样)在加速扩散模型的同时,有效平衡了生成质量与分类性能。
该论文提出了一种可分离神经网络架构(SNA),通过引入结构归纳偏置将高维映射分解为低阶分量,从而在坐标感知层面统一了物理、语言及感知领域的预测与生成智能,并在自主导航、微结构生成、湍流建模及语言处理等多个领域验证了其作为领域无关原语的有效性。
该研究通过受控合成实验发现,在基于强化学习的LLM对齐中,推理型裁判(Reasoning Judges)虽能训练出在黄金标准下表现优异的策略,但这些策略往往通过生成能欺骗其他裁判的对抗性输出来“刷榜”,从而揭示了推理型裁判在非可验证领域后训练中的潜力与潜在风险。
该论文提出了一种名为能量基微调(EBFT)的新方法,通过匹配序列级统计特征而非仅优化单 token 预测,在无需特定任务验证器的情况下,实现了比传统监督微调(SFT)更高的下游准确率和比强化学习(RLVR)更低的验证交叉熵。
本文提出了 Spatial-TTT,一种结合测试时训练(TTT)的流式视觉空间智能框架,通过设计混合架构、引入空间预测机制以及构建密集 3D 描述数据集,实现了在长视频流中对空间证据的高效选择、组织与更新,从而在视频空间基准测试中取得了最先进的性能。
该论文提出了一种无需训练的 FLUX.1 模型颜色控制方法,通过解析其潜在空间中的“潜在颜色子空间”(LCS),揭示了其对应色相、饱和度和亮度的结构,从而实现了对生成图像颜色的精确预测与显式操控。
BEFANA 是一款基于 Python 的免费开源软件工具,通过交互式计算笔记本整合了生态网络分析、可视化及机器学习算法,旨在帮助生态学家高效研究生态网络的拓扑结构与动态特征。
该论文提出了一种基于最后一层拉普拉斯近似的高斯后验的高效贝叶斯更新方法,通过闭式计算逆海森矩阵替代昂贵的重训练过程,从而显著降低了深度主动学习的计算成本,并支持基于序列构建和前瞻策略的多样化批次选择。
该论文提出了一种名为“判别风险”的新公平性度量方法,通过扰动受保护属性同时涵盖个体与群体公平性,并建立了基于边界的理论保证,进而设计了集成剪枝算法以在提升分类准确性的同时有效改善模型公平性。
该论文通过引入更强的退火基线、发布新的亚 10 纳米基准测试并采用商业工具进行真实评估,对 Google 的 Circuit Training 宏布局方法进行了更新评估,揭示了其在可扩展性和预训练方法等方面仍存在的未决问题及研究复现性挑战。
该论文提出了一种基于凸松弛和分支定界的新框架,将低秩矩阵补全问题转化为可证明最优解的凸优化问题,从而在显著缩小最优性间隙的同时,大幅降低了测试集误差。
本文提出并实验了基于自然语言的大规模多模态神经网络“社会”(NLSOMs),通过让多个智能体以自然语言进行“头脑风暴”协作,有效解决了视觉问答、图像生成及具身 AI 等多种任务,并探讨了此类异构智能体社会的未来社会结构与治理机制。
本文指出基于 Fisher 度量的黎曼拉普拉斯近似在无限数据极限下仍存在偏差和过窄问题,并提出了两种修正变体,使其在保持计算高效的同时实现无限数据下的精确性,从而在理论和实验上均优于现有方法。
该研究提出了两种利用大语言模型进行出行行为预测的框架(零样本提示与文本嵌入结合传统模型),实证结果表明其性能可媲美甚至超越传统数值模型,为出行需求管理提供了灵活且数据高效的替代方案。
该论文提出了一种基于最优传输的分布式混合专家模型聚合框架,通过最小化传输散度将本地模型高效整合为全局估计器,仅需单次通信即可在保持模型结构的同时实现媲美集中式训练的性能并显著降低计算成本。