Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

本文提出了 Omni-C,一种基于单一稠密 Transformer 编码器的统一架构,它通过大规模非对齐数据的单模态对比预训练和轻量级投影头,在无需混合专家(MoE)或配对监督的情况下,有效压缩了图像、音频和文本等异构模态,显著降低了推理内存开销并实现了与专家模型相当的性能。

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

本文提出了名为 JAWS 的基于空间自适应雅可比正则化的概率正则化策略,通过根据局部物理复杂度动态调整正则化强度,在抑制高频不稳定性与保留奇异特征梯度之间取得平衡,从而显著提升了神经算子在长时程推演中的稳定性、激波保真度及泛化能力,同时降低了训练计算成本。

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

本文探讨了人工智能时代人类 - 数据交互、探索与可视化所面临的挑战(如非结构化数据、基础模型带来的不确定性及现有交互范式局限),并提出了通过重新定义人机角色、超越传统效率指标以及融合认知与设计原则来构建面向交互式数据分析的人本 AI 系统的未来研究方向。

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

本文介绍了 EigenData,一个通过多智能体架构实现函数调用数据合成、审计与修复的自进化平台,该平台在修复 Berkeley 函数调用排行榜(BFCL-V3)基准测试的同时,引入了基于数据库状态正确性的结果感知评估协议,显著提升了模型排名与人类对功能正确性判断的相关性。

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed 🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

本文提出了一种连续时间 Koopman 自编码器(CT-KAE)作为双层准地转海洋系统的轻量级代理模型,通过将其非线性动力学投影为线性常微分方程,实现了比自回归 Transformer 基线更稳定、误差增长有界且推理速度快数个数量级的长时序海洋状态预测。

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

该论文提出了名为 CBR-to-SQL 的框架,通过借鉴基于案例的推理(CBR)思想,将问答对抽象为可复用的案例模板并采用两阶段检索机制,有效解决了医疗领域文本转 SQL 任务中传统检索增强生成(RAG)方法面临的术语噪声、可扩展性差及数据稀缺等挑战,在 MIMICSQL 数据集上实现了优于现有方法的逻辑形式准确率与鲁棒性。

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

该研究提出了一种融合 MGWR、随机森林和时空图卷积网络的 GeoAI 混合分析框架,通过实证分析揭示了土地利用与多模式交通流之间复杂的空间异质性相互作用,显著提升了预测精度并识别出五种功能各异的交通类型,为制定基于证据的多模态交通管理和土地利用政策提供了可解释的工具。

Olaf Yunus Laitinen Imanov2026-03-09🤖 cs.AI

DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces

DreamCAD 提出了一种利用可微参数曲面从点级监督直接生成可编辑 BRep 的多模态生成框架,结合新构建的百万级 CAD 描述数据集,在无需特定 CAD 标注的情况下实现了大规模训练并显著提升了文本、图像及点云到 CAD 生成的几何保真度。

Mohammad Sadil Khan, Muhammad Usama, Rolandos Alexandros Potamias, Didier Stricker, Muhammad Zeshan Afzal, Jiankang Deng, Ismail Elezi2026-03-09🤖 cs.AI

RACAS: Controlling Diverse Robots With a Single Agentic System

该论文提出了 RACAS 系统,这是一种通过自然语言交互的协作智能体架构,仅需机器人描述、动作定义和任务指令即可在不修改代码或模型权重的情况下,实现对轮式地面机器人、多关节机械臂及水下车辆等多样化平台的统一闭环控制。

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI