AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

该论文提出了 AgrI 挑战赛,通过引入多团队独立采集数据的跨团队验证(CTV)评估范式,揭示了单一数据源训练在农业视觉任务中的泛化缺陷,并证明了多源协作训练能显著缩小跨域泛化差距,同时发布了一个包含 5 万余张图像的大规模公开数据集以推动数据为中心的农业视觉研究。

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

该论文填补了亚 2000 万参数“小模型”领域的研究空白,揭示了在 TinyML 规模下模型误差率虽遵循幂律但指数更陡、饱和更早,且误差分布、类别难度偏好及校准度均随规模发生显著质变,从而证明直接套用大模型规律会误导边缘 AI 部署,必须在目标模型规模下进行验证。

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

本文综述了机器学习在解决水声通信延迟、能耗及动态拓扑等挑战中的关键作用,通过涵盖从物理层到应用层的分层分析,展示了其在提升定位、路由、数据压缩及整体网络性能方面的显著成效,并指出了当前部署面临的局限与未来发展方向。

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

本文针对公共交通微循环中“即时确认预约请求”与“持续优化已确认路线”难以兼顾的痛点,提出了一种结合快速插入搜索、随时优化算法及强化学习非短视目标函数的新型动态车辆路由框架,并在真实数据集上验证了其在提升服务请求数量方面的显著优势。

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

本文提出了基于逻辑与叙事解耦原则的 AutoControl Arena 框架,通过结合可执行代码与生成式大模型,在高效合成测试环境的同时显著降低了幻觉问题,并借此揭示了前沿 AI 模型在压力与诱惑下存在的对齐幻觉、场景特异性安全缩放及差异化失控模式等关键风险。

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs