RiO-DETR: DETR for Real-time Oriented Object Detection

本文提出了首个面向实时旋转目标检测的 Transformer 模型 RiO-DETR,通过内容驱动角度估计、解耦周期细化及面向旋转的密集监督等创新设计,有效解决了旋转检测中的语义依赖、角度周期性及搜索空间扩大等挑战,在多个基准数据集上实现了速度与精度的新平衡。

Zhangchi Hu, Yifan Zhao, Yansong Peng, Wenzhang Sun, Xiangchen Yin, Jie Chen, Peixi Wu, Hebei Li, Xinghao Wang, Dongsheng Jiang, Xiaoyan Sun2026-03-11💻 cs

The framework to unify all complexity dichotomy theorems for Boolean tensor networks

本文提出了一种统一所有布尔张量网络复杂性二分定理的框架,通过将未解决的计数问题按复数域上 2×2 矩阵构成的有限群分为九类,并分别利用矩阵转置闭包性质、克服涉及四元子群的实数化障碍、基于猜想推进一阶循环群情形以及解决高阶循环群情形,从而致力于构建涵盖整个问题类的最大统一定理。

Mingji Xia2026-03-11💻 cs

First Steps towards Categorical Algebraic Artificial Chemistry

本文构建了一个为代数相互作用组件模型赋予动力学的函子,该构造推广了人工生命领域中基于λ演算的 AlChemy 计算模型,并探讨了利用范畴论作为组织工具来形式化代数与动力学层面之间联系的未来方向。

Joe Pratt-Johns (Edinburgh Napier University), Toby St. Clere Smithe (Kodamai Ltd), Chris Guiver (Edinburgh Napier University), Kevin Hughes (Edinburgh Napier University), Peter Andras (Edinburgh Napier University)2026-03-11💻 cs

The Patrologia Graeca Corpus: OCR, Annotation, and Open Release of Noisy Nineteenth-Century Polytonic Greek Editions

本文介绍了 Patrologia Graeca 语料库,这是首个针对十九世纪复杂双语排版及退化多音调希腊文版《希腊教父集》的大规模开放 OCR 与语言学资源,通过专用流水线实现了极低错误率的文本识别,并提供了约六百万个标注词元,为古典希腊语研究及未来大语言模型训练确立了新的基准。

Chahan Vidal-Gorène (CJM, LIPN), Bastien Kindt2026-03-11💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

本文提出了 StyleVLA,一种基于 Qwen3-VL-4B 的驾驶风格感知视觉语言动作模型,通过引入物理约束混合损失和构建大规模多风格指令数据集,实现了在轨迹可行性、风格适应性及综合驾驶表现上超越现有闭源模型及最先进 VLA 模型的自动驾驶决策能力。

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes Betz2026-03-11💻 cs

Component-Aware Sketch-to-Image Generation Using Self-Attention Encoding and Coordinate-Preserving Fusion

本文提出了一种结合自注意力编码与坐标保持融合的两阶段组件感知框架,通过自注意力自编码器、坐标保持门控融合模块及空间自适应细化修正器,在多种面部与非面部数据集上显著超越了现有生成模型,实现了高保真、语义准确且空间对齐的草图到图像生成。

Ali Zia, Muhammad Umer Ramzan, Usman Ali, Muhammad Faheem, Abdelwahed Khamis, Shahnawaz Qureshi2026-03-11💻 cs

Streaming Autoregressive Video Generation via Diagonal Distillation

本文提出了对角蒸馏(Diagonal Distillation)方法,通过采用“前期多步、后期少步”的非对称生成策略并结合隐式光流建模,有效解决了现有视频蒸馏技术在长序列生成中运动连贯性差、误差累积及延迟过高的问题,实现了在保持高质量的同时将 5 秒视频生成速度提升 277.3 倍至 31 FPS。

Jinxiu Liu, Xuanming Liu, Kangfu Mei, Yandong Wen, Ming-HsuanYang, Weiyang Liu2026-03-11💻 cs