GaussianPile: A Unified Sparse Gaussian Splatting Framework for Slice-based Volumetric Reconstruction

GaussianPile 是一种统一的稀疏高斯泼溅框架,它通过结合切片感知堆叠策略、可微投影算子及联合优化流程,实现了针对切片式体积成像的高效压缩重建,在显著降低存储与计算成本的同时保留了高频内部细节并大幅提升了处理速度。

Di Kong, Yikai Wang, Wenjie Guo, Yifan Bu, Boya Zhang, Yuexin Duan, Xiawei Yue, Wenbiao Du, Yiman Zhong, Yuwen Chen, Cheng Ma2026-03-24💻 cs

ScaleEdit-12M: Scaling Open-Source Image Editing Data Generation via Multi-Agent Framework

该论文提出了完全开源的 ScaleEditor 多智能体框架,成功构建了迄今规模最大的开源图像编辑数据集 ScaleEdit-12M(包含 1200 万数据及 23 种任务类型),并通过微调实验证明该方法能以低成本实现媲美商业级数据的质量,显著提升统一多模态模型在各类图像编辑基准上的性能。

Guanzhou Chen, Erfei Cui, Changyao Tian, Danni Yang, Ganlin Yang, Yu Qiao, Hongsheng Li, Gen Luo, Hongjie Zhang2026-03-24💻 cs

ToFormer: Towards Large-scale Scenario Depth Completion for Lightweight ToF Camera

该论文提出了一种面向短程 ToF 相机的全栈式框架,通过构建首个大规模场景深度补全数据集(LASER-ToF)并设计融合 3D-2D 联合传播池化与多模态交叉协方差注意力的轻量化网络,有效解决了 ToF 相机在大规模场景下的测距局限,实现了高精度的深度补全与实时机器人部署。

Juncheng Chen, Tiancheng Lai, Xingpeng Wang, Bingxin Liao, Baozhe Zhang, Chao Xu, Yanjun Cao2026-03-24💻 cs

Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs

本文提出了名为 CogAlign 的新框架,通过构建分层临床认知数据集进行监督微调以对齐专家诊断逻辑,并引入基于反事实推理的强化学习策略以消除视觉偏差、确保诊断基于因果病灶特征,从而在胃肠内镜诊断中实现了最先进的性能。

Huan Zheng, Yucheng Zhou, Tianyi Yan, Dubing Chen, Hongbo Lu, Wenlong Liao, Tao He, Pai Peng, Jianbing Shen2026-03-24💬 cs.CL