LiDAR Remote Sensing Meets Weak Supervision: Concepts, Methods, and Perspectives
本文从统一视角系统综述了弱监督学习在激光雷达遥感数据解译与参数反演中的应用,涵盖了多种弱监督设置与关键技术,分析了针对激光雷达特性的挑战,并展望了其与基础模型结合的未来发展方向。
3462 篇论文
本文从统一视角系统综述了弱监督学习在激光雷达遥感数据解译与参数反演中的应用,涵盖了多种弱监督设置与关键技术,分析了针对激光雷达特性的挑战,并展望了其与基础模型结合的未来发展方向。
本文通过将右作用范畴与右富集范畴的等价性从封闭对称情形推广至非封闭非对称情形,为支持高阶进程传递的并发语言 CaMPL 提供了必要的语义基础,解决了线性资源无法复用所导致的高阶定义难题。
本文针对现有异常检测基准性能饱和的问题,推出了包含 8000 多张高分辨率图像、涵盖透明物体、复杂光照及微小缺陷等更具挑战性工业场景的 MVTec AD 2 数据集,并通过评估显示现有最先进模型在该数据集上的平均 AU-PRO 表现仍低于 60%,从而为推动该领域发展提供了新的基准。
本文提出了一种基于去噪扩散概率模型(DDPM)与师生协同训练框架的半监督生物医学图像分割新方法,通过无监督预训练生成语义掩码并结合多轮伪标签迭代策略,在标注数据有限的情况下显著提升了分割性能并超越了现有最先进技术。
该论文针对现有局部 AI 生成图像检测数据集缺乏场景级编辑覆盖的局限,提出了包含 15 万张图像的大规模场景感知数据集 BR-Gen,并设计了基于噪声指纹引导的特征放大机制 NFA-ViT,通过增强异常特征与正常特征的交互显著提升了局部伪造检测的鲁棒性与泛化能力。
本文介绍了 SPDL,一个开源且框架无关的库,旨在通过完全释放 Python 全局解释器锁(GIL)来并行化数据预处理,从而显著加速 GPU 数据加载,在基准测试中相比 PyTorch DataLoader 提升了 74% 的迭代速度并降低了资源消耗,且在 Free-Threaded Python 环境下性能进一步提升了 33%。
该论文提出了名为 iTuP 的逆工具使用规划框架及其核心网络 SDG-Net,通过基于刚体力学推导任务轨迹中的预测交互力矩并优化抓取选择,有效解决了传统视觉 - 语言系统在动态工具操作中因忽略惯性冲击和杠杆效应而导致的滑移与失稳问题,显著提升了真实世界中的任务成功率。
该论文针对现有单源遥感目标检测在复杂环境下的局限性,提出了包含近百万标注实例的多分辨率、多极化、多场景、多源光学-SAR 融合数据集 M4-SAR,并配套开发了统一评测工具包及新型端到端融合检测框架 E2E-OSDet,显著提升了复杂场景下的检测精度。
本文提出了 MARRS 框架,通过结合独立编码身体与手部单元的 UD-VAE、基于随机掩码的 Action-Conditioned Fusion 以及促进单元间交互的 Adaptive Unit Modulation,利用连续表示和扩散模型实现了高质量的细粒度人类动作反应合成。
本文提出了基于扩散变换器(DiT)的 EasyText 框架,通过字符定位编码与位置编码插值技术,结合大规模多语言合成数据集,实现了高质量、可控且布局感知的多语言文本渲染。
该论文通过基于 30,000 多个真实漏洞修复补丁的实证研究,系统评估了预训练语言模型(PLMs)和大语言模型(LLMs)在七种编程语言及函数与行双粒度下的漏洞检测能力,发现经过指令微调和少样本提示优化的 GPT-4o 在检测多语言及高危漏洞方面显著优于其他模型。
本文提出了名为 SpikeSMOKE 的架构,通过引入受生物突触过滤机制启发的跨尺度门控编码(CSGC)和轻量级残差块,成功将低功耗的脉冲神经网络应用于单目 3D 目标检测,在 KITTI 等数据集上显著提升了检测精度并大幅降低了能耗与计算量。
本文提出了故障容错全支配集问题的首个 $1 + \ln(\Delta + m - 1)$ 近似算法,并针对加权部分正影响支配集问题的简单、全及连通变体证明了首个对数近似结果,其中连通情形的证明通过将有理函数扩展至分数值函数框架而实现。
该论文发布了一个涵盖 2013 至 2022 年十年间奥地利《标准报》(DerStandard)平台的大规模纵向数据集,包含超过 7500 万条评论、4 亿多张投票及丰富的元数据,通过提供匿名化标识符和预计算的向量表示而非原始文本,在严格保护用户隐私的同时,为德语在线话语的动态、网络结构及语义分析研究提供了宝贵资源。
本文介绍了 PyPitfall 研究,通过对 378,573 个 PyPI 包的依赖结构进行量化分析,揭示了 Python 软件供应链中广泛存在且易被忽视的漏洞依赖问题,旨在提升业界对 Python 供应链安全的关注。
本文提出了名为 FieldLVLM 的新框架,通过结合物理特征提取的领域感知语言生成策略与数据压缩的多模态模型微调,显著提升了大型视觉语言模型对流场等科学领域数据的理解能力。
本文提出并分析了一种用于模拟斯托克斯流与 Biot-Kirchhoff 多孔弹性板耦合的 3D-2D 模型,通过证明其连续与离散形式的适定性及最优收敛性,展示了该方法在硅纳米孔膜免疫隔离封装模拟中的应用。
本文针对具有不确定配合类型和配合量的批量化精密装配任务,提出了一种基于力 - 视觉融合控制器驱动的多任务强化学习与多教师策略蒸馏相结合的方法,成功构建并验证了能够适应不同配合状态、兼具高训练效率与优异力顺应性的鲁棒机器人装配控制策略。
该论文提出了一种基于图计算框架的确定性多项式时间算法,通过利用边重叠特性及局部不可行性修剪机制,在不显式枚举证书的情况下将 NP 问题的验证复杂度降至多项式级别,从而给出了 P=NP 的构造性证明。
本文提出了YOPO,一种单阶段、基于查询的极简检测Transformer框架,仅需单目RGB图像和类别级标签即可实现端到端的9自由度多物体姿态估计,并在多个基准测试中刷新了仅用RGB数据的性能纪录。