Bilevel Layer-Positioning LoRA for Real Image Dehazing
该论文提出了一种名为 BiLaLoRA 的无监督真实图像去雾方法,通过利用 CLIP 构建语义对齐损失函数来指导去雾过程,并结合双层层位 LoRA 策略自动搜索并微调关键网络层,从而在无需参考图像的情况下显著提升了模型在复杂真实场景中的适应能力。
3447 篇论文
该论文提出了一种名为 BiLaLoRA 的无监督真实图像去雾方法,通过利用 CLIP 构建语义对齐损失函数来指导去雾过程,并结合双层层位 LoRA 策略自动搜索并微调关键网络层,从而在无需参考图像的情况下显著提升了模型在复杂真实场景中的适应能力。
该论文提出了一种将强化学习与模型预测控制(MPC)相结合的接触显式分层架构,通过高层智能体学习非周期性步态来减轻 MPC 的接触时序计算负担,并在多种机器人平台上成功实现了无需域随机化的零样本仿真到现实迁移。
本文介绍了 VoxCare 系统,该系统利用可穿戴设备在实时不存储原始音频的前提下,通过提取声学特征和语音基础模型指导的框架,对医院医护人员的自然沟通行为进行量化分析,从而揭示沟通模式与工作压力及负荷之间的关系,为优化医疗交付提供数据支持。
本文提出了名为 S2D 的新颖流程,通过结合高效的一步扩散模型修复稀疏点云图像伪影,并设计具有随机采样丢弃和加权梯度的重建策略,实现了仅需极少输入视图即可生成高质量、3D 一致的 3D 高斯泼溅(3DGS)重建。
该论文通过形式化权威 DNS 响应选择机制,证明了其语义受限于 DNS 协议约束而具有有界性,并构建了一个基于可观察上下文和有限候选集的正常形式框架,从而为异构权威 DNS 系统的等价性、表达能力及语义组合提供了基于协议语义的统一定理基础。
该论文分析了卷积神经网络架构对模型精度的影响,并探讨了分布式训练环境中影响计算效率的关键因素,旨在为资源密集型场景下的 CNN 部署优化提供见解。
该论文提出了一种无需训练的多步推理方法,通过冻结预训练模型并迭代插值混合语音与上一轮估计值来优化目标说话人提取,同时引入联合指标优化策略以在无真实标签场景下平衡不同评估指标,从而实现可控制的提取效果。
该研究提出了一种用于口腔癌病变检测的新型 RPA 架构,通过引入单例设计模式和批处理技术,将预测时间从 0.29 秒大幅缩短至 0.06 秒,实现了比标准方法高 60 至 100 倍的效率提升。
本文提出了一种基于多模态潜在空间回放与增量特征调整机制的终身模仿学习框架,通过存储紧凑的跨模态潜在表示并约束任务嵌入的演化,在 LIBERO 基准测试中显著提升了持续策略优化能力并大幅降低了灾难性遗忘。
本文提出了一种名为 Huffman-Bucket Sketch (HBS) 的简单可合并数据结构,它通过将 HyperLogLog 寄存器分桶并利用基于强集中分布的全局霍夫曼码进行编码,在保持常数级更新时间和可合并性的同时,将空间复杂度优化至最优的 比特。
本文提出了名为 CBCTRepD 的双语口腔颌面 CBCT 报告生成系统,该系统基于大规模高质量配对数据构建,并通过临床验证证明其不仅能生成达到中级放射科医生水平的报告草稿,还能在放射科医生与 AI 协作中显著提升不同经验水平医生的诊断质量并减少漏诊。
本文提出了 STADA 框架,该框架利用时序逻辑(LTLf)规范自动生成自动驾驶代理的多样化测试场景,在显著提升覆盖率和减少模拟次数的同时,有效解决了现有方法在验证形式化安全需求时依赖人工或随机生成导致的效率与完整性不足问题。
本文研究了 2-CNF 公式的最小不可满足子集(MUS),提出了识别 2-MUS 的线性时间算法,证明了寻找特定类型 MUS 的复杂性差异(如包含一个或两个单元子句的 MUS 可在多项式时间内求解,而判断是否存在亏度为 1 的 MUS 是 NP 完全的),并给出了针对含单元子句 MUS 的增量多项式时间算法。
该论文提出了一种名为 SSL-V3 的自监督视频分类框架,通过联合无参考视频质量评估(VQA)与视频视觉 Transformer,利用对比学习机制将视频质量分数作为特征调节因子,有效解决了 VQA 标签稀缺问题并显著提升了在模糊视频等场景下的分类性能。
本文提出了 Med-DualLoRA,一种面向 3D 心脏 MRI 疾病检测的客户端感知参数高效联邦微调框架,通过解耦全局共享与本地低秩适应模块,在保护数据隐私的同时显著提升了多中心异构场景下的模型性能并降低了通信开销。
该论文提出了名为 VCR 的鲁棒低光照增强框架,通过包含基于方差引导特征过滤的通道自适应调整(CAA)模块和色彩分布对齐(CDA)模块,有效解决了现有方法中亮度与色彩通道不一致及分布错位的问题,从而在多个基准数据集上实现了超越现有技术的状态。
本报告总结了 2024 年 9 月在匹兹堡举行的 NSF 医疗应用算法 - 硬件协同设计研讨会,该会议汇聚跨学科专家探讨了四大核心主题,并呼吁通过持续投资共享基础设施、开发临床工作流感知系统及建立可扩展验证生态等战略举措,推动下一代医疗技术的根本性变革与安全转化。
该论文提出了一种结合低层笛卡尔阻抗控制与高层强化学习的自适应力控制框架,使机器人能够根据感知反馈动态调整末端执行器的接触力,从而在仿真和真实环境中高效完成针对异质材料的刮取任务,其性能比固定力基线平均提升了 10.9%。
本文提出了 PPGuide,一种轻量级的基于分类器的框架,它利用自监督的多实例学习自动识别导致成功或失败的观测 - 动作片段来训练性能预测器,并在推理阶段通过实时梯度引导预训练的扩散策略避开失败模式,从而在无需昂贵世界模型或额外专家数据的情况下显著提升机器人操作任务的成功率。
该论文提出了一种针对无环连接查询的泊松采样算法,通过构建随机访问索引和探测机制,在无需完全物化连接结果的情况下实现了近乎实例最优的高效采样,并证明该方法在列式存储中不仅显著优于传统重采样算法,还能作为统一基础高效支持经典无环连接处理。