HyPER-GAN: Hybrid Patch-Based Image-to-Image Translation for Real-Time Photorealism Enhancement
本文提出了一种名为 HyPER-GAN 的轻量级图像到图像翻译模型,它基于 U-Net 架构并采用混合训练策略,旨在以实时推理速度显著提升合成数据的视觉真实感与语义一致性,同时避免引入损害算法准确性的视觉伪影。
3447 篇论文
本文提出了一种名为 HyPER-GAN 的轻量级图像到图像翻译模型,它基于 U-Net 架构并采用混合训练策略,旨在以实时推理速度显著提升合成数据的视觉真实感与语义一致性,同时避免引入损害算法准确性的视觉伪影。
本文提出了 TopGen,一种通过双查询解码器同时预测结构布局与交叉场、并基于新构建的 TopGen-220K 数据集进行训练的鲁棒学习框架,旨在克服传统方法效率低及现有学习模型缺乏结构可编辑性的缺陷,从而生成高质量的四边形网格。
该论文提出了一种基于物理不可克隆函数(PUF)和符号执行技术的新型工业控制软件保护方法,确保软件仅在目标硬件上正确运行,并在非目标环境或 PUF 响应异常时通过符号执行保障安全属性,同时具备抵御逆向工程的能力。
本文提出了名为 Touch G.O.G.的单臂双手机器人布料操作框架,通过结合新型触觉夹持器设计、基于视觉基础模型的感知网络以及高保真合成数据生成器,实现了仅用单机械臂即可高效、精确地完成复杂布料展开任务。
本文提出了 AdaClearGrasp 框架,通过结合预训练视觉语言模型进行自适应清理决策与强化学习策略,实现了在密集杂乱环境中对多样化物体的零样本鲁棒灵巧抓取,并引入了首个分级复杂度仿真基准 Clutter-Bench 来验证其有效性。
本文总结了在 JISBD 2025 上举办的首届 QuantumX 专题研讨会,该活动汇聚了西班牙顶尖研究团队,探讨了软件工程原则在量子计算领域的应用,促进了社区协作,并系统梳理了量子软件工程的研究主题、开放挑战及未来发展方向。
本文提出了名为 ExBI 的新型系统,通过引入基于超图的数据模型、支持动态模式演化的算子以及具有理论保证的采样算法,有效解决了传统商业智能系统在探索性分析中面临的计算瓶颈与静态架构限制,在 LDBC 数据集上实现了远超 Neo4j 和 MySQL 的查询加速效果(平均 16.21 倍至 46.67 倍),同时保持了极高的分析精度(COUNT 平均误差仅 0.27%)。
本文提出了一种利用 FP8 矩阵乘累加单元实现 Ozaki-II 方案的新方法,以在新兴 GPU 架构上高效模拟双精度矩阵乘法,克服了该方案无法直接适配 FP8 的局限并显著减少了所需的矩阵乘法次数。
Q-StaR 是一种针对片上网络(NoC)的准静态路由方案,它通过分析拓扑和流量分布提取长期负载趋势,并据此引导 BiDOR 在运行时进行路径选择,从而在保持简单性和可预测性的同时显著提升了负载均衡性能。
该论文提出了 Splat2Real 框架,利用 3D 高斯泼溅(3DGS)生成可扩展的新视角数据,并通过引入结合几何增益与外推惩罚的 CN-Coverage 课程学习策略,有效解决了物理 AI 在单目 RGB 到 3D 感知任务中因视角偏移导致的性能不稳定问题,显著提升了模型在未见视角下的鲁棒性。
该论文提出了一种在强亚线性内存可扩展 MPC 模型中,仅用 轮即可完成基于子图密度的图定向与顶点着色的算法,成功打破了此前 轮复杂度的理论瓶颈。
该论文提出了一种基于大语言模型和多智能体技术的 ESG 报告生命周期管理框架,通过自动化执行识别、测量、报告、参与和改进等阶段,将传统的静态 ESG 报告流程转化为动态、可问责且自适应的可持续发展治理系统。
本文提出了名为 SLiM 的解码器无关掩码建模框架,通过结合对比学习与语义管状掩码策略,在消除计算冗余的同时实现了骨骼动作表征学习的效率与性能双重突破。
该论文利用 NeuCo-Bench 对地球观测基础模型(GeoFMs)的嵌入设计进行了系统分析,揭示了骨干架构、预训练策略及聚合方式等关键选择对下游任务性能的影响,并证明了通过特定设计可将原始数据压缩为 500 倍以上的紧凑嵌入,同时保持广泛的下游任务适用性。
本文介绍了一种基于 STM32 微控制器、超声波传感器和伺服电机的低成本自动感应垃圾桶系统,该系统通过非接触式检测实现自动开盖与垃圾满溢监测,并辅以 OLED 实时状态显示,旨在为各类环境提供卫生便捷的废弃物处理方案。
该论文指出终端之所以成为人机协作中最有效的工具,是因为其天然具备表征兼容性、操作透明性和低门槛三大设计属性,并主张任何面向智能代理的交互模态都应刻意借鉴这些属性,而非将终端视为过时的遗留产物。
该论文针对现有基于智能体的推荐系统过度以用户为中心而忽视物品与平台利益的局限,提出了首个协调用户效用、物品曝光与平台公平性的三方大模型推荐框架(TriRec),通过赋予物品个性化自我推广能力及平台多目标重排序机制,在提升推荐准确率的同时显著改善了公平性与长尾物品表现,打破了传统上准确性与公平性必然权衡的假设。
该论文提出了名为 Cybo-Waiter 的人形机器人框架,通过将视觉语言模型规划转化为可验证的任务程序,并结合多物体 3D 几何监督与闭环反馈机制,实现了在部分可观测环境下具备高鲁棒性的长程人形全身移动与操作任务执行。
该论文提出了一种基于项目的 AI 集成敏捷教育平台,作为介于受控研究与真实行业之间的协作研究环境,旨在通过迭代结构、质量门禁及利益相关者参与,高效生成具有可复用背景的实践相关证据,以解决敏捷开发研究中理论滞后与转化困难的问题。
本文是 2026 年 4 月 15 日在西班牙巴塞罗那举行的首届 CHI 研讨会"CHIdeology"的论文集,旨在通过意识形态视角梳理人机交互领域中碎片化的政治、价值观与想象。