R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment
该论文针对现有计算机图形图像质量评估缺乏系统描述和文本解释的问题,构建了一个包含 3500 张图像及多维质量描述的新数据集,并提出了基于检索增强生成的双流框架(R4-CGQA),显著提升了视觉语言模型在细粒度 CG 质量评估中的准确性与解释能力。
85 篇论文
该论文针对现有计算机图形图像质量评估缺乏系统描述和文本解释的问题,构建了一个包含 3500 张图像及多维质量描述的新数据集,并提出了基于检索增强生成的双流框架(R4-CGQA),显著提升了视觉语言模型在细粒度 CG 质量评估中的准确性与解释能力。
该论文提出了一种名为“轨迹感知记忆生成”的新框架,通过从智能体执行轨迹中提取策略、恢复和优化等结构化经验,并利用自适应检索将其注入提示,从而显著提升智能体在复杂任务中的自我改进能力与目标完成率。
本文提出了名为 ExBI 的新型系统,通过引入基于超图的数据模型、支持动态模式演化的算子以及具有理论保证的采样算法,有效解决了传统商业智能系统在探索性分析中面临的计算瓶颈与静态架构限制,在 LDBC 数据集上实现了远超 Neo4j 和 MySQL 的查询加速效果(平均 16.21 倍至 46.67 倍),同时保持了极高的分析精度(COUNT 平均误差仅 0.27%)。
本文提出了 EvoSchema 基准,通过引入涵盖十种列级和表级扰动的新颖模式演化分类法,系统评估并提升了文本转 SQL 模型在真实世界数据库模式动态变化下的鲁棒性。
本文介绍了 Pneuma-Seeker 系统,该系统通过“关系具体化”机制将用户模糊的信息需求迭代转化为共享的关系模式,并利用 LLM 智能体架构在异构数据上发现源数据并生成可执行程序,从而有效解决了大模型在处理未明确定义意图时的脆弱性问题,显著提升了答案准确性与系统的可解释性。
本文提出了一种基于压缩树结构的广义数据超立方表示法,并构建了集成特征提取系统,以高效处理地球科学中不规则、稀疏及分支的复杂数据集,从而弥补了传统数据立方模型在表达复杂数据空间与实现高效访问方面的不足。
该论文提出了一种针对无环连接查询的泊松采样算法,通过构建随机访问索引和探测机制,在无需完全物化连接结果的情况下实现了近乎实例最优的高效采样,并证明该方法在列式存储中不仅显著优于传统重采样算法,还能作为统一基础高效支持经典无环连接处理。
本文提出了 HCT-QA 基准,这是一个包含真实与合成人类中心表格及海量问答对的大规模数据集,旨在解决现有方法难以处理复杂表格布局及缺乏自然语言查询评估标准的问题,并验证了微调模型在该任务上的显著性能提升。
本文提出了 KramaBench,一个包含 104 个真实数据湖挑战的基准测试,旨在评估 AI 系统在端到端数据洞察流程中的能力,研究发现尽管现有大模型能识别部分任务,但在生成可运行的完整端到端管道方面表现仍十分有限。
该论文指出传统 Text-to-SQL 指标无法评估大规模数据场景下的成本与性能开销,因此提出了针对“文本转大数据 SQL"的新评估体系,并通过实验证明现有指标在大规模数据下存在不足,而新指标能更准确地反映执行效率、成本及数据规模的影响。
本文提出了 SLER 系统,通过结合标准化模板枚举与学习排序技术,有效解决了查询重写规则发现中的搜索空间爆炸与冗余问题,成功构建了包含超百万条规则且可扩展至复杂查询场景的史上最大实证验证重写规则库。
本文提出了一种用于构建和增量维护企业知识图谱中关系数据到 RDF 视图(RDB2RDF)的物化数据图的正式框架,并介绍了相应的架构与算法,以解决传统关系数据在语义层中的集成与实时更新问题。
该论文提出了 NGDBench,这是一个涵盖五个领域、支持完整 Cypher 查询语言并引入现实噪声与动态操作的首个统一基准,旨在评估并揭示当前大语言模型与 RAG 方法在处理结构化图数据时存在的推理、鲁棒性及精度局限。
本文探讨了人工智能时代人类 - 数据交互、探索与可视化所面临的挑战(如非结构化数据、基础模型带来的不确定性及现有交互范式局限),并提出了通过重新定义人机角色、超越传统效率指标以及融合认知与设计原则来构建面向交互式数据分析的人本 AI 系统的未来研究方向。
本文针对内存受限的嵌入式闪存设备,开发并评估了多种 B 树变体,实验表明即使是最小型设备也能实现高效的 B 树索引,且存储特定优化能带来显著的性能提升。
本文提出了一种针对数据源与用户存在利益冲突场景的查询形式化框架,通过设计高效算法来检测偏见、判断信息可提取性并重构查询,从而在偏袒性数据源中有效获取相关信息。
本文提出了 OMEGA,一种仅需在 K=1 上训练即可通过动态细化机制高效处理多 K 值向量搜索的通用模型,在显著降低预处理成本的同时实现了比现有最先进方法更低的延迟和同等召回率。
本文针对户外广告中标签分配问题,形式化了 NP 难的“标签特定后悔最小化”(TRMOA)模型,证明了其不可近似性,并提出了结合公平性意识的轮询贪婪、随机贪婪及局部搜索等算法,利用真实数据验证了这些方法在满足预算与影响力需求的同时有效降低总后悔值。
本文针对结构健康监测领域数据稀缺的挑战,提出并开源了一个包含环境变异、损伤、噪声及传感器故障等真实场景模拟数据的数值基准,旨在为验证新型数据驱动及混合方法提供可复现、高质量的资源。
本文针对数据库优化器长期存在的严重低估问题,提出了首个基于轻量级统计信息的可证明连接大小下界理论框架 xBound,通过在 Microsoft Fabric 数据仓库中修正低估并显著提升查询性能,论证了建立下界保障对生产系统的紧迫性与巨大价值。