Paralinguistic Emotion-Aware Validation Timing Detection in Japanese Empathetic Spoken Dialogue
该研究提出了一种无需文本上下文、融合副语言信息与情感识别的自监督学习模型,用于检测日语共情对话中的情感验证时机,并在实验证明其显著优于传统语音基线,为构建更具共情能力的人机交互系统提供了纯语音驱动的新路径。
3478 篇论文
该研究提出了一种无需文本上下文、融合副语言信息与情感识别的自监督学习模型,用于检测日语共情对话中的情感验证时机,并在实验证明其显著优于传统语音基线,为构建更具共情能力的人机交互系统提供了纯语音驱动的新路径。
本文提出了一种基于 RISC-V 可信执行环境(TEE)的外部熵供应方案,通过建立受信任的服务器为资源受限的物联网设备提供加密级随机数,从而解决其熵源不足的安全难题。
本文提出了名为 IntroSVG 的生成框架,通过构建一个兼具生成与批判双重角色的统一视觉语言模型,利用监督微调、直接偏好优化以及“生成 - 审查 - 优化”的迭代闭环机制,将渲染后的视觉反馈融入训练过程,从而显著提升了文本到矢量图形(SVG)生成的质量、语义对齐度及可编辑性。
本文提出了 NLiPsCalib 框架,通过结合可控近场光源与近场光度立体视觉技术,仅需少量日常物体接触即可高效校准弯曲视觉触觉传感器,从而显著降低高保真 3D 重建的门槛并提升其重建精度。
该论文提出了名为 OddGridBench 的可控基准以评估多模态大模型对细微视觉差异的敏感度,发现现有模型表现远逊于人类,并进一步通过引入课程学习与距离感知奖励的 OddGrid-GRPO 强化学习框架显著提升了模型的细粒度视觉判别能力。
该研究通过部署涵盖各类非法主题的蜜罐洋葱网站并监测其引流效果,发现人类用户主要源自 Ahmia 搜索引擎,且儿童性虐待(CSAM)主题的站点互动率显著高于其他类别,同时英语版本比多语言版本更受青睐。
本文提出并验证了一种面向 ESP32 微控制器的动态精度数学引擎,通过集成 Q16.16 定点核心、CORDIC 三角函数模块及缓存感知矩阵乘法内核,实现了在运行时灵活切换定点与浮点执行路径,从而在保持精度的同时将三角函数运算速度提升了 18.5 至 24.7 倍。
该研究通过提示工程、多模型交叉验证及专家评估,证实了 ChatGPT 虽能在一定程度上生成逼真的合成系统需求规格说明书,但仍存在矛盾与缺陷,且其自动质量评估无法完全替代专家人工评审。
本文提出了一种名为预测谱校准(PSC)的无源测试时适应框架,通过扩展子空间对齐至块谱匹配,在无需源数据的情况下有效提升了图像回归模型在分布偏移下的性能。
这篇发表于 ICDE 2026 的教程论文全面综述了人工智能与向量搜索相互促进的“良性循环”,深入探讨了 AI 如何优化向量搜索流程、向量搜索如何通过检索增强生成(RAG)赋能大语言模型,以及两者端到端协同优化的策略、挑战与未来机遇。
本文提出了一种基于潜在空间迭代优化的鲁棒且可证明安全的图像隐写框架,该方法通过接收端迭代优化潜在变量来显著提升消息提取在压缩等处理下的准确率,同时保持可证明安全性并具备作为独立模块增强其他方案的通用性。
本文提出了 ProvAgent 框架,通过结合传统模型的高效初筛、基于图对比学习的细粒度身份 - 行为一致性绑定以及多智能体协作的自主调查机制,有效解决了高级持续性威胁(APT)检测中专家依赖与警报疲劳的矛盾,实现了低成本、高精度的攻击过程重构。
本文提出了一种名为 EPPINN 的框架,通过结合证据深度学习与物理信息建模,在无需贝叶斯采样或集成推理的情况下实现了对急性缺血性卒中 CT 灌注成像中物理约束违反的不确定性量化,从而在提升参数估计精度的同时显著增强了临床诊断的可靠性。
SinGeo 提出了一种无需额外模块或显式变换的简单框架,通过双判别学习架构和首创的课程学习策略,使单一模型能够克服现有方法在未见视角和方向上的局限性,实现了在多种条件下的鲁棒跨视角地理定位并取得了最先进性能。
该论文明确给出了在任意固定有限完备基下,真值表单点扰动导致电路规模变化不超过 的构造性上界,并通过 telescoping 论证将其推广至一般汉明距离,同时利用 SAT 求解器在 时对 AIG 基的穷举验证确认了该上界的紧性。
该论文提出了名为 PixelConfig 的差分分析框架,通过逆向工程揭示了 Meta Pixel 在健康类网站等场景中默认启用高比例的活动与身份追踪功能,且即便启用了限制追踪的配置,其实际保护效果也极为有限。
本文提出了 EventVGGT 框架,通过将事件流建模为连贯视频序列,并首创从视觉几何基础模型(VGGT)中蒸馏时空与多视图几何先验的三级策略,有效解决了现有无监督事件深度估计方法因忽略时间连续性而导致的预测不一致问题,显著提升了深度估计精度与泛化能力。
本文提出了一种名为 MIDAS 的免训练扩散模型框架,通过随机基机制和潜在向量融合技术,实现了具备用户特定访问控制功能的无载体多图像隐写,在保障图像质量与多样性的同时显著提升了抗隐写分析能力和访问控制安全性。
本文提出了 GeoBenchr,这是一个开源的应用导向基准测试套件,旨在通过涵盖多样化数据集、查询类型及真实场景工作负载,对时空数据库平台进行全面的性能评估与比较。
该论文提出了一种结合视觉注意力先验与迭代神经修正的自主赛车系统辨识框架,通过利用轻量级 CNN 从路面纹理生成摩擦先验以解决冷启动问题,并采用 S4 模型捕捉高频动态残差,显著提升了非线性轮胎动力学参数辨识的精度与收敛速度。