cs 篇论文 | Gist.Science

Implementing Random Forest Method for Healthcare Provider Fraud Detection Framework to Mitigate Financial Risk and Cost Optimization in Healthcare Management

本文提出了一种基于随机森林的机器学习框架，通过结合 SMOTE-Tomek 类平衡技术，在准确率和关键性能指标方面超越了决策树、逻辑回归、支持向量机（SVM）和朴素贝叶斯等传统模型，从而有效地检测医疗保健提供商欺诈行为并降低财务风险。

Jenny Patel2026-07-13

MSAL-YOLO: a YOLOv8-based detector for small and densely distributed object detection in UAV aerial imagery

本文提出了 MSAL-YOLO，这是一种增强型 YOLOv8 检测器，它通过集成空间-通道混合卷积模块、多分支增强坐标注意力机制以及区域自适应 Wise-IoU 损失，有效地解决了无人机航拍图像中小目标和密集分布目标的检测挑战，并在 VisDrone2019 和 DOTAv1 数据集上实现了显著的性能提升。

Fei Ding, Xiufu Du, Haining Zhang, Haibin Liu, Liguo Han2026-07-13

💻 computer science

TRAUMA: A Machine Learning–Based Record Linkage Method for Health Databases

本研究验证了 TRAUMA 方法，这是一种基于 LightGBM 的监督式机器学习记录链接方法，证明了与巴西健康数据库中传统的 CIDACS-RL 工具相比，该方法在实现高精确度和高特异性的真实匹配恢复方面具有更优越的能力。

Daniel Scaldaferri Lages, Thayna Karoline Sousa Silva, Patricia Bartholomay Oliveira, Dayan Carvalho Ramos Salles de Oli (…)2026-07-13

💻 computer science

Diamojism: Semantic-Perceptual Tile Selection for Large-Format Emoji Mosaic Rendering

本文介绍了 Diamojism，这是一种新颖的照片马赛克渲染架构，通过将语义主题评分和迭代调色板校正集成到钻石型平铺网格系统中，从而在不依赖生成模型的情况下，增强了大尺寸表情符号马赛克的主题相关性和色彩准确性。

Michael Jacobs2026-07-13

💻 computer science

An (n, n) Threshold Color QR Code-based Visual Secret Sharing Scheme for Privacy Images

本文提出了一种新颖的 (n, n) 阈值视觉秘密共享方案，该方案利用彩色二维码作为有意义的份额，通过利用色彩冗余和异或（XOR）运算，实现对隐私图像的安全加密与无损恢复。

Tao Liu, Yongjie Wang, Xuehu Yan, Yanlin Huo2026-07-13

💻 computer science

What Makes a Programming Problem Hard for a Language Model? An Empirical Study of Item Difficulty Across Code LLMs on Two Benchmarks

本文通过一项实证研究表明，代码生成基准测试中的问题难度是一个稳定的、可迁移的指标，其由 HumanEval 中的规范特征（如示例和提示词长度）以及 MBPP 中的解法复杂度所驱动，这为在模型聚合评分趋于饱和时改进基准测试、自动评分和教育工具设计提供了关键见解。

TANZIM ISLAM KHAN2026-07-13

💻 computer science

Detecting ovarian endometriomas from ultrasound using vision transformers and cross-modality transfer learning

本文提出了一种开创性的机器学习模型，该模型利用视觉 Transformer 和跨模态迁移学习从超声图像中检测卵巢内膜异位囊肿，在数据稀缺和不平衡的情况下实现了高性能，同时证明了低级特征在医学成像模态间的可迁移性。

Matthew Watson, Miliani Fraser-Fletcher, Tom Willshare, Molly Jowsey, Noura Al Moubayed2026-07-13

💻 computer science

Turbulence Is Not What You Need to Detect Hallucinations

尽管将幻觉视为大型语言模型中动力学不稳定性具有理论上的吸引力，但本文证明，静态表示在检测方面更为有效，因为添加动力学特征并不能比简单的线性探测提供具有统计学意义的改进。

Igor Itkin2026-07-13

💻 computer science

Intelligent Root Cause Analysis and Incident Diagnostics for Microsoft Fabric and Power BI through Telemetry Correlation and Kusto Query Language

本文提出了一种针对 Microsoft Fabric 和 Power BI 的智能根因分析框架，该框架利用多层遥测关联和基于 Kusto 查询语言（KQL）的推理，与传统的手动方法相比，显著提升了事件诊断的准确性和速度。

Shujath Baig Mirza2026-07-13

💻 computer science

Human–AI collaboration in deductive coding of classroom dialogue: prompt engineering and collaboration patterns

本研究采用基于设计的研究方法，旨在证明当定制化 GPT 编程助手与结构化提示词及以人为本的协作工作流相结合时，能有效支持课堂对话的演绎编码，同时强调成功的机人协作取决于提示词架构、工作流排序以及研究者对人工智能态度的动态相互作用。

Luwei Bai, Dongkeun Han, Sara Hennessy2026-07-13