EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

本文提出了基于日本十年财报构建的开源基准 EDINET-Bench,用于评估大语言模型在欺诈检测等复杂金融任务上的表现,研究发现当前最先进的模型在该领域仅略优于传统逻辑回归,表明单纯提供报告文本不足以解决问题,亟需引入更贴近专业场景的推理支持框架。

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

本文提出了名为 FMint-SDE 的多模态基础模型,该模型基于解码器 Transformer 架构,通过利用数值和文本模态学习通用误差校正方案,仅需训练一次即可实现对随机微分方程(SDE)的高效、高精度模拟,从而在分子动力学、金融等多个领域超越了传统求解器在精度与效率上的权衡。

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math

FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning

本文提出了 FedEMA-Distill,一种通过结合全局模型指数移动平均与基于公共代理数据集的客户端预测 logits 集成知识蒸馏的服务器端方法,在无需修改客户端软件且支持模型异构的前提下,显著提升了联邦学习在非独立同分布数据及拜占庭攻击下的准确率、收敛速度并大幅降低了通信开销。

Hamza Reguieg, Mohamed El Kamili, Essaid Sabir2026-03-06💻 cs

Capability Thresholds and Manufacturing Topology: How Embodied Intelligence Triggers Phase Transitions in Economic Geography

本文提出“具身智能经济学”框架,论证当具身智能在灵巧度、泛化性等关键能力上跨越临界阈值时,将打破百年来以福特主义为核心的制造业地理格局,通过权重反转、批量崩溃及人机解耦等机制,彻底重构生产选址逻辑并催生由机器环境优势主导的全新经济地理形态。

Xinmin Fang, Lingfeng Tao, Zhengxiong Li2026-03-06🔬 physics

Improved accuracy of continuum surface flux models for metal additive manufacturing melt pool simulations

该研究针对激光粉末床熔融金属增材制造熔池模拟中传统连续表面通量(CSF)模型因极端温度梯度和材料属性差异导致的精度不足问题,提出了一种参数缩放的新方法,该方法通过平滑界面区域温度场显著提高了计算精度,并将满足精度要求的界面厚度限制放宽了一个数量级以上,从而大幅降低了计算成本。

Nils Much, Magdalena Schreter-Fleischhacker, Peter Munch + 3 more2026-03-05💻 cs