Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

本論文は、観光・ホスピタリティ分野における意思決定支援に焦点を当て、画像から得られる有用な情報を定量化する「情報性(Informativeness)」という新たな枠組みを提案し、これに基づいて構築された専用データセットを用いた評価により、最先端の視覚言語モデルがドメイン固有の微調整を経て初めて信頼性の高い意思決定支援が可能になることを明らかにしています。

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

本論文は、自律走行におけるエンドツーエンドの性能向上を目指し、従来のペアワイズ類似度ではなくマルチモーダル類似度テンソルとテンソル損失を導入することで、テキスト・画像・点雲を統一的な埋め込み空間に同時に整列させる「Contrastive Tensor Pre-training (CTP)」フレームワークを提案するものである。

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

この論文は、粒子フィルタリング(特に逐次モンテカルロ法)の理論的枠組みを用いて、言語モデル推論における並列サンプリング手法の精度とコストのトレードオフを厳密に分析し、その理論的限界と実証的な知見を明らかにしています。

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

本論文は、産業・医療・航空など多様な領域における微妙な視覚的差異の識別を評価する新たなベンチマーク「VLM-SubtleBench」を提案し、既存の VLM が人間のレベルに達するまでには、属性や状態などの細かな違いに対する推論能力において依然として大きな課題が残っていることを明らかにしています。

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

この論文は、多様な農家の事情に合わせた意思決定を支援するため、AI 気象予測モデルと「変化する農家の期待」を反映した統計モデルを融合させた確率的なモンスーン予報システムを開発し、2025 年にインドの 3800 万人の農家に展開して効果を実証したことを報告しています。

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

本論文は、LLM エージェントと RAG、およびツールチェインを統合した「LeJOT-AutoML」フレームワークを提案し、Databricks 環境におけるジョブ実行時間の予測精度向上と特徴量エンジニアリングの自動化を実現することで、クラウドコストを約 19% 削減することを示しています。

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

本論文は、モンテカルロドロップアウト、変分フィードフォワード層、および確率的アテンションという 3 つの不確実性メカニズムを統合したベイズ変換器(BT)を提案し、極端な気象条件下でも優れた較正と不確実性推定を実現することで、スマートグリッドの確率的負荷予測において最先端の性能を達成したことを報告しています。

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

この論文は、大規模なナビゲーターと軽量なドライバーを分離することで、推論能力と運動計画の両立、学習コストの削減、そして解釈性の向上を実現し、nuScenes ベンチマークで既存の VLM ベースラインを上回る自律運転フレームワーク「NaviDriveVLM」を提案しています。

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

本論文は、実体型ビジョン・言語・アクション(VLA)モデルの推論オーバーヘッドを削減するため、時間的ダイナミクスに敏感なビット幅の動的割り当てを行う新しい量子化フレームワーク「DyQ-VLA」を提案し、メモリ使用量を約 30.9% に削減しながら性能を 99.5% 維持し、シミュレーションおよび実世界での高速化を実現したことを報告しています。

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

本論文は、リレーショナルデータベースにおける不均衡データ問題に初めて着目し、関係性ごとのゲート制御と関係性ガイドの少数派合成を用いて不均衡なエンティティ分類を改善する深層学習手法「Rel-MOSS」を提案し、既存手法を上回る性能を実証したものである。

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

この論文は、ソースとターゲットのダイナミクスに関するサイド情報(特徴モーメントの境界、分布距離、密度比など)を制約付き推定に統合して不確実性集合を構築するフレームワークを提案し、環境の大きなシフト下でも過度に保守的にならない頑健な転移学習を実現し、サンプル効率と目標ドメインでの性能を向上させることを示しています。

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

この論文は、医療機関における部門間データ共有の課題を解決し、HIPAA などの規制を遵守しながら統計的開示を未然に防ぐため、SQL メトリクスの構文と意味的特徴を CodeBERT と XGBoost を用いて分析し、事前実行段階でリスクスコアと説明可能な警告を生成する AI 駆動型のガバナンスフレームワークを提案するものである。

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

この論文は、台風やパンデミックなどの大規模社会イベント下での人間移動を生成する際、既存の手法が抱えるイベント注釈付きデータセットの欠如と習慣的パターンとイベント制約の競合を解決するため、初めてイベント注釈付きデータセットを構築し、Fuzzy-Trace 理論に基づく自己整合型 LLM フレームワーク「ELLMob」を提案するものです。

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

本論文は、混合専門家(MoE)および混合線形専門家(MoLE)アーキテクチャを原子間ポテンシャルに適用し、共有専門家と非線形性の組み合わせ、および元素ごとのルーティング戦略が、化学的に解釈可能な専門分化を実現しながら、OMol25、OMat24、OC20M 各ベンチマークで最先端の精度を達成することを示しています。

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

この論文は、法律や金融などの専門分野における経済的に重要なシナリオを評価し、既存のベンチマークでは捉えきれない言語エージェントの実務能力を測定するために、専門家が作成した 400 件のタスクと厳格な評価基準を備えた新しいベンチマーク「\$OneMillion-Bench」を提案しています。

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG