Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

本論文は、視点を問わない部分観測条件下での頑健な把持を実現するため、自然言語指示に基づき視覚言語モデルと点雲補完技術を活用して安全な把持動作を生成するエンドツーエンドのパイプラインを提案し、実ロボットによる実験で既存手法を大幅に上回る成功率を達成したことを報告しています。

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

この論文は、生物学的な睡眠と記憶の再活性化に着想を得た「睡眠リプレイ統合(SRC)」という手法を提案し、教師あり再学習なしに人工ニューラルネットワークの過信問題を解決し、信頼性の高い確率推定を実現することを示しています。

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

本論文は、観光・ホスピタリティ分野における意思決定支援に焦点を当て、画像から得られる有用な情報を定量化する「情報性(Informativeness)」という新たな枠組みを提案し、これに基づいて構築された専用データセットを用いた評価により、最先端の視覚言語モデルがドメイン固有の微調整を経て初めて信頼性の高い意思決定支援が可能になることを明らかにしています。

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

本論文は、自律走行におけるエンドツーエンドの性能向上を目指し、従来のペアワイズ類似度ではなくマルチモーダル類似度テンソルとテンソル損失を導入することで、テキスト・画像・点雲を統一的な埋め込み空間に同時に整列させる「Contrastive Tensor Pre-training (CTP)」フレームワークを提案するものである。

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

この論文は、粒子フィルタリング(特に逐次モンテカルロ法)の理論的枠組みを用いて、言語モデル推論における並列サンプリング手法の精度とコストのトレードオフを厳密に分析し、その理論的限界と実証的な知見を明らかにしています。

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

本論文は、産業・医療・航空など多様な領域における微妙な視覚的差異の識別を評価する新たなベンチマーク「VLM-SubtleBench」を提案し、既存の VLM が人間のレベルに達するまでには、属性や状態などの細かな違いに対する推論能力において依然として大きな課題が残っていることを明らかにしています。

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

この論文は、多様な農家の事情に合わせた意思決定を支援するため、AI 気象予測モデルと「変化する農家の期待」を反映した統計モデルを融合させた確率的なモンスーン予報システムを開発し、2025 年にインドの 3800 万人の農家に展開して効果を実証したことを報告しています。

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

本論文は、LLM エージェントと RAG、およびツールチェインを統合した「LeJOT-AutoML」フレームワークを提案し、Databricks 環境におけるジョブ実行時間の予測精度向上と特徴量エンジニアリングの自動化を実現することで、クラウドコストを約 19% 削減することを示しています。

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

本論文は、モンテカルロドロップアウト、変分フィードフォワード層、および確率的アテンションという 3 つの不確実性メカニズムを統合したベイズ変換器(BT)を提案し、極端な気象条件下でも優れた較正と不確実性推定を実現することで、スマートグリッドの確率的負荷予測において最先端の性能を達成したことを報告しています。

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

この論文は、大規模なナビゲーターと軽量なドライバーを分離することで、推論能力と運動計画の両立、学習コストの削減、そして解釈性の向上を実現し、nuScenes ベンチマークで既存の VLM ベースラインを上回る自律運転フレームワーク「NaviDriveVLM」を提案しています。

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

本論文は、実体型ビジョン・言語・アクション(VLA)モデルの推論オーバーヘッドを削減するため、時間的ダイナミクスに敏感なビット幅の動的割り当てを行う新しい量子化フレームワーク「DyQ-VLA」を提案し、メモリ使用量を約 30.9% に削減しながら性能を 99.5% 維持し、シミュレーションおよび実世界での高速化を実現したことを報告しています。

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

本論文は、リレーショナルデータベースにおける不均衡データ問題に初めて着目し、関係性ごとのゲート制御と関係性ガイドの少数派合成を用いて不均衡なエンティティ分類を改善する深層学習手法「Rel-MOSS」を提案し、既存手法を上回る性能を実証したものである。

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

この論文は、ソースとターゲットのダイナミクスに関するサイド情報(特徴モーメントの境界、分布距離、密度比など)を制約付き推定に統合して不確実性集合を構築するフレームワークを提案し、環境の大きなシフト下でも過度に保守的にならない頑健な転移学習を実現し、サンプル効率と目標ドメインでの性能を向上させることを示しています。

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

この論文は、医療機関における部門間データ共有の課題を解決し、HIPAA などの規制を遵守しながら統計的開示を未然に防ぐため、SQL メトリクスの構文と意味的特徴を CodeBERT と XGBoost を用いて分析し、事前実行段階でリスクスコアと説明可能な警告を生成する AI 駆動型のガバナンスフレームワークを提案するものである。

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

この論文は、台風やパンデミックなどの大規模社会イベント下での人間移動を生成する際、既存の手法が抱えるイベント注釈付きデータセットの欠如と習慣的パターンとイベント制約の競合を解決するため、初めてイベント注釈付きデータセットを構築し、Fuzzy-Trace 理論に基づく自己整合型 LLM フレームワーク「ELLMob」を提案するものです。

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG