cs.AI 件の論文 | Gist.Science

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

この論文は、グループ公平性と個人公平性の両方を表現する新たな指標「discriminative risk」を提案し、マージン依存の理論的保証に基づいてアンサンブル組み合わせによる公平性の向上と、精度と公平性の両立を実現するアンサンブル剪定手法を導出するものである。

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

この論文は、Google Brain の深層強化学習を用いたマクロ配置手法（Circuit Training）について、より強力なシミュレーテッド・アニーリング手法や商用ツールを用いた真の報酬評価、および新しいナノメートル級ベンチマークを通じて再評価を行い、再現性やスケーラビリティに関する未解決の課題を浮き彫りにしています。

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

本論文は、大規模言語モデルや他のニューラルネットワークを自然言語で対話させる「マインドストーム」を通じて単一モデルの限界を克服する「自然言語ベースの社会の心（NLSOM）」の概念を提唱し、その実証実験と、将来的な大規模異種エージェント社会の構造や経済原理に関する新たな研究課題を議論しています。

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Large Language Models for Travel Behavior Prediction

この論文は、ゼロショットプロンプティングと LLM 生成テキスト埋め込みの 2 つの枠組みを用いて大規模言語モデル（LLM）を交通行動予測に応用し、従来の統計モデルや機械学習モデルと同等かそれ以上の性能を達成できることを実証しています。

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

この論文は、分散環境で個別に学習されたミクスチャ・オブ・エキスパート（MoE）モデルを、標準的な平均化ではなく最適輸送に基づく枠組みで効率的に集約し、通信コストを最小化しながら中央集権的な訓練と同等の性能を実現する手法を提案しています。

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

この論文は、認知的関与や勤勉性が低い学習者向けにAI駆動のヒント説明を個人化することで、その説明への関与度、理解度、学習効果を向上させることを実証研究により示し、教育分野におけるパーソナライズされた説明可能AI（PXAI）の価値を裏付けています。

Vedant Bahel, Harshinee Sriram, Cristina Conati2026-03-12🤖 cs.AI

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

本論文は、大規模言語モデルの構造化プルーニングにおいて、微細粒度と粗粒度の重み重要度評価を適応的に融合する「HyWIA」手法を提案し、既存手法を上回る性能を達成することを示しています。

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Modelling Language using Large Language Models

この論文は、言語を認知的な能力だけでなく社会的な実体としても捉えるべきだと主張し、大規模言語モデルを公共言語の科学的モデルとして位置づけることで、それらが言語学的洞察をもたらすことを論理的に擁護しています。

Jumbly Grindrod2026-03-12💬 cs.CL

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

この研究は、28 年間の監視データを用いた説明可能な機械学習（ランダムフォレスト）により、アドリア海（トリエステ湾）におけるムラサキガイの DSP 中毒発生を予測し、Dinophysis 属の種や塩分・河川流量・降水量などの主要な予測因子を特定することで、早期警戒システムの改善と持続可能な養殖の実現に貢献しました。

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

この論文は、大規模言語モデル（LLM）を活用して探索を行い、標準的なプログラミング言語で記述された解釈可能な制御方策を自動生成する手法を提案し、振り子の振り上げやボールとカップなどのタスクにおける複雑な振る舞いの制御を実現することを示しています。

Carlo Bosio, Mark W. Mueller2026-03-12⚡ eess

EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

この論文は、LLM の圧縮による精度低下を微調整なしで補正し、精度と計算コストのバランスを柔軟に調整可能にする新規手法「EoRA」を提案し、3 ビット圧縮された LLaMA3-8B において大幅な精度向上と推論速度の改善を実現したことを報告しています。

Shih-Yang Liu, Maksim Khadkevich, Nai Chit Fung, Charbel Sakr, Chao-Han Huck Yang, Chien-Yi Wang, Saurav Muralidharan, Hongxu Yin, Kwang-Ting Cheng, Jan Kautz, Yu-Chiang Frank Wang, Pavlo Molchanov, Min-Hung Chen2026-03-12💬 cs.CL

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

この論文は、LLM の教師あり微調整（SFT）において、サンプル全体のフィルタリングではなく、タスクに寄与しないトークンを特定して除去する「トークンクリーニング」パイプラインを提案し、下流タスクの性能向上を実証しています。

Jinlong Pang, Na Di, Zhaowei Zhu, Jiaheng Wei, Hao Cheng, Chen Qian, Yang Liu2026-03-12💬 cs.CL

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

この論文は、拡散モデルに基づく組み合わせ最適化ソルバーが追加学習なしで問題規模や問題種類（TSP から PCTSP や OP など）にわたる汎化性能を向上させるため、推論時の適応フレームワーク「DIFU-Ada」を提案し、その理論的基盤と有効性を示したものである。

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Talking like Piping and Instrumentation Diagrams (P&IDs)

この論文は、DEXPI データモデルをラベル付きプロパティグラフに変換し、グラフベースの検索拡張生成（Graph-RAG）を介して大規模言語モデル（LLM）と統合することで、パイプラインおよび計器図（P&ID）を自然言語で対話可能にする手法を提案しています。

Achmad Anggawirya Alimin, Dominik P. Goldstein, Lukas Schulze Balhorn + 1 more2026-03-12🤖 cs.AI

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

本論文は、マルチモーダル基盤モデルのタイポグラフィ攻撃に対する脆弱性を評価するための大規模で多様な実世界データセット「SCAM」を構築・公開し、モデルのアーキテクチャや学習データが攻撃への耐性に与える影響を実証的に分析したものです。

Justus Westerhoff, Erblina Purelku, Jakob Hackstein + 4 more2026-03-12🤖 cs.AI

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

この論文は、需要の欠測（センサリング）と依存性を伴うオフラインデータを用いて、在庫管理と価格設定の最適方針を学習する新たなデータ駆動型アルゴリズムを提案し、その有効性を理論的および数値的に検証するものである。

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

この論文は、タスク間干渉を抑制し、固定されたスイッチング間隔に依存しない適応的なタスクスイッチング方策を採用することで、リソース制約のある自律エージェントの効率的かつスケーラブルな多タスク学習を実現する新しい手法「SwitchMT」を提案し、その有効性をアタリゲームでの実験結果を通じて実証しています。

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

← 前へ次へ →

cs.AI