cs.CL 件の論文 | Gist.Science

StarWhisper Telescope: An AI framework for automating end-to-end astronomical observations

大規模望遠鏡アレイの運用ボトルネックを解消するため、大規模言語モデルを活用して観測計画からデータ処理、追跡観測までを自動化する AI フレームワーク「StarWhisper Telescope」が開発され、既存の巡天観測と比較して迅速な天体変光の検出を実現し、将来の大規模観測網における自律運用の青写真として機能している。

Cunshi Wang, Yu Zhang, Yuyang Li + 25 more2026-03-04🔭 astro-ph

A Survey of Query Optimization in Large Language Models

本論文は、大規模言語モデル（特に RAG システム）におけるクエリ最適化の手法を包括的に調査し、QOL フレームワークとクエリ複雑性分類法を提案するとともに、主要な最適化操作や評価手法、今後の課題を体系的に整理したサーベイである。

Mingyang Song, Mao Zheng2026-03-04💬 cs.CL

Evaluating Spoken Language as a Biomarker for Automated Screening of Cognitive Impairment

この論文は、説明可能な機械学習を用いて言語特徴を分析し、アルツハイマー型認知症などのスクリーニングおよび重症度予測に有効であることを示すとともに、家庭での会話技術との統合による早期発見とトリアージの可能性を提唱しています。

Maria R. Lima, Alexander Capstick, Fatemeh Geranmayeh + 4 more2026-03-04💬 cs.CL

Hallucination, Monofacts, and Miscalibration: An Empirical Investigation

この論文は、n-gram モデルやトランスフォーマーを用いた実証研究を通じて、単一事実率とモデルの較正誤差がハルシネーションの統計的下限を決定することを示し、訓練データの 5% 程度を戦略的に再重み付けする「選択的重み付け」手法により、精度を維持したままハルシネーションを最大 40% 削減できることを発見した。

Miranda Muqing Miao, Michael Kearns2026-03-04🤖 cs.AI

Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment

LoRA の性能限界を克服するため、SVD 構造を備えた混合専門家（MoE）による適応的な事前知識の統合と、理論的なスケーリング因子を用いた最適化の整合化を実現する新フレームワーク「GOAT」を提案し、フル微調整に匹敵する性能を達成したことを示す論文です。

Chenghao Fan, Zhenyi Lu, Sichen Liu + 4 more2026-03-04💬 cs.CL

$\texttt{SEM-CTRL}$ : Semantically Controlled Decoding

この論文は、回答セット文法を用いて構文・意味制約を LLM のデコーダに直接統合し、ファインチューニング不要で任意のモデルが構造的・意味的に正しい出力を生成可能にする「SEM-CTRL」という手法を提案し、小規模モデルでも大規模モデルや最先端の推論モデルを上回る性能と妥当性を保証できることを実証しています。

Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo2026-03-04🤖 cs.AI

LINGOLY-TOO: Disentangling Reasoning from Knowledge with Templatised Orthographic Obfuscation

本論文は、言語学オリンピックの問題に専門的な文字列置換を施して知識や暗記に依存しないよう工夫した新しいベンチマーク「LINGOLY-TOO」を提案し、これにより大規模言語モデルの推論能力を知識の蓄積から分離してより正確に評価できることを示しています。

Jude Khouja, Lingyi Yang, Karolina Korgul + 6 more2026-03-04🤖 cs.AI

BioChemInsight: An Online Platform for Automated Extraction of Chemical Structures and Activity Data from Patents

この論文は、特許から化学構造と生物活性データを自動的に抽出するオープンソースプラットフォーム「BioChemInsight」を開発し、既存の ChEMBL データベースでは不足している化学空間を補完することで、創薬研究の効率化とデータ駆動型分析の促進を実現したことを報告しています。

Zhe Wang, Fangtian Fu, Wei Zhang + 10 more2026-03-04🧬 q-bio

Param $Δ$ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost

この論文は、ベースモデルとポストトレーニング済みモデルの重みの差分を計算して新しいベースモデルに転移する「ParamΔ」という手法を提案し、追加学習なしにゼロコストでポストトレーニング相当の能力を付与できることを示しています。

Sheng Cao, Mingrui Wu, Karthik Prasad + 2 more2026-03-04🤖 cs.AI

Adaptive Social Learning via Mode Policy Optimization for Language Agents

本論文は、認知制御理論に基づく階層的推論モードと文脈認識型のモード適応アルゴリズム「AMPO」を導入した適応型社会学習フレームワーク「ASL」を提案し、GPT-4o を上回るタスク性能を達成しつつ、GRPO と比較して思考連鎖を大幅に短縮しながら推論の深さを動的に調整する言語エージェントの実現を示しています。

Minzheng Wang, Yongbin Li, Haobo Wang + 6 more2026-03-04🤖 cs.AI

Talk to Your Slides: High-Efficiency Slide Editing via Language-Driven Structured Data Manipulation

本論文は、マルチモーダル LLM に基づく GUI ベースのアプローチの計算コストや遅延の課題を克服し、スライドの内部オブジェクトモデルを言語駆動で操作する「Talk-to-Your-Slides」を提案し、テキスト中心や書式設定タスクにおいて処理速度、指示忠実度、コスト面で大幅な改善を実現するとともに、TSBench という新規ベンチマークを公開したことを述べています。

Kyudan Jung, Hojun Cho, Jooyeol Yun + 3 more2026-03-04💬 cs.CL

Efficient Agent Training for Computer Use

312 件の人間による注釈付きデータと Claude 3.7 Sonnet による合成データの組み合わせを用いた効率的な学習フレームワーク「PC Agent-E」を提案し、WindowsAgentArena-V2 ベンチマークにおいて人間データのみやモデルからの直接蒸留を上回る顕著な性能向上を実現した。

Yanheng He, Jiahe Jin, Pengfei Liu2026-03-04🤖 cs.AI

REFLEX: Metacognitive Reasoning for Reflective Zero-Shot Robotic Planning with Large Language Models

本論文は、メタ認知的学習（自己分解と自己反省）を大規模言語モデルに統合した「REFLEX」フレームワークを提案し、これによりロボットが最小限のデモンストレーションから失敗を振り返り創造的な解決策を導き出すことで、ゼロショットまたは数ショット環境における複雑なタスク遂行能力を大幅に向上させることを実証しています。

Wenjie Lin, Jin Wei-Kocsis, Jiansong Zhang + 4 more2026-03-04💬 cs.CL

BitBypass: A New Direction in Jailbreaking Aligned Large Language Models with Bitstream Camouflage

本論文は、データの連続的なビット表現をハフネ区切りのビットストリーム迷彩として悪用する新たなブラックボックス脱獄攻撃「BitBypass」を提案し、GPT-4o や Claude 3.5 などの最先端 LLM の安全性アライメントを回避して有害コンテンツを生成させる能力を実証するとともに、既存の攻撃手法よりも隠蔽性と成功率において優れていることを示しています。

Kalyan Nakka, Nitesh Saxena2026-03-04💬 cs.CL

DiaBlo: Diagonal Blocks Are Sufficient For Finetuning

DiaBlo は、低ランク分解や補助的な初期化を不要とし、モデル重み行列の対角ブロックのみを更新することで、LoRA と同等のメモリ効率と訓練速度を維持しつつ、フルモデル微調整に匹敵する性能を達成するパラメータ効率型微調整手法です。

Selcuk Gurses, Aozhong Zhang, Yanxia Deng + 5 more2026-03-04🤖 cs.AI

Go-Browse: Training Web Agents with Structured Exploration

本論文は、ウェブ環境の構造化探索を通じて大規模なエージェントデータを自動収集する手法「Go-Browse」を提案し、これにより 7B パラメータモデルが WebArena ベンチマークで GPT-4o mini を上回る性能を達成したことを示しています。

Apurva Gandhi, Graham Neubig2026-03-04💬 cs.CL

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

本論文は、STEM 分野に偏重した既存の評価基準では見落とされがちな人文社会科学（HSS）領域の多言語・学際的推論能力を評価するため、専門家と自動エージェントが協働して生成した 1 万 3000 件以上のデータセット「HSSBench」を提案し、最先端のマルチモーダル大規模言語モデルが依然としてこの分野において大きな課題に直面していることを示しています。

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI

Search Arena: Analyzing Search-Augmented LLMs

この論文は、検索拡張型 LLM の評価を目的とした大規模な人間評価データセット「Search Arena」を公開し、引用数や情報源の種類がユーザーの信頼性判断に与える影響、および検索機能の導入がモデル性能に及ぼす効果を実証的に分析したものである。

Mihran Miroyan, Tsung-Han Wu, Logan King + 8 more2026-03-04💬 cs.CL

You Only Fine-tune Once: Many-Shot In-Context Fine-Tuning for Large Language Models

本論文は、従来のインコンテキスト学習の原理を多数ショット設定に拡張し、コンテキスト内のすべての回答を教師信号として利用する新たなトレーニング手法「ManyICL」を提案することで、専用モデルの微調整に匹敵する性能を達成しつつ、カテゴリー忘却を大幅に軽減する大規模言語モデルの新しいアプローチを示しています。

Wenchong He, Liqian Peng, Zhe Jiang + 1 more2026-03-04🤖 cs.AI

LLM Probability Concentration: How Alignment Shrinks the Generative Horizon

本論文は、新しい指標「分岐因子（BF）」を用いて、LLM のアライメントが生成の多様性を著しく低下させ、より確定的な軌道へとモデルを誘導するメカニズムを解明し、これが複雑な推論における安定性向上や、ベースモデルの制御にも応用可能であることを示しています。

Chenghao Yang, Sida Li, Ari Holtzman2026-03-04🤖 cs.AI

← 前へ次へ →

cs.CL