StarWhisper Telescope: An AI framework for automating end-to-end astronomical observations

大規模望遠鏡アレイの運用ボトルネックを解消するため、大規模言語モデルを活用して観測計画からデータ処理、追跡観測までを自動化する AI フレームワーク「StarWhisper Telescope」が開発され、既存の巡天観測と比較して迅速な天体変光の検出を実現し、将来の大規模観測網における自律運用の青写真として機能している。

Cunshi Wang, Yu Zhang, Yuyang Li + 25 more2026-03-04🔭 astro-ph

Evaluating Spoken Language as a Biomarker for Automated Screening of Cognitive Impairment

この論文は、説明可能な機械学習を用いて言語特徴を分析し、アルツハイマー型認知症などのスクリーニングおよび重症度予測に有効であることを示すとともに、家庭での会話技術との統合による早期発見とトリアージの可能性を提唱しています。

Maria R. Lima, Alexander Capstick, Fatemeh Geranmayeh + 4 more2026-03-04💬 cs.CL

Hallucination, Monofacts, and Miscalibration: An Empirical Investigation

この論文は、n-gram モデルやトランスフォーマーを用いた実証研究を通じて、単一事実率とモデルの較正誤差がハルシネーションの統計的下限を決定することを示し、訓練データの 5% 程度を戦略的に再重み付けする「選択的重み付け」手法により、精度を維持したままハルシネーションを最大 40% 削減できることを発見した。

Miranda Muqing Miao, Michael Kearns2026-03-04🤖 cs.AI

Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment

LoRA の性能限界を克服するため、SVD 構造を備えた混合専門家(MoE)による適応的な事前知識の統合と、理論的なスケーリング因子を用いた最適化の整合化を実現する新フレームワーク「GOAT」を提案し、フル微調整に匹敵する性能を達成したことを示す論文です。

Chenghao Fan, Zhenyi Lu, Sichen Liu + 4 more2026-03-04💬 cs.CL

SEM-CTRL\texttt{SEM-CTRL}: Semantically Controlled Decoding

この論文は、回答セット文法を用いて構文・意味制約を LLM のデコーダに直接統合し、ファインチューニング不要で任意のモデルが構造的・意味的に正しい出力を生成可能にする「SEM-CTRL」という手法を提案し、小規模モデルでも大規模モデルや最先端の推論モデルを上回る性能と妥当性を保証できることを実証しています。

Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo2026-03-04🤖 cs.AI

LINGOLY-TOO: Disentangling Reasoning from Knowledge with Templatised Orthographic Obfuscation

本論文は、言語学オリンピックの問題に専門的な文字列置換を施して知識や暗記に依存しないよう工夫した新しいベンチマーク「LINGOLY-TOO」を提案し、これにより大規模言語モデルの推論能力を知識の蓄積から分離してより正確に評価できることを示しています。

Jude Khouja, Lingyi Yang, Karolina Korgul + 6 more2026-03-04🤖 cs.AI

BioChemInsight: An Online Platform for Automated Extraction of Chemical Structures and Activity Data from Patents

この論文は、特許から化学構造と生物活性データを自動的に抽出するオープンソースプラットフォーム「BioChemInsight」を開発し、既存の ChEMBL データベースでは不足している化学空間を補完することで、創薬研究の効率化とデータ駆動型分析の促進を実現したことを報告しています。

Zhe Wang, Fangtian Fu, Wei Zhang + 10 more2026-03-04🧬 q-bio

Adaptive Social Learning via Mode Policy Optimization for Language Agents

本論文は、認知制御理論に基づく階層的推論モードと文脈認識型のモード適応アルゴリズム「AMPO」を導入した適応型社会学習フレームワーク「ASL」を提案し、GPT-4o を上回るタスク性能を達成しつつ、GRPO と比較して思考連鎖を大幅に短縮しながら推論の深さを動的に調整する言語エージェントの実現を示しています。

Minzheng Wang, Yongbin Li, Haobo Wang + 6 more2026-03-04🤖 cs.AI

Talk to Your Slides: High-Efficiency Slide Editing via Language-Driven Structured Data Manipulation

本論文は、マルチモーダル LLM に基づく GUI ベースのアプローチの計算コストや遅延の課題を克服し、スライドの内部オブジェクトモデルを言語駆動で操作する「Talk-to-Your-Slides」を提案し、テキスト中心や書式設定タスクにおいて処理速度、指示忠実度、コスト面で大幅な改善を実現するとともに、TSBench という新規ベンチマークを公開したことを述べています。

Kyudan Jung, Hojun Cho, Jooyeol Yun + 3 more2026-03-04💬 cs.CL

REFLEX: Metacognitive Reasoning for Reflective Zero-Shot Robotic Planning with Large Language Models

本論文は、メタ認知的学習(自己分解と自己反省)を大規模言語モデルに統合した「REFLEX」フレームワークを提案し、これによりロボットが最小限のデモンストレーションから失敗を振り返り創造的な解決策を導き出すことで、ゼロショットまたは数ショット環境における複雑なタスク遂行能力を大幅に向上させることを実証しています。

Wenjie Lin, Jin Wei-Kocsis, Jiansong Zhang + 4 more2026-03-04💬 cs.CL

BitBypass: A New Direction in Jailbreaking Aligned Large Language Models with Bitstream Camouflage

本論文は、データの連続的なビット表現をハフネ区切りのビットストリーム迷彩として悪用する新たなブラックボックス脱獄攻撃「BitBypass」を提案し、GPT-4o や Claude 3.5 などの最先端 LLM の安全性アライメントを回避して有害コンテンツを生成させる能力を実証するとともに、既存の攻撃手法よりも隠蔽性と成功率において優れていることを示しています。

Kalyan Nakka, Nitesh Saxena2026-03-04💬 cs.CL

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

本論文は、STEM 分野に偏重した既存の評価基準では見落とされがちな人文社会科学(HSS)領域の多言語・学際的推論能力を評価するため、専門家と自動エージェントが協働して生成した 1 万 3000 件以上のデータセット「HSSBench」を提案し、最先端のマルチモーダル大規模言語モデルが依然としてこの分野において大きな課題に直面していることを示しています。

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI

You Only Fine-tune Once: Many-Shot In-Context Fine-Tuning for Large Language Models

本論文は、従来のインコンテキスト学習の原理を多数ショット設定に拡張し、コンテキスト内のすべての回答を教師信号として利用する新たなトレーニング手法「ManyICL」を提案することで、専用モデルの微調整に匹敵する性能を達成しつつ、カテゴリー忘却を大幅に軽減する大規模言語モデルの新しいアプローチを示しています。

Wenchong He, Liqian Peng, Zhe Jiang + 1 more2026-03-04🤖 cs.AI