cs.CL 件の論文 | Gist.Science

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

本論文は、画像とテキストの埋め込みを意味情報とモダリティ情報に制約付きで分解し、分布サンプリングによってモダリティギャップを埋めることで、真のセマンティクスを整合させる新しいクロスモーダルアライメント手法「CDDS」を提案し、既存の最先端手法を大幅に上回る性能を達成したことを報告しています。

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

本論文は、医療分野の EHR データベースにおける自然言語から SQL への翻訳課題に対し、単一ステップの検索に依存する従来の RAG の限界を克服し、論理構造と実体解決を段階的に行うケースベース推論（CBR）に基づく「CBR-to-SQL」フレームワークを提案し、MIMICSQL における最先端の精度と高いサンプル効率を実証したものである。

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI は、曲率やスタイル特徴などの 17 の解釈可能な特徴量を XGBoost で統合し、SHAP と LLM を用いて自然言語による説明を生成する、機械生成テキストの検出およびその根拠提示を可能にする説明可能なフレームワークです。

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

この論文は、Chain-of-Thought（CoT）プロンプトが推論プロセスや出力において個人情報（PII）の漏洩リスクを増大させることを示し、11 種類の PII タイプとリスク階層に基づいたモデル非依存のフレームワークを用いて漏洩を定量化・評価するとともに、多様な軽量な推論時ゲートキーピング手法の比較を通じて、利便性とリスクのバランスを取るためのハイブリッドなポリシーの必要性を提言しています。

Patrick Ahrend, Tobias Eder, Xiyang Yang, Zhiyi Pan, Georg Groh2026-03-09💬 cs.CL

RACAS: Controlling Diverse Robots With a Single Agentic System

この論文は、自然言語のみで通信する複数の LLM/VLM モジュールからなる「RACAS」という自律制御アーキテクチャを提案し、車輪型ロボット、多関節アーム、水中ドローンなど、全く異なる形態のロボットに対してソースコードやモデルの再学習なしに高レベルの自律タスクを遂行可能にしたことを報告しています。

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

この論文は、r/AmITheAsshole の事例を用いた大規模実験により、大規模言語モデルの道徳的判断が物語の視点やプロンプトの構成といった提示形式に強く依存し、本質的な道徳的実質よりも提示の仕方で結果が左右される脆弱性を示したことを明らかにしています。

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation

FreeTxt-Vi は、プログラミング知識を必要とせずベトナム語と英語のテキストを分割、感情分析、要約できるオープンソースの Web ツールであり、ハイブリッドなセグメンテーション戦略と微調整された NLP モデルを統合することで、既存の手法と比べて競争力のある性能を実現し、ベトナム語の NLP 研究における技術的障壁を低減します。

Hung Nguyen Huy, Mo El-Haj, Dawn Knight, Paul Rayson2026-03-09💬 cs.CL

Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning

この論文は、大規模言語モデルと進化アルゴリズムを組み合わせる自律フレームワーク「Ptychi-Evolve」を提案し、これにより従来の手法を上回る高品質なptychography再構成を実現する新規正則化アルゴリズムを自動発見・進化させることを示しています。

Xiangyu Yin, Ming Du, Junjing Deng, Zhi Yang, Yimo Han, Yi Jiang2026-03-09🤖 cs.AI

Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis

本論文は、RGB ベンチマークを用いてノイズ耐性や情報統合などの 4 つのシナリオで LLM を評価し、従来の RAG ベースラインと比較して知識グラフベースの GraphRAG のカスタマイズが堅牢性を向上させることを示しています。

Hazem Amamou, Stéphane Gagnon, Alan Davoust, Anderson R. Avila2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

この論文は、欧米・アジア・アフリカなど世界各地の大規模調査に基づき、生成 AI における文化の定義や表現に関する多様な認識を分析し、参加型アプローチや地理を超えた文化次元の優先、文化的な「レッドライン」への配慮を含む開発提言を導き出しています。

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Structured Multidimensional Representation Learning for Large Language Models

本論文は、3 階テンソルに基づく L-積を用いて埋め込み空間を構造化されたスペクトル分解し、エンコーダのパラメータを大幅に削減しながらも標準的なトランスフォーマーの性能を維持する「L-Transformer」を提案し、その理論的同等性と実証的な有効性を示したものである。

Alaa El Ichi, Khalide Jbilou, Mohamed El Guide, Franck Dufrenois2026-03-09💬 cs.CL

Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní

この論文は、パラグアイのグアラニ語を事例として、AI が口語文化や先住民のデータ主権を尊重するためには、テキスト中心の設計から会話のやり取りや修復、共有文脈を第一級要件とする「口語優先」のマルチエージェント・アーキテクチャへ転換する必要があると主張しています。

Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala2026-03-09💬 cs.CL

CodeScout: Contextual Problem Statement Enhancement for Software Agents

underspecified な問題文をコードベースの事前探索を通じて文脈を補完し、明確化することで、ソフトウェアエージェントの解決成功率を 20% 向上させる「CodeScout」というアプローチを提案した。

Manan Suri, Xiangci Li, Mehdi Shojaie, Songyang Han, Chao-Chun Hsu, Shweta Garg, Aniket Anand Deshmukh, Varun Kumar2026-03-09💬 cs.CL

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

この論文は、コードリポジトリの README ファイルから実装レベルの研究アーティファクトを抽出するための新しい命名実体認識データセット「NERdME」を提案し、大規模言語モデルや微調整済みトランスフォーマーによる基線実験および下流のエンティティリンク実験を通じて、学術論文とは異なる実装レベルの情報の価値と、研究アーティファクトの発見・メタデータ統合への応用可能性を実証しています。

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

この論文は、患者が生成したテキストから構造化された患者の声（生活経験や社会的要因など）を抽出するためのベンチマーク「PVminer」と、それを用いた教師あり微調整大規模言語モデル「PVminerLLM」を提案し、小規模モデルでも高い精度で非臨床的な健康要因を大規模に分析可能であることを示しています。

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

この論文は、認知科学や学習科学などの研究を統合し、専門家のコード化を通じて洗練された「チューター・ムーブ分類体系」を提案し、個別指導の対話を構造化して大規模な分析や AI による注釈付けを可能にする枠組みを確立したものである。

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

この論文は、AI エージェントの安全性対策が虚偽で広告されていないことを検証可能にするため、信頼実行環境（TEE）を用いて特定のオープンソースガードルールの実行を暗号的に証明する「Proof-of-Guardrail」というシステムを提案し、その実装と評価、および悪意ある開発者によるガードルールの回避という新たなリスクについても論じています。

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

この論文は、推論グラフ内のタスクの難易度に応じてモデルを動的に割り当てる「RouteGoT」を提案し、精度を維持または向上させながらトークン使用量を大幅に削減し、コストと精度の最適なトレードオフを実現する手法を提示しています。

Yuhang Liu, Ruijie Wang, Yunlong Chu, Bing Hao, Yumeng Lin, Shengzhong Liu, Minglai Shao2026-03-09💬 cs.CL

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

本論文は、大規模言語モデルのハルシネーションをスパンレベルで局所化し、その生成メカニズムを特定するとともに外部証拠を因果的に追跡する新しいフレームワーク「HART」と、その評価に特化した構造化データセットを提案し、既存の検索ベース手法を上回る性能を実証したものである。

Shize Liang, Hongzhi Wang2026-03-09💬 cs.CL

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

この論文は、推論時にモデルパラメータを更新せずに大規模言語モデルの行動を修正する「テスト時適応」手法として、多数の例示を用いたプロンプト（Many-Shot Prompting）の有効性、限界、および課題を体系的に検証し、構造化タスクでは有効だが生成タスクでは選択戦略に敏感であり、動的・強化型 ICL などの代替戦略の必要性を明らかにした研究です。

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

← 前へ次へ →