Can LLM Aid in Solving Constraints with Inductive Definitions?
この論文は、構造化されたプロンプトを用いて大規模言語モデル(LLM)に帰納的定義の推論に必要な補助的な補題を生成させ、制約ソルバーと協調させるニューロ記号アプローチを提案し、その結果、SMT や CHC ソルバーの性能を約 25% 向上させて帰納的定義を含む証明タスクをより多く解決できることを示しています。
7179 件の論文
この論文は、構造化されたプロンプトを用いて大規模言語モデル(LLM)に帰納的定義の推論に必要な補助的な補題を生成させ、制約ソルバーと協調させるニューロ記号アプローチを提案し、その結果、SMT や CHC ソルバーの性能を約 25% 向上させて帰納的定義を含む証明タスクをより多く解決できることを示しています。
本論文は、顧客サポートチャットボットの回顧的日記研究と AI 専門家へのインタビューに基づき、AI 応用開発における人間関与(HITL)の課題を「AI 統治と人間の権限」「HITL による反復的改善」「AI システムライフサイクルと運用制約」「人間-AI チームの協働と調整」という 4 つのテーマに分類し、今後の HITL フレームワーク設計への実証的基盤を提供するものです。
この論文は、大規模言語モデルと描画ロボットを統合した「Companion」システムが、双方向の対話を通じて人間と機械が協働する視覚的物語創作を実現し、専門家による評価でその芸術的価値が確認されたことを報告しています。
この論文は、システマティック・レビューの非効率性と認知的負荷を軽減するため、複数の研究者を対象とした設計研究に基づき、透明性のある AI 支援と戦略的探索を可能にする統合環境「ARC」を提案し、その有効性を検証したものである。
本論文は、OpenHands の実行ログから安全な行動マクロを抽出・統合した「ゲート付き行動木(GBT)」を外部化された方策として導入し、LLM エージェントの生成制御を木構造の探索に置き換えることで、SWE-bench などのタスクにおける成功率の向上、安全性の確保、およびコスト削減を同時に実現する手法「Traversal-as-Policy」を提案しています。
本論文は、視覚言語モデルを拡張し、到達可能性の制約を微分可能な最適化プロセスに統合することで、サービスロボットや人間など多様なエージェントの物理的制約を満たすナビゲーション可能かつ実行可能な 3D 室内シーン生成を実現する「RoboLayout」を提案しています。
この論文は、NLP 研究者の視点から、化学および材料科学における AI 応用に不可欠な分子表現の主要なデジタル形式と、それらを活用した AI ベースの応用例を概説し、異分野間の研究を支援するガイドを提供するものである。
本論文は、複数の専門エンコーダやモジュール結合のオーバーヘッドを排除し、単一の密なトランスフォーマー・エンコーダ(Omni-C)を用いて画像・音声・テキストなどの異種モダリティを効率的に共有表現へ圧縮する手法を提案し、リソース制約のある環境でもスケーラブルなマルチモーダル学習を実現することを示しています。
この論文は、金融や医療など 5 つの分野にまたがり、複雑な Cypher クエリや現実的なノイズ注入を含む包括的なベンチマーク「NGDBench」を提案し、現在の LLM や RAG 手法が構造化されたグラフデータの管理において構造的推論やノイズ耐性の面で重大な限界を抱えていることを明らかにしています。
本論文は、創薬における AI ツール「Boltz-2」の大規模評価を通じて、その予測速度の利点はあるものの、構造および結合親和性の精度が物理ベースの手法に劣り、リード化合物の同定には物理ベースの手法による検証と精査が不可欠であることを示しています。
本論文は、Neural Operator の長期予測における不安定性と高周波数特徴の損失というジレンマを解決するため、局所的な物理的複雑さに応じて正則化強度を動的に調整する「JAWS」という確率的正則化戦略を提案し、メモリ効率の良い短期軌道最適化によって長期の精度と衝撃波の忠実度を向上させる手法を提示しています。
VDCook は、自然言語クエリと調整可能なパラメータに基づいてリアルタイムの動画検索と合成を自動実行し、MCP を活用して継続的に進化する専門分野向け動画データ構築プラットフォームを提供するシステムです。
本論文は、大規模な非構造化データや基盤モデルの普及に伴う不確実性やスケーラビリティの課題に直面する AI 時代における人間・データ相互作用の現状を分析し、従来の効率性指標を超えて認知・知覚・デザイン原則を統合した新しい人間中心の分析システム構築の方向性を示唆しています。
本論文は、大規模言語モデルの関数呼び出し能力を向上させるために、データベース構築、実行可能環境生成、多ターン軌道合成を自律的に協調するマルチエージェントプラットフォーム「EigenData」を提案し、BFCL-V3 ベンチマークの自動修復と結果重視の評価手法を通じて、人間の機能正しさの判断と高い相関を持つモデル評価を実現したことを報告しています。
本研究は、非線形海洋ダイナミクスを線形常微分方程式で記述する連続時間コップマンオートエンコーダ(CT-KAE)を開発し、従来の自己回帰モデルに比べて長期的な誤差増大やエネルギー漂移が抑制され、かつ数値解法に比べて桁違いに高速な推論を可能にする効率的かつ安定した海洋状態予測手法を提案しています。
この論文は、記述論理の概念をモデル(点付き解釈)に基づいて変更する「モデル変更」の問題を扱い、排除・受容・修正の 3 種類を定義し、修正が単なる排除と受容の組み合わせに還元できないことを示すとともに、EL および ALC 記述論理におけるこれらの操作の整合性に関する正負の結果を提示するものです。
生成 AI は個人のスキル格差を縮小する一方で補完的資産への集中を招くというジレンマを理論モデルで解明し、AI の技術構造や労働市場制度によって格差が縮小するか拡大するかの二つのレジームが存在することを示しつつ、その実証には既存の職業別データではなく未整備なタスクレベルのデータが必要であることを指摘しています。
本論文は、医療分野の EHR データベースにおける自然言語から SQL への翻訳課題に対し、単一ステップの検索に依存する従来の RAG の限界を克服し、論理構造と実体解決を段階的に行うケースベース推論(CBR)に基づく「CBR-to-SQL」フレームワークを提案し、MIMICSQL における最先端の精度と高いサンプル効率を実証したものである。
この論文は、ユーザーの指示と模倣学習のポリシーを基盤とし、自然言語による報酬関数の自動生成と人間のフィードバックを組み合わせて強化学習で微調整を行う「PRISM」という手法を提案し、ロボット把持タスクにおいて既存手法を上回る堅牢性とデータ効率を実現することを示しています。
既存の評価手法の限界を克服し、抽象的な要件からツールを自律的に生成・活用する言語エージェントの能力を多角的に診断する新しいベンチマーク「Tool-Genesis」を提案し、現状の最先端モデルでも初期の微小な欠陥がパイプライン全体で増幅され性能が急激に低下することを明らかにしました。