Transforming Agency. On the mode of existence of Large Language Models
この論文は、具身的な心の理論に基づき、大規模言語モデル(LLM)が自律的な主体性を欠く「対話者」または「言語自動機」に過ぎないと結論づけつつも、その人間との結合が従来の補助的・拡張的枠組みを超えた新たな「中間的」主体性を生み出す可能性を論じています。
7103 件の論文
この論文は、具身的な心の理論に基づき、大規模言語モデル(LLM)が自律的な主体性を欠く「対話者」または「言語自動機」に過ぎないと結論づけつつも、その人間との結合が従来の補助的・拡張的枠組みを超えた新たな「中間的」主体性を生み出す可能性を論じています。
本論文は、パラメータ効率型微調整(PEFT)における汎化性能の向上と事前学習モデルの知識保持を両立させるため、アダプタ学習特徴への乗法的ノイズ付加による一貫性正則化を導入した「PACE」という手法を提案し、理論的・実験的にその有効性を示しています。
本論文は、UAV 映像における背景ノイズの影響を排除し、物体中心の未来予測とマスク付きオートエンコーディングを統合した自己教師あり事前学習手法「FALCON」を提案し、UAV 行動認識タスクにおいて既存の教師あり手法を凌ぐ精度と推論速度を実現したことを報告しています。
本論文は、追加データなしで地震波データの不規則な欠損を高精度に復元するよう、自己整合性学習戦略と軽量ネットワークを組み合わせた効率的な自己教師あり手法を提案し、公開データセットによる検証でその有効性を示しています。
この論文は、生成速度と制御性の課題を解決し、細かな制御とリアルタイム推論を可能にする拡散トランスフォーマーに基づく新しい話者合成フレームワーク「Ditto」を提案し、AI アシスタントなどの双方向アプリケーションに不可欠な性能を実現したことを示しています。
本論文は、カーネルフリーの二次曲面サポートベクターマシン(QSVM)の過学習と解釈性の課題を解決するため、モデルパラメータの基数制約(正則化)を導入した疎な変種を提案し、ル・張の最適性条件を満たす解を導出する効率的なペナルティ分解アルゴリズムを開発するとともに、その収束性を理論的に保証し、ベンチマークおよび実世界の信用スコアリングデータセットにおける有効性を実証したものである。
この論文は、大規模言語モデルが科学文献の検索からアイデア生成、実験、コンテンツ作成、マルチモーダルな図表の作成、そして査読に至るまで、科学者の研究ライフサイクル全体を支援する新たなエコシステムを包括的に調査し、手法や評価、倫理的課題を概説するものである。
本論文は、断片レベルの離散フローマッチングと階層的なオートエンコーダを組み合わせて大規模な化学空間を効率的に探索する分子生成フレームワーク「FragFM」を提案し、天然物生成ベンチマーク「NPGen」を含む多様な評価を通じて、原子レベルの手法よりも優れた物性制御能力と拡張性を示しています。
この論文は、非微分可能なコンポーネント間の相互作用やシステム全体の選好をコンポーネントレベルに変換できないという課題に対処するため、Compound AI システムを有向非巡回グラフとしてモデル化し、システム全体の選好に直接対応する新しいアライメント手法「SysDPO」を提案するものです。
本論文は、NISQ 時代の量子分類器において、回路切断や量子もつれ転送を標的とした敵対的摂動が中間層への敵対的ゲート実装と密接に関連していることを理論的・実験的に示し、分割された量子分類器の敵対的ロバスト性を検証するものである。
本論文は、ベクトル量子化変分オートエンコーダ(VQ-VAE)を用いてデータから意味のあるパターンを抽出し、希少かつ価値の高いサンプルの優先度を高める「文脈認識型優先サンプリング(CAPS)」を提案することで、模倣学習におけるデータ効率と自動運転モデルの汎化性能を向上させる手法を CARLA シミュレータ上で実証したものである。
本論文は、時系列予測における事前学習済み大規模言語モデル(LLM)の実効性を検証するため、バイアスの少ないトークナイザーとデトークナイザーを用いた制御実験を行い、LLM のバックボーン自体の予測能力は限定的であり、大規模時系列データで訓練された専用モデルに一貫して勝ることはできないという結論を導き出しています。
この論文は、成人を対象とした AI 生成の非同意性画像(ディープフェイクポルノ)を容易に作成可能にする「悪意ある技術生態系」の存在を指摘し、NIST の報告書に基づく現在のガバナンス手法がその生態系を効果的に規制できていないことと、その背景にある誤った前提を明らかにする survivor-centered(生存者中心)のアプローチを採った研究です。
本論文は、分散機械学習のパラダイムである連合学習のアーキテクチャ、ライフサイクル、非 IID データや通信オーバーヘッドといった技術的課題、プライバシー保護技術、および将来の研究方向性を含む包括的な概要を提供する調査論文である。
本論文は、ボルツマン方程式の非線形衝突演算子を効率的に近似し、解像度に依存しない学習やゼロショット超解像を可能にする「FourierSpecNet」と呼ばれる、フーリエスペクトル法と深層学習を融合させた新しいハイブリッド枠組みを提案し、その精度と計算コストの削減効果を検証したものである。
LHCb 実験環境を想定し、多様な粒子衝突関係を表現する異種グラフニューラルネットワークとグラフ剪定層を統合したマルチタスク学習アプローチを提案することで、ビーズハドロン再構成の性能向上と複雑な事象に対する推論時間のスケーラビリティを両立させた。
この論文は、報酬モデルを推論タスクとして再定義し、高品質な推論チェーンの蒸留と検証可能な報酬による強化学習を通じて、より解釈性が高く高性能な「推論型報酬モデル(ReasRMs)」の一種である RM-R1 を提案し、既存の巨大モデルやプロプライエタリモデルを上回る性能を実証したものである。
本論文は、非有界な領域における線形方程式の解法としてエントロピー鏡像降下法を適用し、Polyak 型ステップサイズを導入して収束解析を可能にするとともに、ノルムにおける暗黙的バイアスの強化や一般凸関数への拡張、指数計算を回避する代替手法の提案など、理論的な成果を多数得ている。
本論文は、イベントカメラの非同期かつスパースなデータを言語モデルの技術(線形アテンションや自己教師あり学習)を応用して処理する新しいフレームワーク「EVA」を提案し、従来の手法を凌駕する認識・検出タスクでの性能向上を実現したことを報告しています。
本論文は、環境・社会・ガバナンス(ESG)およびサステナビリティ分野における大規模言語モデル(LLM)の能力を評価・強化するための包括的なベンチマーク「ESGenius」を提案し、専門家の検証を受けた 1,136 問の質問と 231 件の基礎文書からなるコーパスを用いた評価により、ゼロショット設定では限界があるものの、信頼性の高い情報源に基づく検索拡張生成(RAG)手法を適用することでモデルの性能が大幅に向上することを示しています。