On the Geometric Structure of Layer Updates in Deep Language Models
この論文は、深層言語モデルにおける層ごとの更新が、支配的なトークン単位の成分と幾何学的に区別される残差成分に分解され、機能的に重要な計算が後者に集中していることを示す新しい幾何学的分析枠組みを提案しています。
原著者が当サイトのやさしい解説を確認した論文。
このページに掲載されている各論文については、少なくとも一人の原著者が当サイトのやさしい解説を確認し、内容の正確性を認めるか、または修正を依頼しその修正を私たちが反映しています。確認は各文への正式な承認を意味するものではありませんが、論文を書いた本人たちの目を通ったことを意味します。
279 件の論文を著者が確認済み · 81–90 / 279
この論文は、深層言語モデルにおける層ごとの更新が、支配的なトークン単位の成分と幾何学的に区別される残差成分に分解され、機能的に重要な計算が後者に集中していることを示す新しい幾何学的分析枠組みを提案しています。
ガイア、MWISP、LAMOST の多波長データを統合して「Snake-III」と呼ばれる蛇のような恒星構造を詳細に解析した本研究は、分子雲の密度と早期のフィードバックが星形成の進行を共同で調節し、階層的な星形成の痕跡として蛇状構造が形成されることを実証した。
本研究は、恒星の固有運動速度と位置残差の交差相関を用いて古代の星表を年代決定する「SESCC」法を提案し、そのアルマゲストへの適用結果がプトレマイオス説ではなくヒッパルコス起源を支持する証拠を示したことを報告しています。
この論文は、対称性ねじれ分配関数をテンソル再正規化群法で効率的に計算する手法を確立し、2 次元イジング模型や 3 次元 O(2) 模型などの自発的対称性の破れや BKT 転移といった臨界現象を、その分配関数のみから検出・解析することに成功したことを報告しています。
本論文は、自律意思決定の基盤となる「世界モデル」がもたらす新たな安全・セキュリティ・認知リスクを包括的に分析し、攻撃者能力の分類や新たな脅威モデルの提案、実証実験、そして航空管制や医療機器に匹敵する厳格なガバナンスと緩和策の必要性を論じています。
この論文は、量子理論を世界そのものの記述ではなく確率的な予測の指針として捉えるプラグマティズム的視点を採用し、測定結果や量子状態を物理的評価文脈に相対化する「相対的視点」によって測定問題と非局所性の問題を解決し、現実の測定が単一の文脈で確証されるため統計的予測が科学的に客観的であるとする立場を提示しています。
この論文は、ハミルトン・ヤコビ方程式を速度の自由度を除去したモデル縮約として捉えることで、保存系から非保存力を含む一般のニュートン力学系への拡張を可能にし、幾何光学近似を通じて散逸シュレーディンガー方程式を導出するアプローチを提案しています。
フェルミ宇宙線望遠鏡とダークエネルギーサーベイのデータを組み合わせた多トレーサー解析により、未解決ガンマ線背景放射の起源が銀河や質量分布と強く相関していることが 10.31 シグマで確立され、その性質は既知のガンマ線源の単純な外挿とは異なることが示されました。
本論文は、抗菌薬耐性(AMR)の拡散など構造的不確実性が存在する状況において、従来の固定オントロジーに基づく機械的シミュレーションの限界を克服する新たな枠組み「Procela」を提案し、その有効性を示したものである。Procela の核心は、単に既存のメカニズムの重み付けや抑制を行うことではなく、ランタイムにおいて構造的変異を可能にすることにある。具体的には、初期状態に存在しなかった新たなメカニズムの動的追加、失敗したメカニズムの削除、変数の解決方針の変更、そして因果グラフそのものを変化させる実験の実行と失敗時の自動ロールバックを実現しており、固定されたモデル群の重みを調整する従来のアンサンブル手法とは根本的に異なるアプローチである。
この論文は、LLM 駆動の科学研究における既存のインフラ課題を解決するため、XML-Regex 双経路ルーティングやランタイム状態インターセプションサンドボックス、状態駆動型動的ビューポート UI という 3 つのアーキテクチャ革新により、次世代の科学発見に向けた多モーダルな自律型研究ワークスペース「BloClaw」を提案し、化学情報学やタンパク質フォールディングなどの分野でその堅牢性を実証したものである。