FEM-Bench: A Structured Scientific Reasoning Benchmark for Evaluating Code-Generating LLMs
本論文は、大規模言語モデルが科学的に妥当な有限要素法コードを生成する能力を厳密に評価するために設計された、計算力学のタスクに基づく構造化ベンチマークであるFEM-Benchを紹介し、最先端のモデルであっても、これらの非自明な問題を一貫して解決することに苦慮していることを明らかにしている。
原著者が当サイトのやさしい解説を確認した論文。
このページに掲載されている各論文については、少なくとも一人の原著者が当サイトのやさしい解説を確認し、内容の正確性を認めるか、または修正を依頼しその修正を私たちが反映しています。確認は各文への正式な承認を意味するものではありませんが、論文を書いた本人たちの目を通ったことを意味します。
606 件の論文を著者が確認済み · 161–170 / 606
本論文は、大規模言語モデルが科学的に妥当な有限要素法コードを生成する能力を厳密に評価するために設計された、計算力学のタスクに基づく構造化ベンチマークであるFEM-Benchを紹介し、最先端のモデルであっても、これらの非自明な問題を一貫して解決することに苦慮していることを明らかにしている。
本論文は、古典的光ビーム、コヒーレント量子状態、および個々の光子における位置と運動量の分散を同一に制約する普遍的な鋭い不確定性関係 を導出した。
本論文は、潮汐破壊現象における遅延した電波フレアが、初期の破壊から数年後に既存の恒星の極端質量比連星が膨張する降着円盤と衝突することで生成される大規模で低速の流出によって引き起こされることを提案する。
本論文は、埋め込み量子ドットの発光波長をシュタルク効果により調整して特定のキラル反転点において方向性発光コントラストの符号を切り替える、遅光フォトニック結晶導波路におけるキラル反転の実験的観測と電気的制御を実証するものである。
本論文は、すべてのスピノ係数と曲率スカラーを 1+1+2 変数で表現することにより、ニューマン・ペンローズ形式と 1+1+2 半テトラド共変形式との間の完全な辞書的対応を確立し、それによってニューマン・ペンローズ量に対する幾何学的解釈を提供するとともに、局所的回転対称時空における未来外向きトラッピングホライズンに対する必要条件を導出する。
本論文は、スパースオートエンコーダを用いて、低ランク適応(LoRA)微調整が言語モデル内に、事前学習済み特徴辞書と幾何学的に整合しない固有の表現構造を誘発することを示し、アダプタ固有の更新が残差ストリーム内で部分的に独自の空間を占有することを示唆する。
本論文は、 群によって特徴づけられる (1+1) 次元自由スカラーネットワーク CFT に対する最も一般的な接続条件を確立し、それらの物理的実現を提供するとともに、ネットワーク・カシミールエネルギーに対する厳密な上限を導出し、その正則多面体構造への含意を分析する。
本論文は、NGC 2146 における極めて光度の低い Type IIP 型超新星 SN 2024abfl に関する多波長観測と流体力学的モデリングを提示し、それがコンパクトで低質量の前身星に起因する低エネルギーの核崩壊爆発の結果であることを明らかにするとともに、そのような事象のメカニズムに対する新たな制約条件を提供するものである。
本論文は、拡散ベースの生成モデルを組み合わせた逐次スコア分解手法を採用して方策更新を高報酬かつ分布内領域へ誘導することにより、協調タスクにおける分布シフトと多モーダルな協調の課題に対処する新たなオフライン多エージェント強化学習フレームワークを提案し、多様なベンチマークにおいて最先端の性能を達成する。
本論文は、非等スペクトル問題を通じて Lie 超代数 osp(1,6) に基づいて 2 つの超可積分階層とそのハミルトニアン構造を構築し、さらにこれらの系を特定の条件下で縮約することにより、超-AKNS 階層の (2+1) 次元一般化を導出する。