GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification
GATech チームは、AbjadGenEval 共有タスクにおいて、複雑なプーリング手法よりも単純な平均プーリングの方が限られたデータで安定して良好な結果(F1 0.75)を示し、さらに人間による文章が機械生成された文章よりも有意に長いというデータ特性を明らかにしました。
2316 件の論文
GATech チームは、AbjadGenEval 共有タスクにおいて、複雑なプーリング手法よりも単純な平均プーリングの方が限られたデータで安定して良好な結果(F1 0.75)を示し、さらに人間による文章が機械生成された文章よりも有意に長いというデータ特性を明らかにしました。
この論文は、82 クラスの阿拉伯語医療テキスト分類タスクにおいて、因果的デコーダー(大規模言語モデル)よりも、ハイブリッドプーリングやマルチサンプルドロップアウトを備えた微調整済みの双方向エンコーダー(AraBERTv2)の方が、正確な意味境界の捕捉と分類精度において優れていることを実証しています。
この論文は、標準的な GRPO が抱える「全サンプルを交換可能と仮定する」限界を克服し、各ユーザーの選好グループに固有の報酬履歴に基づいて利得を正規化することで、多様な個人選好への迅速かつ高精度なアライメントを実現する「Personalized GRPO(P-GRPO)」という新たなフレームワークを提案し、その有効性を示したものです。
本論文は、AI モデルと AI システムの境界の曖昧さが規制上の義務分担に課題を生んでいる現状を踏まえ、学術文献や規制文書の大規模レビューに基づき、両者の概念を明確に定義し、規制実装における責任の所在を解決するための枠組みを提案するものである。
LWM-Temporal は、物理的に妥当な近傍に相互作用を制限することで計算複雑度を大幅に削減しつつ、モビリティに起因する進化を捉える汎用的な無線チャネル埋め込みを学習する、新しい大規模無線モデル(LWM)ファミリーのメンバーです。
本論文は、長期実行エージェントの文脈制限下で重要な情報を保持しつつ不要な情報を効率的に忘却するための階層型メモリ管理手法「HTM-EAR」を提案し、重要性に基づくエビクションとハイブリッドルーティングを組み合わせることで、飽和状態においてもオラクルに近い検索精度を維持できることを実証しています。
本論文は、スマートホームの IoT 環境において、ラベル不要の自己教師あり学習と軽量トランスフォーマーを活用し、複数の故障や居住者が混在する状況下でも高精度かつエッジデバイス上で動作可能なセンサー故障検出・特定手法「Tureis」を提案するものである。
本論文は、NetSecGame 環境において IP アドレスの再割り当てという単純な変化が自律攻撃エージェントの一般化能力に与える影響を評価し、メタ学習エージェントは部分的な適応を示すものの、推論コストや透明性の欠如などの課題はあるものの、事前学習済み LLM ベースのエージェントが保持されたテスト条件下で最も高い成功率を達成したことを明らかにしています。
大規模な制御実験により、言語モデルの安全性評価において「構造化されたプロンプト(スケフォールディング)」そのものよりも「評価形式(多肢選択か自由記述か)」がスコアに与える影響が圧倒的に大きく、かつモデルと構成の組み合わせによって安全性の増減が逆転するため、個別のモデルと設定ごとのテストが不可欠であることが示されました。
IoT 環境におけるヒト活動認識の継続的学習において、事前学習済みモデルの凍結とチャネル単位のゲート制御による特徴選択アプローチを採用することで、パラメータの 2% 未満のみを学習しながら忘却を大幅に抑制し、安定性と可塑性を両立する効率的なフレームワークを提案しています。
本論文は、Sharpness-Aware Minimization (SAM) の従来手法における理論的解釈の欠如と近似精度の問題を解決し、最大値の方向を明示的に推定する新たな手法「XSAM」を提案し、その有効性を示すものである。
本論文は、組み合わせ融合分析(CFA)の手法を統合し、PyTorch、TensorFlow、Scikit-learn のワークフローに対応する新しい Python ツール「InFusionLayer」を提案し、コンピュータビジョンデータセットにおけるその有効性を検証したものである。
本論文は、暗号化トラフィック分類においてバイト列への平坦化がもたらす意味論的ミスマッチを解決するため、プロトコル定義のフィールド意味をアーキテクチャの事前知識として活用し、予測可能性に基づくフィルタリングや双軸アテンションを備えた表形式のマスクオートエンコーダ「FlowSem-MAE」を提案し、限られたラベル付きデータでも最先端の性能を達成することを示しています。
OmniGuide は、3D 空間における微分可能なエネルギー関数として任意のガイダンス源を表現し、VLA モデルの行動サンプリングを誘導することで、複雑なタスクにおける汎用ロボット政策の成功率と安全性を大幅に向上させる柔軟なフレームワークを提案するものです。
本論文は、ピックアップ・デリバリー問題のクラスター構造を明示的に活用するクラスター認識型アテンション機構と階層的デコーディングを組み合わせた深層強化学習フレームワーク「CAADRL」を提案し、最先端手法と同等またはそれ以上の性能を、大幅に短い推論時間で達成することを示しています。
この論文は、情報幾何学におけるフィッシャー情報計量に基づくリッチスカラーの体積平均が半整数に量子化されるという 20 年前の予想を、木構造や完全グラフでは証明し、一般のループ構造では反証することで解決するとともに、ガウス DAG ネットワークにおける正負の曲率の二項対立を示しています。
この論文は、ニューラルセルラオートマトン(NCA)を用いて生成した合成データを事前学習に活用することで、自然言語データのみでの学習よりも効率的に言語モデルの性能を向上させ、推論タスクにおける汎化能力も高めることを示しています。
本論文は、Muon 学習アルゴリズムの重みスペクトルが過度に正規化される問題を Heavy-Tailed Self-Regularization 理論に基づいて解決し、LLM の事前学習や画像分類において最先端の性能を達成する「HTMuon」という新しい最適化手法を提案するものである。
この論文は、検索エージェントの学習における重要なサンプリング分布のドリフト問題に対処し、既存の GRPO アルゴリズムをわずか 1 行のコード修正で KL 制約を適用する「SAPO」を提案することで、モデルの崩壊を防ぎ、QA ベンチマークで大幅な性能向上を実現したことを報告しています。
本論文は、時系列基盤モデル Chronos-T5-Large にスパースオートエンコーダを適用した初の研究であり、中間エンコーダ層に存在する「変化検知」機能が予測精度に最も因果的に重要であることを、392 回にわたる単一特徴量アブレーション実験を通じて実証しています。