SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications
SwiftEmbed は、Rust 製で静的トークン埋め込みルックアップを採用した実運用向けシステムであり、1.12 ミリ秒の超低遅延と 5 万リクエスト/秒の高スループットを実現しつつ、重複検出や意味的類似性タスクにおいて Sentence-BERT と同等かそれ以上の性能を発揮します。
2462 件の論文
SwiftEmbed は、Rust 製で静的トークン埋め込みルックアップを採用した実運用向けシステムであり、1.12 ミリ秒の超低遅延と 5 万リクエスト/秒の高スループットを実現しつつ、重複検出や意味的類似性タスクにおいて Sentence-BERT と同等かそれ以上の性能を発揮します。
本論文は、部分的観測マルコフ決定過程(POMDP)のオンライン計画問題を、依存関係や同期のボトルネックを排除して完全にベクトル化された計算で解決する新しい並列ソルバ「VOPP」を提案し、既存の並列ソルバより 20 倍、逐次ソルバより 1000 倍少ない計算予算で近最適解を効率的に導出できることを示しています。
この論文は、拡散モデルによる画像の「再構成時の挙動(拡散スナップバック)」を分析することで、人間の目や従来の手法では判別が困難な高品質な AI 生成画像を、圧縮やノイズなどの歪みにも強く、極めて高い精度(AUROC 0.993)で検出する新しいフォレンジック手法を提案しています。
本論文は、BCI Competition IV-2a データセットを用いた比較研究において、個人内では解釈性の高い ANFIS-FBCSP-PSO モデルが、個人間では汎化性能に優れた EEGNet がそれぞれ優位であることを示し、MI-BCI システムの設計目標に応じたモデル選択の指針を提供しています。
本論文は、モバイルエッジコンピューティングにおける大規模 AI モデルの展開課題を解決するため、専門性に基づいて隣接ノード間でタスクを分散処理する「ネットワーク化された混合エキスパート(NMoE)」システムと、その学習を効率化かつプライバシーを保護するフェデレーテッドラーニング枠組みを提案するものである。
大規模言語モデルが数学オリンピックなどの競合問題では高い性能を示す一方で、現代の数学研究の深さや抽象度を反映する「FATE」という新たな代数学形式ベンチマークシリーズ(FATE-H および FATE-X)の導入により、最先端モデルが博士課程レベルの証明において極めて低い精度しか達成できず、自然言語での推論と形式化の間に大きなギャップが存在することが明らかになりました。
本論文は、人間の研究者の基礎論文を基に仮説立案から実験、論文執筆までを自律的に行う「Jr. AI Scientist」を開発し、その科学的貢献と評価結果を報告するとともに、現在の AI 科学者システムが抱えるリスクや限界を包括的に分析したものである。
本論文は、明示的および暗黙的なヘイトスピーチの検出において、少量の例から得られる「HatePrototypes(クラスレベルのベクトル表現)」を用いることで、従来の継続的ファインチューニングなしにタスク間での転移学習やパラメータ不要の早期退出を可能にし、効率的かつ解釈可能なモデリングを実現することを示しています。
本論文は、数値データと言語的推論を統合する「Think-Speak-Decide」パイプラインを採用したマルチエージェント強化学習フレームワーク「LAMP」を提案し、経済的意思決定における累積収益、頑健性、解釈可能性を大幅に向上させることを実証しています。
本論文は、既知の劣化モデルに依存せず、多粒度劣化認識モジュールと潜在拡散モデルに基づく劣化耐性プロキシステップを組み合わせた「UnfoldLDM」を提案し、ブラインド画像復元における過平滑化バイアスを解消して高品質な復元を実現する手法を提示しています。
本論文は、海面下で GNSS 信号が受信できない marine ロボットに対し、複数のドローンによる視覚検出、GNSS 三角測量、および信頼度重み付き拡張カルマンフィルタを統合したリアルタイム安定追跡システムを提案し、ドローン間の追跡 ID 整合アルゴリズムによるグローバル一貫性を確保することで、複雑な環境下でも高精度かつロバストな追跡を実現することを示しています。
本論文は、現実的な攻撃成功率モデルを統合した確率的な「(k, ε)-不安定性」の概念を導入することで、従来厳しすぎる仮定に依存していた SmoothLLM の防御証明を、より実用的で信頼性の高いものへと改良する枠組みを提案しています。
本論文は、大規模モデルの推論能力を活用して「都市 - 地区 - グリッド」の階層構造を計画し、ユーザー定義と無限の拡張を可能にする自律的な 3D 都市生成フレームワーク「Yo'City」を提案し、その卓越した性能を実証するものです。
本論文は、物理や検出器の設計に着想を得たアテンションマスクをトランスフォーマーに組み込むことで、建設中の KM3NeT/ORCA 望遠鏡における低エネルギーニュートリノの再構成と分類の精度を向上させ、異なる構成間での微調整における検出器間の有用な情報の保持を実証したものである。
この論文は、心理的原理(特に「足がかり効果」)に基づく大規模な多ターン対話型ジャイルブレイク攻撃を自動化するパイプラインを提案し、GPT 系モデルが会話履歴に脆弱である一方で Gemini 2.5 Flash が極めて高い耐性を示すなど、主要 LLM 間の安全性に顕著な差があることを実証しています。
この論文では、3 人以上のプレイヤーからなる非退化な正規形ゲームにおいて、すべての進化安定戦略を計算するアルゴリズムを提示しています。
本論文は、既存手法の限界を克服し、外部知識を効率的に取り込む新しい検索拡張型去重拡散モデル「RadDiff」を提案し、タンパク質逆折り畳みタスクにおいて既存手法を大幅に上回る性能とスケーラビリティを実証したものである。
この論文は、3D マイクロ CT スキャンから得られた 2D 画像を用いて有孔虫の種を分類する高精度な深層学習フレームワーク「ForamDeepSlice」を提案し、95.64% のテスト精度を達成するとともに、実用的なデプロイを可能にするインタラクティブなダッシュボードを開発したことを報告しています。
この論文は、統計的相関に依存する従来の予測モデルの限界を克服し、事前学習された因果基礎モデルを「What-if」シミュレーターとして統合することで、故障の根本原因を特定し介入効果を定量化して生産ラインの OEE を最適化する処方箋保全フレームワークを提案しています。
本論文は、強化学習における可塑性の喪失問題を解決し、性能低下を伴わずに学習能力を回復させるため、アクティブなネットワークとオフポリシー学習を行うパッシブなネットワークを交互に切り替える「AltNet」という双子ネットワーク手法を提案し、高次元制御タスクにおいて既存手法を上回る性能を実証したものである。