CogBlender: Towards Continuous Cognitive Intervention in Text-to-Image Generation

CogBlender は、認知空間と意味多様体のマッピングとフローマッチング手法の再定式化により、画像生成プロセスにおいて価性や覚醒度などの認知属性を連続的かつ多角的に制御し、意図した心理的効果を持つ画像を生成する新しいフレームワークを提案するものです。

Shengqi Dang, Jiaying Lei, Yi He, Ziqing Qian, Nan CaoWed, 11 Ma💻 cs

Exploring Modality-Aware Fusion and Decoupled Temporal Propagation for Multi-Modal Object Tracking

本論文は、マルチモーダル物体追跡において既存手法の課題である均一な融合と時系列情報の混在を解決するため、モダリティ固有の融合と時系列情報の分離伝達を実現する新しいフレームワーク「MDTrack」を提案し、複数のベンチマークで最先端の性能を達成したことを示しています。

Shilei Wang, Pujian Lai, Dong Gao, Jifeng Ning, Gong ChengWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

本論文は、大規模言語モデルエージェントがオープンソースのコードリポジトリを自動的に標準化された実行可能ツールに変換し、人間の介入を最小限に抑えて安全にタスクを完了させるための統合フレームワーク「ToolRosetta」を提案するものである。

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

本論文は、タスクの進捗を可視的なマイルストーンとして監視し、失敗時に状態を巻き戻す「See, Plan, Rewind (SPR)」という新しいビジョン・言語・アクションフレームワークを提案し、追加学習なしでロボットの操作タスクにおける堅牢性と未知環境への適応能力を大幅に向上させることを示しています。

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun ChangWed, 11 Ma💻 cs

Paralinguistic Emotion-Aware Validation Timing Detection in Japanese Empathetic Spoken Dialogue

本論文は、テキストに依存せず音声の非言語的特徴と感情情報を統合したモデルを提案し、共感的対話における「感情の受容(バリデーション)」の適切なタイミングを高精度に検出することで、より共感的な人間・ロボット対話の実現を目指す研究です。

Zi Haur Pang, Yahui Fu, Yuan Gao, Tatsuya KawaharaWed, 11 Ma💻 cs

External entropy supply for IoT devices employing a RISC-V Trusted Execution Environment

この論文は、RISC-V 基盤のトラステッド・エクスキューション・エンバイロメント(TEE)を活用して、エントロピー収集が困難な IoT データに対して外部から暗号学的に強固な乱数を供給する実用的なソリューションを提案し、その実現可能性と有効性をオープンソース実装を通じて実証したものである。

Arttu Paju, Alejandro Cabrera Aldaya, Nicola Tuveri, Juha Savimäki, Marko Kivikangas, Brian McGillionWed, 11 Ma💻 cs

IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework

本論文は、生成された SVG のレンダリング結果を視覚的に評価し、そのフィードバックを生成プロセスに閉ループで組み込む「イントロスペクティブな生成器・批評家フレームワーク(IntroSVG)」を提案し、これにより既存の手法を凌駕する複雑で意味整合性の高い高品質なテキストから SVG への生成を実現したことを述べています。

Feiyu Wang, Jiayuan Yang, Zhiyuan Zhao, Da Zhang, Bingyu Li, Peng Liu, Junyu GaoWed, 11 Ma💻 cs

NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors

本論文は、従来の較正が手間とコストを要していた湾曲視触覚センサーに対し、身近な物体との数回の接触だけで高精度な 3 次元再構成を可能にする効率的な較正フレームワーク「NLiPsCalib」と、その検証用センサー「NLiPsTac」を提案するものである。

Xuhao Qin, Feiyu Zhao, Yatao Leng, Runze Hu, Chenxi XiaoWed, 11 Ma💻 cs

OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models

本論文は、マルチモーダル大規模言語モデルの細粒度視覚差異検出能力の欠如を明らかにする新たなベンチマーク「OddGridBench」を提案し、カリキュラム学習と距離認識型報酬を統合した強化学習フレームワーク「OddGrid-GRPO」によってその検出能力を大幅に向上させる手法を提示しています。

Tengjin Weng, Wenhao Jiang, Jingyi Wang, Ming Li, Lin Ma, Zhong MingWed, 11 Ma💻 cs

Measuring onion website discovery and Tor users' interests with honeypots

2025 年 3 月から 4 月にかけて Ahmia 検索エンジン等を通じて展開されたハニーポットを用いた調査により、Tor ユーザーの関心は主に Ahmia 経由で形成され、特に児童性的虐待(CSAM)関連のサイトが他カテゴリを大きく上回る関与を示し、かつ英語版が最も多くの相互作用を生んだことが明らかになりました。

Arttu Paju, Waris Abdullah, Juha NurmiWed, 11 Ma💻 cs

Dynamic Precision Math Engine for Linear Algebra and Trigonometry Acceleration on Xtensa LX6 Microcontrollers

本論文は、ESP32 などの低コストマイクロコントローラ向けに、Q16.16 固定小数点演算コア、CORDIC 三角関数モジュール、およびキャッシュ対応行列乗算カーネルを統合し、実行時に固定小数点と浮動小数点の精度を動的に切り替えることで、リアルタイム物理シミュレーションや制御システムにおける数値計算性能とエネルギー効率を大幅に向上させる「動的精度数学エンジン」の設計と評価を提案するものである。

Elian Alfonso Lopez PreciadoWed, 11 Ma💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

本論文は、プロンプト設計と反復的な改善を通じてチャット GPT で合成システム要件仕様書(SSyRS)を生成する手法を提案し、専門家の評価により一定の現実性が確認されたものの、矛盾や欠陥が存在するため LLM による自動評価は専門家による厳密な評価を完全に代替できないことを示したケーススタディの結果を報告するものである。

Alex R. Mattukat, Florian M. Braun, Horst LichterWed, 11 Ma💻 cs

Predictive Spectral Calibration for Source-Free Test-Time Regression

本論文は、分類タスクに特化した既存のテスト時適応手法の限界を克服し、ソースデータなしで画像回帰タスクの分布シフトに強靭に対応できるよう、サブ空間アライメントをブロックスペクトルマッチングに拡張した「予測スペクトル較正(PSC)」という新しいフレームワークを提案するものである。

Nguyen Viet Tuan Kiet, Huynh Thanh Trung, Pham Huy HieuWed, 11 Ma💻 cs

ProvAgent: Threat Detection Based on Identity-Behavior Binding and Multi-Agent Collaborative Attack Investigation

本論文は、従来の人間とモデルの協働から脱却し、グラフ対照学習による高忠実度アラート生成と仮説検証型マルチエージェントシステムを組み合わせた「ProvAgent」を提案することで、高度な持続的脅威(APT)の検出精度を向上させつつ、1 日あたり 0.06 ドルという極めて低コストで攻撃プロセスの自動再構築を実現するフレームワークを提示しています。

Wenhao Yan, Ning An, Linxu Li, Bingsheng Bi, Bo Jiang, Zhigang Lu, Baoxu Liu, Junrong Liu, Cong DongWed, 11 Ma💻 cs

Evidential Perfusion Physics-Informed Neural Networks with Residual Uncertainty Quantification

本論文は、物理制約の違反に伴う不確実性を定量化し、脳梗塞の CT 灌流画像解析における精度と信頼性を向上させるために、証拠深層学習と物理情報ニューラルネットワークを統合した「EPPINN」という新しい枠組みを提案し、その有効性を検証したものである。

Junhyeok Lee, Minseo Choi, Han Jang, Young Hun Jeon, Heeseong Eum, Joon Jang, Chul-Ho Sohn, Kyu Sung ChoiWed, 11 Ma💻 cs

SinGeo: Unlock Single Model's Potential for Robust Cross-View Geo-Localization

本論文は、異なる視野や向きに対する頑健性を欠く既存の手法の問題を解決し、単一のモデルで卓越した性能を発揮する「SinGeo」というフレームワークを提案し、二重の識別学習とカリキュラム学習を導入することで、クロスビュー地理定位の分野において最先端の結果を達成したことを示しています。

Yang Chen, Xieyuanli Chen, Junxiang Li, Jie Tang, Tao WuWed, 11 Ma💻 cs