S2DiT: Sandwich Diffusion Transformer for Mobile Streaming Video Generation

本論文は、大規模教師モデルからの蒸留と、予算感知動的計画法に基づく「サンドイッチ」構造の効率的なアテンション機構を組み合わせることで、iPhone 上で 10FPS 超のストリーミング生成を実現しつつ、サーバー級の高品質な動画生成を可能にする「S2DiT」を提案する。

Lin Zhao, Yushu Wu, Aleksei Lebedev, Dishani Lahiri, Meng Dong, Arpit Sahni, Michael Vasilkovsky, Hao Chen, Ju Hu, Aliaksandr Siarohin, Sergey Tulyakov, Yanzhi Wang, Anil Kag, Yanyu Li2026-03-10💻 cs

ReViP: Mitigating False Completion in Vision-Language-Action Models with Vision-Proprioception Rebalance

本論文は、視覚と自己位置推定(プロプリオセプション)のバランスを再調整し、タスク進行に応じた視覚的手がかりを導入することで、視覚言語行動モデルにおける「失敗した実行を完了したと誤認する」現象を解決し、新しいベンチマークと ReViP というフレームワークを提案する研究です。

Zhuohao Li, Yinghao Li, Jian-Jian Jiang, Lang Zhou, Tianyu Zhang, Jiadong Yin, Mu Lin, Yi-Kin Wei, Wei-Shi Zheng2026-03-10💻 cs

ScenePilot-Bench: A Large-Scale Dataset and Benchmark for Evaluation of Vision-Language Models in Autonomous Driving

本論文では、3,847 時間の運転動画と多粒度の注釈データに基づく大規模な第一人称視点のベンチマーク「ScenePilot-Bench」を提案し、自律運転シナリオにおけるビジョン・ランゲージモデルの性能評価と安全性向上のための包括的な枠組みを提供しています。

Yujin Wang, Yutong Zheng, Wenxian Fan, Tianyi Wang, Hongqing Chu, Li Zhang, Bingzhao Gao, Daxin Tian, Jianqiang Wang, Hong Chen2026-03-10💻 cs

BioAgent Bench: An AI Agent Evaluation Suite for Bioinformatics

本論文は、RNA-seq やバリアントコーリングなどのバイオインフォマティクスタスクにおける AI エージェントの性能と堅牢性を評価するためのベンチマーク「BioAgent Bench」を提案し、最先端モデルが複雑なパイプラインを構築できる一方で、入力改変などの摂動に対する脆弱性や、プライバシー制約下でのオープンウェイトモデルの有用性を明らかにしたことを述べています。

Dionizije Fa, Marko Čuljak, Bruno Pandža, Mateo Čupic2026-03-10💻 cs

Real-Time Aligned Reward Model beyond Semantics

本論文は、強化学習による大規模言語モデルの人間との整合性確保において生じる報酬過最適化問題を解決するため、事前学習済みモデルのセマンティック表現に依存する従来の手法を超え、強化学習中のポリシー分布のリアルタイムな変化を反映する「R2M(リアルタイム整合報酬モデル)」という軽量フレームワークを提案しています。

Zixuan Huang, Xin Xia, Yuxi Ren, Jianbin Zheng, Xuefeng Xiao, Hongyan Xie, Li Huaqiu, Songshi Liang, Zhongxiang Dai, Fuzhen Zhuang, Jianxin Li, Yikun Ban, Deqing Wang2026-03-10💻 cs

Impact of LLMs news Sentiment Analysis on Stock Price Movement Prediction

本論文は、DeBERTa、RoBERTa、FinBERT の 3 つの LLM を用いたニュース感情分析と株価予測モデルを統合評価し、DeBERTa が単独で 75% の精度を達成し、3 モデルのアンサンブルでは 80% まで向上すること、および感情分析特徴量が LSTM や PatchTST などの予測モデルにわずかながら有益であることを示しています。

Walid Siala (SnT, University of Luxembourg, Luxembourg), Ahmed Khanfir (RIADI, ENSI, University of Manouba, Tunisia, SnT, University of Luxembourg, Luxembourg), Mike Papadakis (SnT, University of Luxembourg, Luxembourg)2026-03-10💻 cs

From Performers to Creators: Understanding Retired Women's Perceptions of Technology-Enhanced Dance Performance

本論文は、中国の退職女性ダンサーを対象とした共同デザイン研究を通じて、年齢に配慮したインタラクティブ技術と生成 AI を活用することで、彼女らが受動的なパフォーマーから舞台演出の共創者へと転換し、自己表現を強化できることを示しています。

Danlin Zheng, Xiaoying Wei, Chao Liu, Quanyu Zhang, Jingling Zhang, Shihui Guo, Mingming Fan2026-03-10💻 cs

Cognitive-Flexible Control via Latent Model Reorganization with Predictive Safety Guarantees

本論文は、システムダイナミクスや観測条件の急激な変化に対処するため、潜在表現を適応的に再構成しつつ安全性を保証する「認知的柔軟性制御」フレームワーク(CF-DeepSSSM)を提案し、その閉ループ安定性や再帰的実行可能性を保証するとともに、シミュレーションを通じてその有効性を示しています。

Thanana Nuchkrua, Sudchai Boonto2026-03-10💻 cs

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

本論文は、3,000 時間のデモンストレーションデータと 5 段階のカリキュラム学習、および RL による政策整合を採用し、ヒューマノイドや可動マニピュレータなど多様なロボット形態に汎用的に適用可能で、安全性と長期的なタスク遂行能力を向上させた Vision-Language-Action モデル「Green-VLA」を提案するものである。

I. Apanasevich, M. Artemyev, R. Babakyan, P. Fedotova, D. Grankin, E. Kupryashin, A. Misailidi, D. Nerus, A. Nutalapati, G. Sidorov, I. Efremov, M. Gerasyov, D. Pikurov, Y. Senchenko, S. Davidenko, D. Kulikov, M. Sultankin, K. Askarbek, O. Shamanin, D. Statovoy, E. Zalyaev, I. Zorin, A. Letkin, E. Rusakov, A. Silchenko, V. Vorobyov, S. Sobolnikov, A. Postnikov2026-03-10💻 cs

Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

本論文は、AI チャットボットがユーザーの精神疾患の脆弱性を増幅する「脆弱性増幅相互作用ループ(VAILs)」という体系的な失敗モードを特定し、これを検出・評価するためのスケーラブルな監査フレームワーク「SIM-VAIL」を提案したものである。

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M Nour2026-03-10💻 cs

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

本論文は、大規模視覚言語モデル(VLM)を用いたロボットエージェントの実世界における長期的な閉ループ実行能力を評価するため、未構造化環境でのタスク分解やオンライン検証、再計画を含むモデル非依存のロボットプラットフォーム「AgenticLab」とそのベンチマークを提案し、従来のオフライン評価では捉えられなかった多段階のグランドイング不整合や視覚的障害、空間推論の限界などの失敗モードを明らかにしたものである。

Pengyuan Guo, Zhonghao Mai, Zhengtong Xu, Kaidi Zhang, Heng Zhang, Zichen Miao, Arash Ajoudani, Zachary Kingston, Qiang Qiu, Yu She2026-03-10💻 cs

Six Times to Spare: Characterizing GPU-Accelerated 5G LDPC Decoding for Edge-RSU Communications

本論文は、5G 車載エッジ通信における低遅延・高信頼性要件を満たすため、Sionna LDPC5G ベースラインを用いたマイクロベンチマークにより、GPU によるオフロードが LDPC 復号のスループット向上と CPU 負荷の軽減をもたらし、エッジ RSU プラットフォームでの物理層計算マージンの確保に寄与することを示しています。

Ryan Barker, Julia Boone, Tolunay Seyfi, Alireza Ebrahimi Dorcheh, Fatemeh Afghah, Joseph Boccuzzi2026-03-10💻 cs

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

本論文は、LLM 生成コードの構造的な脆弱性がフロントエンド特徴から予測可能であることを示す「FSTab」フレームワークを提案し、ブラックボックス環境下での攻撃成功率 94% などの高い転移性を確認することで、コード生成における新たなセキュリティリスクを明らかにした。

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

この論文は、大規模言語モデルを活用してレビューテキストなどからユーザーとアイテムの動機を抽出・統合し、ノイズや意味のズレを抑制する新たな推薦フレームワーク「LMMRec」を提案し、既存手法を最大 4.98% 上回る性能向上を実証したものです。

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

本研究は、72 人の参加者を用いた比較分析により、問題解決能力における自己評価尺度と行動ベースのゲーム型アセスメントの間に有意な一致が見られなかったことを示し、両者が相互補完的な情報を提供し、採用選考において多面的な評価枠組みの統合が重要であることを提言しています。

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

本論文は、Doob の h 変換とマルティンゲール理論に基づき、事前学習済み拡散モデルのスコアネットワークを変更することなく、確率 1 で制約を満たす硬制約付き条件生成を実現するガイダンス手法と、その誤差解析およびオフポリシー学習アルゴリズムを提案するものである。

Zhengyi Guo, Wenpin Tang, Renyuan Xu2026-03-10💻 cs

Beyond Judgment: Exploring Large Language Models as Non-Judgmental Support for Maternal Mental Health

この研究は、母親が社会的な批判を避けて育児の不安や罪悪感を解消するために、LLM を非審判的な情緒的支援ツールとして活用する傾向がある一方で、多くの母親は依然として人間の温かみを重視しており、LLM は人間の支援を代替するものではなく、社会的文脈に依存した低リスクな支援として位置づけるべきであることを示しています。

Shayla Sharmin, Sadia Afrin Ratna2026-03-10💻 cs