NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

本論文は、ユーザー入力を直接画面フレームに変換する再帰型ニューラルネットワークと拡散ベースのレンダラーを組み合わせ、実際の操作記録や AI エージェントによる合成データから学習することで、既存の OS の GUI 再現だけでなく、インストールされていないアプリケーション(例:Doom)の動作さえもシミュレート可能なニューラル OS「NeuralOS」を提案するものである。

Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian DengFri, 13 Ma💬 cs.CL

TRACE: AI-Assisted Assessment of Collaborative Projects in Computer Science Education

この論文は、大規模なコンピュータサイエンス教育におけるグループプロジェクトの個人貢献度を公平かつ客観的に評価するための半自動化 AI 支援フレームワーク「TRACE」を提案し、そのパイロット運用において教員の評価との高い一致、学生の満足度向上、教員の負荷軽減が確認されたことを報告しています。

Songmei Yu, Andrew ZagulaFri, 13 Ma🤖 cs.AI

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

本研究は、SHAP による説明と大規模言語モデルの自律的反復改善を組み合わせた「アジェンティック XAI」フレームワークを提案し、米収量データを用いた実証実験により、適切な早期停止戦略が採用された場合にのみ、専門家の評価で推奨品質が最大 33% 向上し、過度な反復による品質低下を防ぐことができることを示しました。

Tomoaki Yamaguchi, Yutong Zhou, Masahiro Ryo, Keisuke KatsuraFri, 13 Ma🤖 cs.AI

Do LLMs Truly Benefit from Longer Context in Automatic Post-Editing?

この論文は、プロプライエタリな大規模言語モデルが単純なプロンプトでも人間レベルの自動ポストエディティング品質を達成する一方で、文書レベルのコンテキストを十分に活用できず、コストや遅延の課題も残っていることを示し、より効率的な長文脈モデルの必要性を浮き彫りにしています。

Ahrii Kim, Seong-heum KimFri, 13 Ma💬 cs.CL

Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction

本論文は、リソース制約のあるロボット向けに、ゼロショットおよびワンショット適応を用いた小規模言語モデル(SLM)のリーダー・フォロワー役割分類を評価し、ファインチューニングされたモデルが低遅延かつ高精度な役割割り当てを実現できる一方で、対話の複雑さが増すと性能が低下するトレードオフを明らかにしたものである。

Rafael R. Baptista, André de Lima Salgado, Ricardo V. Godoy, Marcelo Becker, Thiago Boaventura, Gustavo J. G. LahrFri, 13 Ma⚡ eess

"I followed what felt right, not what I was told": Autonomy, Coaching, and Recognizing Bias Through AI-Mediated Dialogue

本研究は、AI を介した対話が障害差別(アビリズム)の認識に与える影響を検証し、対話形式が読みのみよりも効果的である一方、バイアスを指摘するAI の働きかけは否定的感情を増幅させる可能性があるが、包括的な支援は学習の足がかりとして機能することを明らかにした。

Atieh Taheri, Hamza El Alaoui, Patrick Carrington, Jeffrey P. BighamFri, 13 Ma🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

生成 AI の利用が急増する中で、創業者と投資家が生成 AI と協働して新ベンチャーのレトリック的正当化を共産出・競合・再調整するプロセスを説明する「ゴースト・フレーミング理論」を提唱し、生成 AI のレトリック的アフォーダンスと多アクター環境におけるアフォーダンスの可視性や転移性を理論化しています。

Greg NyilasyFri, 13 Ma🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Ramaswamy らが『Nature Medicine』で報告した消費者向け医療 AI のトリアージ失敗は、モデルの能力不足ではなく、実際の利用状況と乖離した「強制選択形式」などの評価手法に起因するものであり、自然な対話形式での評価では性能が大幅に向上することが示された。

David Fraile Navarro, Farah Magrabi, Enrico CoieraFri, 13 Ma🤖 cs.AI

Managing Cognitive Bias in Human Labeling Operations for Rare-Event AI: Evidence from a Field Experiment

この論文は、医療画像のレアイベント検出における人間のラベリングで生じる認知バイアスを、フィードバックの偏在を調整し確率的ラベリングを採用することで軽減し、さらに線形対数オッズ再較正を用いて下流の CNN モデルの性能と較正を大幅に改善することを、実証実験を通じて示しています。

Gunnar P. Epping, Andrew Caplin, Erik Duhaime, William R. Holmes, Daniel Martin, Jennifer S. TruebloodFri, 13 Ma💰 q-fin

AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

この論文は、臨床診断や投資判断など検証が困難な高リスクな意思決定において、最先端の LLM が「問題の特定はできるが修正ができず、誤ったパターンを高度化しながら繰り返す」という「ヘリコイド動力学」と呼ばれる失敗様式を示すことを明らかにし、信頼性の高い AI 連携に向けた仮説と対策を提案しています。

Alejandro R JadadFri, 13 Ma🤖 cs.AI

A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy

本論文は、LT-LiDER プロジェクトのインタビューデータに基づき、自動化が進む言語・翻訳業界において、効率性やサービス倫理が基盤となりつつも、専門性や適応力といった人的価値が再配置され、技術と人間の相互依存的な関係が翻訳教育に示唆を与えることを明らかにしている。

María Isabel Rivas Ginel, Janiça Hackenbuchner, Alina Secar\u{a}, Ralph Krüger, Caroline RossiFri, 13 Ma💬 cs.CL

From Control to Foresight: Simulation as a New Paradigm for Human-Agent Collaboration

本論文は、LLM 駆動の自律エージェントとの協働において、単なる個別行動の制御ではなく、未来の軌道をシミュレーションして事前に検討する「シミュレーション・イン・ザ・ループ」という新たな対話パラダイムを提案し、人間の意思決定を反応的な修正から情報に基づいた探求へと転換させることを論じています。

Gaole He, Brian Y. LimFri, 13 Ma💬 cs.CL

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

本論文は、LLM との協働においてデザイナーが創造的代理権を失うリスクを指摘し、内省、技術理解、そして人間と技術の関係性の調整を通じて、デザイナーの創造的代理権を取り戻すための協働のあり方を提案しています。

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijnFri, 13 Ma🤖 cs.AI

Human-Centred LLM Privacy Audits: Findings and Frictions

この論文は、大規模言語モデル(LLM)が個人に関連付ける情報を可視化するブラウザ型自己監査ツール「LMP2」を開発し、ユーザー研究を通じて生成 AI 評価の課題やプライバシー監査における 9 つの摩擦を明らかにし、人間中心の監査手法の確立に向けた提言を行うものである。

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina BerendtFri, 13 Ma💬 cs.CL

MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants

本論文は、従来の集約指標では見落とされがちな高リスク事例や多回対話におけるモデルの挙動を詳細に分析し、安全クリティカルなメンタルヘルス支援 AI の開発・評価・監査を可能にするオープンソースプラットフォーム「MHDash」を提案し、その有効性を示すものです。

Yihe Zhang, Cheyenne N Mohawk, Kaiying Han + 3 more2026-03-12🤖 cs.AI

A Temporal-Spectral Fusion Transformer with Subject-Specific Adapter for Enhancing RSVP-BCI Decoding

この論文は、EEG 信号の時間・スペクトル特徴を融合するトランスフォーマーと、既存データから新規被験者への知識転移を可能にする被験者固有アダプターを組み合わせることで、RSVP-BCI のデコーディング性能を向上させつつ新規被験者の学習データを最小化し、システムの実用化を加速させる手法「TSformer-SA」を提案しています。

Xujin Li, Wei Wei, Shuang Qiu + 1 more2026-03-11🤖 cs.AI

ExSampling: a system for the real-time ensemble performance of field-recorded environmental sounds

本論文は、フィールドレコーディングによる環境音のリアルタイムな音楽パフォーマンスを可能にする統合システム「ExSampling」を提案し、深層学習を用いた自動的な音源の Ableton Live トラックへのマッピングにより、録音者・作曲家・演奏者の間での相互作用を実現するものである。

Atsuya Kobayashi, Reo Anzai, Nao Tokui2026-03-10⚡ eess