VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering

VQA-MHUG は、画像と質問の両方に対する人間の注視データを収集した新規データセットであり、これを用いた分析により、5 つの最先端 VQA モデルにおいてテキストに対する人間の注視との相関が性能向上の重要な予測因子であることが初めて示されました。

Ekta Sood, Fabian Kögel, Florian Strohm + 2 more2026-03-04💬 cs.CL

Reproduction and Replication of an Adversarial Stylometry Experiment

本論文は、著者帰属分析に対する防御手法に関する先駆的な研究(Brennan et al., 2012)を再現・複製した結果、元の研究に統制群が欠けていたため防御手法の有効性が過大評価されていた可能性を示しつつ、自動翻訳を用いた「往復翻訳」が既存の著者帰属手法の効果を低下させる新たな証拠を発見したことを報告するものである。

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Predictive Authoring for Brazilian Portuguese Augmentative and Alternative Communication

この論文は、ブラジルポルトガル語の AAC 向けに構築したコーパスを用いて BERTimbau を微調整し、ピクトグラムの予測においてキャプション、同義語、定義、画像など異なる表現手法を評価した結果、同義語が最も低いパープレキシティを示す一方でキャプションが最高精度を達成したことを明らかにしています。

Jayr Pereira, Rodrigo Nogueira, Cleber Zanchettin + 1 more2026-03-04🤖 cs.AI

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

本論文は、事前学習済み大規模言語モデルの微細な隠れたヘイトスピーチの検出能力を向上させるため、表面形式と意味を近づけつつクラス間距離を拡大する新しいフレームワーク「FiADD」を提案し、ヘイトスピーチ検出だけでなく皮肉やスタンス検出など他のタスクでも有効性を実証したものである。

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

この論文は、最大尤度モデルを用いて AI 学会のピアレビュー(ICLR 2024 など)を分析し、提出されたレビューの 6.5%〜16.9% が LLM によって大幅に修正または生成された可能性があり、その使用は低自信度や締め切り間近のレビューで顕著であることを明らかにした。

Weixin Liang, Zachary Izzo, Yaohui Zhang + 9 more2026-03-04🤖 cs.AI

NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions

この論文は、世界中の実際の食事摂取データから作成され人間によって検証された栄養推定用ベンチマーク「NutriBench」を提案し、最先端の言語モデルによる炭水化物推定精度の評価、専門家との比較、および糖尿病患者への血糖値への影響シミュレーションを通じて、LLM の栄養推定における可能性と課題を明らかにしています。

Andong Hua, Mehak Preet Dhaliwal, Laya Pullela + 2 more2026-03-04🤖 cs.AI

The Price of Prompting: Profiling Energy Use in Large Language Models Inference

本論文では、大規模言語モデル(LLM)の推論プロセスにおけるエネルギー消費を監視・分析するフレームワーク「MELODI」と、それによって生成された包括的なデータセットを提案し、プロンプトの特性とエネルギー消費量の相関を明らかにすることで、LLM の持続可能な展開に向けた新たな基盤を提供しています。

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar + 1 more2026-03-04🤖 cs.AI

OM4OV: Leveraging Ontology Matching for Ontology Versioning

本論文は、オントロジーバージョン管理(OV)をオントロジー整合(OM)システムとして再利用する際の問題点を分析し、整合結果を基に候補を削減して性能を向上させる「クロスリファレンス」メカニズムを導入した「OM4OV」という新しいパイプラインを提案し、その有効性を検証したものである。

Zhangcheng Qiang, Kerry Taylor, Weiqing Wang2026-03-04🤖 cs.AI

Automated Coding of Communications in Collaborative Problem-solving Tasks Using ChatGPT

本研究は、5 つのデータセットと 2 つのコーディング枠組みを用いて、チャット AI(ChatGPT)が協働問題解決におけるコミュニケーションデータの自動コーディングを一定の精度で実行可能であることを示し、モデルの新旧やタスク特性による性能差、およびフィードバックに基づくプロンプト改善の有効性について実証的な知見を提供しています。

Jiangang Hao, Wenju Cui, Patrick Kyllonen + 3 more2026-03-04💬 cs.CL