MEGC2026: Micro-Expression Grand Challenge on Visual Question Answering

Each language version is independently generated for its own context, not a direct translation.

🎭 1. そもそも「マイクロエクスプレッション」とは？

まず、この大会で扱う「マイクロエクスプレッション（ME）」とは何でしょうか？

イメージ: あなたが怒っているのに、無理やり笑ってごまかそうとした瞬間、一瞬だけ（0.5 秒未満）、口元がピクッとして「本当は怒ってるぞ」という表情が漏れてしまうこと。
特徴: 本人も気づかないほど短く、無意識に現れる「心の隙間」のようなものです。普段の大きな表情（マクロエクスプレッション）とは違い、**「隠そうとした感情の漏れ」**を捉えるのが目的です。

🏆 2. この大会の目的：AI に「心の探偵」になってもらう

これまでの大会では、AI に「この表情は怒りか？」と分類させるのが主流でした。しかし、2026 年の大会では、**「AI に自然な会話で質問して、答えさせる」**という新しいスタイルを導入しています。

まるで**「AI 探偵」**に、動画を見て「この人、今どんな気持ち？」「いつ、どんな表情が現れた？」と質問し、その答えを言葉で説明させるようなものです。

大会には 2 つの主要な「お題（タスク）」があります。

🎬 タスク 1：短い動画で「心の探偵」をする（ME-VQA）

内容: 数秒間の短い動画を見て、質問に答えます。
例え: 映画の**「名場面（数秒）」**を切り取って、「この瞬間、主人公は嘘をついている？」「どんな感情が隠れている？」と探偵に聞いている感じです。
AI の挑戦: 最新の AI（マルチモーダル大規模言語モデル）を使って、映像と質問を結びつけ、「怒りっぽい口元が見えるから、怒りを隠しているよ」といった自然な言葉で答えることを目指します。

🎥 タスク 2：長い動画で「心の探偵」をする（ME-LVQA）

内容: 数分〜数十分の**「長い動画」**を見て、質問に答えます。
例え: 映画の**「全編」**を見せ、「この 1 時間の間に、主人公は何回『隠れた感情』を見せた？」「その時、どんな仕草があった？」と探偵に聞いている感じです。
難しさ: 長い動画には、普通の会話や大きな表情が混ざり合っています。その中で、**「一瞬の隙（マイクロエクスプレッション）」**を見つけ出し、時間軸を追いながら「あ、3 分目のところで怒りを隠したな」と見抜くのは、非常に難しいミッションです。

📊 3. 現在の AI の実力：「まだ修行中」

この論文では、最新の AI（Qwen という名前）にテストを受けさせた結果も紹介されています。

大きな表情なら OK: 「怒ってる」「笑ってる」といった大きな感情なら、AI もそこそこ当てられます。
隠れた感情は苦手: しかし、**「隠された感情（マイクロエクスプレッション）」を細かく見分けるのは、まだ AI にとって「超難問」**です。
- 例え: 探偵が「犯人は誰？」と聞かれて、「多分 A さんかな？」と大まかに当てるのは得意ですが、「A さんが 3 分 12 秒に左眉を少し上げたのが証拠だ」という細かい証拠を見つけ出すのは、まだ苦戦しています。
長い動画はさらに大変: 短い動画よりも、長い動画の分析では AI の性能が落ちることが分かりました。長い時間、集中して「心の隙」を探し続けるのは、AI にとっても疲れる（計算が難しい）作業のようです。

🚀 4. 今後の展望：なぜこれが重要なのか？

この大会は、AI が単に「表情を分類する機械」から、**「人間の感情の機微を理解し、自然に会話できるパートナー」**に進化するためのステップです。

応用: 嘘発見器の代わりに使ったり、心理治療のサポートをしたり、あるいは映画制作で「役者の演技の深さ」を分析したりする未来が期待されています。

まとめ

この論文は、**「AI に『心の隙間』を見つける探偵としての修行をさせるための、新しいお稽古場（大会）の案内」**です。

短い動画で瞬時に感情を読み取る練習。
長い動画で、長い間じっと観察し、隠れた感情を特定する練習。

まだ AI は「超難問」に直面していますが、この大会を通じて、より人間に寄り添った、賢い AI が生まれることを目指しています。

MEGC2026: Micro-Expression Grand Challenge on Visual Question Answering

🎭 1. そもそも「マイクロエクスプレッション」とは？

🏆 2. この大会の目的：AI に「心の探偵」になってもらう

🎬 タスク 1：短い動画で「心の探偵」をする（ME-VQA）

🎥 タスク 2：長い動画で「心の探偵」をする（ME-LVQA）

📊 3. 現在の AI の実力：「まだ修行中」

🚀 4. 今後の展望：なぜこれが重要なのか？

まとめ

MEGC2026: 視覚的質問応答（VQA）におけるマイクロ表情グランチャレンジ技術要約

1. 概要と背景

2. 提案タスク

タスク 1: ME ビデオ質問応答 (ME-VQA)

タスク 2: ME 長動画質問応答 (ME-LVQA)

3. データセット

4. ベースライン手法と評価指標

ベースラインモデル

評価指標

5. 実験結果

ME-VQA の結果

ME-LVQA の結果

6. 主要な貢献と意義

結論

MEGC2026: Micro-Expression Grand Challenge on Visual Question Answering

🎭 1. そもそも「マイクロエクスプレッション」とは？

🏆 2. この大会の目的：AI に「心の探偵」になってもらう

🎬 タスク 1：短い動画で「心の探偵」をする（ME-VQA）

🎥 タスク 2：長い動画で「心の探偵」をする（ME-LVQA）

📊 3. 現在の AI の実力：「まだ修行中」

🚀 4. 今後の展望：なぜこれが重要なのか？

まとめ

MEGC2026: 視覚的質問応答（VQA）におけるマイクロ表情グランチャレンジ 技術要約

1. 概要と背景

2. 提案タスク

タスク 1: ME ビデオ質問応答 (ME-VQA)

タスク 2: ME 長動画質問応答 (ME-LVQA)

3. データセット

4. ベースライン手法と評価指標

ベースラインモデル

評価指標

5. 実験結果

ME-VQA の結果

ME-LVQA の結果

6. 主要な貢献と意義

結論

関連論文

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

On the Multi-Commodity Flow with convex objective function: Column-Generation approaches

VeriInteresting: An Empirical Study of Model Prompt Interactions in Verilog Code Generation

AnalogToBi: Device-Level Analog Circuit Topology Generation via Bipartite Graph and Grammar Guided Decoding

Artificial Intelligence (AI) Maturity in Small and Medium-Sized Enterprises: A Framework of Internalized and Ecosystem-Embedded Capabilities

MEGC2026: 視覚的質問応答（VQA）におけるマイクロ表情グランチャレンジ技術要約