Consistency of AI-Generated Exercise Prescriptions: A Repeated Generation Study Using a Large Language Model

本論文は、大規模言語モデル(Gemini 2.5 Flash)を用いた運動処方生成の一貫性を評価した研究であり、意味的な一貫性は高いものの、強度などの定量的要素や安全記述の具体性にばらつきが見られたため、臨床応用には構造的な制約や専門家による検証が必要であると結論付けています。

原著者: Kihyuk Lee

公開日 2026-04-14
📖 1 分で読めます☕ さくっと読める
⚕️

これは査読を受けていないプレプリントのAI生成解説です。医学的助言ではありません。この内容に基づいて健康上の判断をしないでください。 免責事項の全文を読む

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「AI(人工知能)に『運動の処方箋』を書かせても、毎回同じような答えが返ってくるのか?」**という疑問に答えた研究です。

想像してみてください。あなたが病院で「運動がしたいので、どんなメニューがいいですか?」と医師に相談したとします。もし、同じ医師に同じ話をしても、**「今日はランニングを 30 分」と言ったり、「明日は 10 回だけスクワット」と言ったり、「来週は水泳を 20 分」**と言ったりして、毎回全く違う答えが返ってきたら、あなたは安心できますか?

この研究は、最新の AI(Gemini 2.5 Flash というモデル)を使って、この「答えのばらつき」を調べる実験を行いました。

以下に、難しい専門用語を使わず、日常の例え話で説明します。


1. 実験の仕組み:同じ質問を 20 回繰り返す

研究者は、6 種類の「患者さん(または健康な人)」のシナリオを用意しました。

  • 例: 糖尿病で太っている人、膝が痛いお年寄り、がんから回復した人、健康的に痩せたい若者など。

そして、「この人向けの運動メニューを作って」という同じ質問を、AI に20 回も連続で投げかけました。合計 120 個の回答が生まれました。
これを「同じ料理の注文を 20 回して、毎回同じ味が出るか?」を試すようなものだと考えてください。

2. 実験の結果:3 つのチェックポイント

研究者は、AI の回答を 3 つの視点でチェックしました。

① 言葉の雰囲気(意味の一致度)

「まるで、同じ人が書いたような文章か?」

  • 結果: 非常に高かったです(90% 近く一致)。
  • 例え: 20 回同じ注文をすると、AI は「まず挨拶をして、運動の重要性を説き、最後に注意点を述べる」という**「文章の構成やトーン」はほぼ毎回同じ**でした。
  • 発見: 病状がハッキリしている場合(膝が痛いなど)ほど、AI の答えは安定していました。逆に「健康な人が筋肉をつけたい」というような、選択肢が広い場合は、答えが少しバラつきました。

② 具体的な数字(FITT の原則)

「運動の『回数・強度・時間』は毎回同じか?」
ここが一番の問題点でした。

  • 結果: 数字や具体的な指示は、毎回バラバラでした。
  • 例え:
    • 「週 3 回、30 分」と言っていたのに、次は「週 4 回、40 分」になったりします。
    • 特に**「どれくらいきつい運動をするか(強度)」について、AI が「100 回持ち上げてください」と言ったり、「具体的な数字が書かれていない(何回か分からない)」**という答えが、10〜25% の確率で出てきました。
  • 意味: 文章の雰囲気は同じでも、「実際にどれくらい動くか」という重要な数値は、AI によって(あるいは同じ AI でも)毎回変わってしまうことが分かりました。

③ 安全への配慮

「危険なことをしないよう注意喚起は入っているか?」

  • 結果: 100% 入っていました。
  • 例え: どの回答にも「膝が痛くなったら止めてください」「めまいがしたら休んでください」といった**「安全の警告」は必ず含まれていました**。
  • 発見: ただし、警告の**「量」**は違いました。病気が重い人ほど、AI は「注意してください!」と長々と警告を書き、健康な人への警告は短かったです。これは AI が状況に合わせて慎重になっている証拠です。

3. この研究が教えてくれること(結論)

この研究から、私たちが知っておくべきことは以下の 3 点です。

  1. AI は「文章」は上手だが、「数字」は不安定
    AI は「運動しましょう」という文章を書くのは得意ですが、「週 3 回、30 分、強度は 60%」という正確な数値を毎回同じように出すのは苦手です。
  2. 病状がハッキリしているほど AI は安定する
    「膝が痛いから走れない」といった明確なルールがある場合、AI はそのルールに従って安定した答えを出しますが、「健康だから自由に運動して」という場合は、AI も「どうすればいいか迷って」答えがバラバラになります。
  3. まだ人間がチェックが必要
    AI が 100% 安全な警告を出してくれるのは素晴らしいですが、「具体的な運動量」をそのまま信じて実行するのは危険です。必ず専門家(医師やトレーナー)が「この数字は正しいか?」と最終確認をする必要があります。

まとめ

この論文は、**「AI は運動のメニューを作る『下書き』としては優秀だが、そのままの数字を信じて実行するのはまだ早い」**と警告しています。

AI は素晴らしい「アシスタント」ですが、最終的な「責任者」は人間であるべきだ、というのがこの研究のメッセージです。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →