ai2026/6/30 13:00:00

Transformer言語モデルにおける状況モデリングとメンタライジングの発達的軌跡

ニュース概要（出典記事の要点）

最近の研究では、大規模言語モデル（LLM）が、誤信念課題（FBT）で測定される、テキストで記述されたエージェントの信念状態に敏感であることが示唆されていますが、構成概念妥当性に関する継続的な懸念が残っています。本研究では、Olmo2およびPythia言語モデルスイートの複数のトレ…

※ 上記は出典記事の要約です。本サイト独自の分析・背景解説は下記をご覧ください。

解説

最近、AI（人工知能）の進化が目覚ましいですが、その中でも特に注目されているのが「大規模言語モデル（LLM）」です。これは、私たちが普段使っている言葉を理解し、文章を生成する能力に長けたAIのこと。たとえば、ChatGPTなんかもこの仲間です。最近の研究で、こうしたLLMが、まるで人間のように「相手が何を考えているか」を推測する能力を持っているのではないか、ということが分かってきました。具体的には、「誤信念課題（FBT）」というテストで、AIがテキストに書かれた登場人物の「思い込み」をどれだけ理解できているかを調べています。でも、このテストのやり方や結果の解釈については、まだ「本当に相手の心を理解しているのか？」という疑問の声も上がっていました。

そこで、今回の研究では、AIが「心の状態を推測する能力」をどのように発達させていくのか、という「成長の過程」に注目しました。AIには「Olmo2」や「Pythia」といった、いくつかの種類があります。これらのAIが、学習を進めていく中で、どのように「相手の心を読む力」を身につけていくのかを、段階を追って見ていったのです。その結果、AIが「相手の思い込み」を理解できるようになるのは、AI自体の性能（モデルサイズ）と、十分な学習量がある場合に限られることが分かりました。しかも、その能力は、学習のかなり後の方で、ようやく現れてくるようです。さらに、AIに「誤った信念」について教えたり、より良い応答ができるように追加で学習させたりする（後トレーニング介入）ことで、この「心を読む力」は改善されることも確認されました。

ただ、この能力はまだ「もろさ」も抱えています。以前の研究でも指摘されていたように、「～と思う」といった、事実とは異なる可能性のある言葉（非事実的動詞）が使われると、たとえ本当は正しいことを考えている状況でも、AIは「間違った思い込み」をしていると判断してしまう傾向があるのです。これは、AIがまだ言葉のニュアンスや文脈を完全に掴みきれていないことを示唆しています。

そこで研究者たちは、AIが「相手の心を読む力」を身につける前に、まずは「目の前で起きていることの基本的な事実を理解する能力」、つまり「状況モデリング」の能力がどのように発達するのかも同時に追跡しました。これは、AIが物語の舞台設定や登場人物の行動といった、基本的な情報をどれだけ正確に把握できるかを見るものです。この「状況モデリング」の能力が、AIの「心を読む力」の発達にどう影響するのか、今後の研究でさらに明らかになっていくことが期待されます。

今後の予測

今回の研究で、大規模言語モデル（LLM）が「相手の心を読む力」を学習する過程が明らかになりましたが、この能力にはまだ脆さも残っています。今後、AIがより高度な「メンタライジング」能力を獲得していくためには、いくつかの道筋が考えられます。一つは、さらに大量の多様なテキストデータを学習させることで、言葉の微妙なニュアンスや文脈理解を深めることです。特に、人間同士の会話や、感情の機微が描かれる物語などを学習させることで、より人間らしい「心の推測」ができるようになるかもしれません。

もう一つの可能性は、AIの「学習方法」を工夫することです。今回の研究で、追加学習（後トレーニング介入）が効果的であることが示唆されていますが、どのような介入が最も効果的なのか、さらに探求が進むでしょう。例えば、AIに「なぜその登場人物はそう考えたのか」という理由を説明させるような学習方法が考えられます。これにより、AIは単にパターンを覚えるだけでなく、より深いレベルでの理解に至る可能性があります。

一方で、AIがどこまで「人間の心」を理解できるようになるのか、という根本的な問いも残ります。AIはあくまでデータに基づいて推論しているため、真の意味での「共感」や「意識」を持つことはない、という見方も根強くあります。そのため、AIの「メンタライジング」能力の向上は、あくまで「人間のように振る舞う」ための技術として発展していく、というシナリオも考えられます。AIが人間の心を理解するふりをすることの倫理的な問題についても、今後議論が深まっていくでしょう。