ai2026/6/25 13:00:00

SemEval-2026タスク13におけるDream：単一パス機械生成コード検出のためのSALSA

ニュース概要

大規模言語モデル（LLM）はコード生成を革新しましたが、著作者、評価の整合性、ソフトウェアの信頼性に関する懸念も高まっています。SemEval-2026タスク13サブタスクAは、特に未知のプログラミング言語やアプリケーションドメインをまたいだ分布外（OOD）汎化に重点を置き、コードスニペットに対する二項分類として検出を運用化します。本研究では、各クラスを専用の出力トークンにマッピングし、モデルが構造化された応答で単一トークンラベルを発行するようにトレーニングする、単一パス自己回帰LLM構造化分類（SALSA）スタイル定式化を提案します。手作りの特徴量や決定ルールを設計するのではなく、この定式化は著作者の判断をモデルに委任します。OODロバスト性を向上させるために、言語間のバランスの取れたサンプリングと、パラメータ効率の良いファインチューニングおよび保守的なトレーニング（低学習率、単一エポック）を組み合わせ、トレーニングドメインへの過学習を回避します。

解説

最近、AI（人工知能）の進化が目覚ましいですね。特に、文章だけでなく、コンピューターのプログラムコードまで作れる「大規模言語モデル（LLM）」の登場は、プログラミングの世界に大きな変化をもたらしています。しかし、その一方で、「このコードは本当に人間が書いたもの？」「AIが作ったコードは信頼できるの？」といった疑問や心配の声も上がっているんです。

こうした中、AIが生成したコードを見破る技術が注目されています。今回ご紹介するのは、SemEval-2026という国際的なワークショップで発表された、AIが作ったコードを検出するための新しい方法「SALSA」です。このタスクの面白いところは、AIがまだ学習していないような、新しいプログラミング言語や、これまで使ったことのない分野のコード（これを「分布外（OOD）」と呼びます）に対しても、きちんと対応できるかどうかを試している点です。まるで、初めて見る問題にも対応できる賢いAIを育てようとしているかのようですね。

SALSAという名前は、「Single-pass Autoregressive LLM Structured Classification」の頭文字を取ったもの。これは、AIモデルがコードを読み込むとき、一度の読み込みで、それが人間によって書かれたものか、AIによって生成されたものかを判断できるようにする仕組みです。AIは、それぞれの判断結果を「人間」や「AI」といった決まった言葉（トークン）で出力します。これにより、AIは自分で「これはAIっぽい」「これは人間っぽい」と判断するルールを学ぶのではなく、判断そのものをAIに任せることができるのです。

この研究で特に工夫されているのは、AIが学習したデータにだけ強く反応してしまう「過学習」を防ぐことです。そのため、さまざまなプログラミング言語のコードをバランス良く学習させたり、AIの学習方法を工夫したりしています。具体的には、学習率を低く抑えたり、学習回数を一度だけにしたりすることで、AIが特定のデータに偏りすぎず、未知のコードにも対応できるような、より柔軟な判断ができるように目指しているのです。これは、AIが作ったコードの「真贋」を見抜くための、重要な一歩と言えるでしょう。

今後の予測

AIが生成するコードの検出技術は、今後さらに重要性を増していくと考えられます。AIがより高度なコードを生成できるようになればなるほど、その「真贋」を見分けることは難しくなるからです。SALSAのような単一パスでの検出手法は、リアルタイムでのコード分析や、大規模なコードベースの評価において、効率的な解決策となる可能性があります。

一方で、AI検出技術が進化すれば、それに対抗するように、AIが生成したコードだと見破られにくい、より巧妙なコード生成AIが登場する可能性も否定できません。これは、AIと検出技術の、いわば「いたちごっこ」のような状況を生み出すかもしれません。

将来的には、AIが生成したコードの「信頼性」を保証する仕組みや、人間とAIが協力してコードを作成する際の、よりスムーズな連携を支援する技術が求められるようになるでしょう。単にAIか人間かを見分けるだけでなく、コードの品質や安全性を評価する、より多角的なアプローチが必要になってくると予想されます。