
画像: Pixabay
レイヤーをスキップするか、ループするか?LLMにおけるプログラム・オブ・レイヤーの学習
ニュース概要
大規模言語モデル(LLM)は従来、固定の深さと順序で全レイヤーを非反復的に実行して推論を行う。本研究は、訓練不要で柔軟な動的プログラム・オブ・レイヤー(PoLar)が広く存在することを明らかにする。事前学習されたレイヤーをモジュールとしてパッキングしてスキップまたはループさせ、各入力に対してカスタマイズされたプログラムを形成できる。ほとんどの入力では、大幅に短いプログラム実行で同等以上の精度を達成でき、元のLLMの誤った予測も、より少ないレイヤーを持つ別のプログラムで修正できる。これらの観察は、推論が標準的なフォワードパスを超えた複数の有効な潜在計算を認めることを示唆している。実践的にPoLarを効率的に実現するため、軽量なPoLar予測ネットワークを提案する。このネットワークは各入力に対して事前学習されたレイヤーを動的にスキップまたは繰り返す実行プログラムの生成を学習する。数学的推論ベンチマークでの実験により、PoLarは標準推論および従来の動的深さ手法と比べて一貫して精度を改善し、多くの場合より少ないレイヤーを実行することを示す。
ニュースタイムライン
2026年5月29日
株式会社QueeenB、AI for Science時代の研究構想を実験自動化計画に落とし込む「AI for Science ラボ自動化相談プログラム」を開始PR TIMES
2026年6月5日
日立、Anthropicが推進するAIを活用したセキュリティプログラム「Project Glasswing」に参画(クラウド Watch)Yahoo!ニュース IT
2026年6月5日
日立、Anthropicが推進するAIを活用したセキュリティプログラム「Project Glasswing」に参画クラウド Watch
2026年6月8日
OpenAI経済研究交流プログラムを発表OpenAI
記事AI質問チャット
PREMIUMこの記事についてAIが質問に答えます。背景・要約・影響まで深堀り。
ログインして利用🛡️ 読者ファクトチェック0
読者が投稿し、管理者承認後に表示される事実確認情報
まだ承認済みのファクトチェックはありません。
関連記事
こんな記事も読まれています

JR東海、時速285kmの新幹線車内で「誤差3m以内」の位置取得に成功 設備投資ゼロ(CNET Japan)
2026/6/10

【阪神】史上初!高橋遥人&佐藤輝明が2カ月連続の月間MVP 同一球団の同じ2選手受賞は初(日刊スポーツ)
2026/6/10

セゾンテクノロジー、企業のAI活用を統合的に運用管理するAI業務実行基盤「Agent Orchestration」を提供(クラウド Watch)
2026/6/10

【オリックス】杉沢龍が1軍合流! 右手首の骨折から復活 チーム屈指の元気印が再反攻の起爆剤に(スポーツ報知)
2026/6/10

【ラグビー】日本代表合宿メンバー35人発表 リーグワンV神戸から6人、大学生3人選出/一覧(日刊スポーツ)
2026/6/10
コメント (0)
まだコメントはありません。最初のコメントを書いてみましょう。
この記事について疑問がありますか?
事実誤認や不適切な内容について通報できます (要ログイン)。
異議申し立て・通報



