TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月29日
後付け修正によるニューロシンボリック知識グラフの構築：オントロジーに基づくアプローチ
arXiv:2605.29168v1 文書の発表。質問応答（QA）はAIの中核的な課題であり、特に複数の文書間でのマルチホップ推論や集約や完全リスティングなどのシンボリック操作を必要とする複雑なクエリに対応する必要があります。検索拡張生成はQAの主流アプローチとなり、最近のグラフベースのバリアントが追加されています。
arXiv cs.AI
2026年6月1日
GraphARC: グラフベース抽象推論の包括的ベンチマーク
知能の中核をなす関係推論が存在するが、既存ベンチマークは通常グリッドやテキストなどの形式に限定されている。グラフ構造データに対する抽象推論のベンチマークGraphARCを紹介し、Abstract Resoning Corpus（ARC）の少数ショット変換学習パラダイムを一般化する。
arXiv cs.AI
2026年6月1日
TraceGraph: エージェント軌跡の診断と改善のための共有決定ランドスケープ
エージェントベンチマークはますます豊富なインタラクション軌跡を記録していますが、評価では各ロールアウトを合格率または報酬スコアに還元することが多いです。TraceGraphは、リリースされたマルチモデルエージェント軌跡を共有決定ランドスケープに変換するグラフベースのフレームワークを紹介します。
arXiv cs.AI
2026年6月2日
TIGER:マルチモーダル生成における幻覚軽減のためのグラフベース証拠ルーティングによる追跡可能な推論
入力によってサポートされていない特定の事実を含む可能性のあるマルチモーダル生成のファクトレベルの修復を研究します。既存の推論時間修復方法は、入力と現在の出力の両方を条件として、フィードバックを生成します。この設計には2つの制限があります。
arXiv cs.AI
2026年6月19日
生成推薦のための分散ユーザー興味コンテキストの構造化とトークン化
生成AIを活用した推薦システムが進化する中で、ユーザーの過去の行動履歴から次の行動を予測する新たな手法に注目が集まっています。従来のシステムでは、複雑なユーザー行動パターンやアイテムが持つ意味合いを十分に捉え、推薦モデルに組み込むことが困難でした。こうした課題に対し、最新の研究では、包括的なグラフベースのアプローチを取り入れたスケーラブルなフレームワーク「G2Rec」が提案されています。このフレームワークは、ユーザーの興味に関する分散した情報を整理し、トークン化することで、推薦システムがより詳細なユーザーコンテキストを理解し、次のインタラクションを高い精度で予測できるようにすることを目指しています。G2Recのような新しい技術が実用化されれば、私たちの日常生活における製品やコンテンツの推薦が、これまで以上に個々のニーズに合った、よりパーソナライズされたものになることが期待されます。引用元: arXiv cs.AI
arXiv cs.AI
2026年6月24日
ModTGCN：テキスト分類のためのモジュラリティを考慮したグラフニューラルネットワーク
グラフベースのテキスト分類モデルは、通常、局所的な近傍集約に依存し、意味的な文書グラフが強力なクラス一致クラスタリングを示すにもかかわらず、グローバルなコミュニティ構造を見落としています。これを無視すると、クラス境界が不明瞭になり、過度の平滑化につながる可能性があります。本稿では、クロスエントロピーとモジュラリティベースの補助目的を共同で最適化し、クラスに一致する文書コミュニティを促進すると同時に、識別表現を維持する、テキスト分類のためのモジュラリティを考慮したグラフニューラルネットワークであるModTGCNを提案します。モジュラリティ項は、トランスフォーマー埋め込み（事前学習済みまたはファインチューニング済み）から派生した文書間類似性グラフで計算されます。スケーラビリティを向上させるために、元の異種TextGCNグラフを文書-単語および単語-単語の個別のコンポーネントに分離し、トレーニング速度を2倍から10倍向上させました。さらに、モジュラリティ最適化のためのグラフ構築戦略、ラベルを意識したエッジ再重み付け、および監視の選択について研究します。
arXiv cs.CL
2026年6月25日
ノイズのあるASRにおけるグラフベースの音韻誤り訂正
自動音声認識（ASR）システムは、全体的な単語誤り率は低いものの、固有表現、否定、感情表現などの意味的に重要なトークンに不均衡に影響を与える残存する語彙的誤りを生成します。これらの誤りは、ランダムなノイズではなく音韻的な類似性から生じる構造的なものであることが多く、単純なトークンレベルの訂正では不十分です。本稿では、音韻グラフモデリングと文脈言語理解を組み合わせた、G-SPINと呼ぶ構造化ASR訂正フレームワークを提案します。まず、グラフニューラルネットワーク（GNN）が、フラグ付けされたトークンに対して音響的に妥当な候補近傍を構築し、訂正検索空間を音韻的代替案に明示的に制限します。次に、マスク言語モデル（MLM）がローカルな文脈スコアリングを提供し、指示チューニングされた大規模言語モデル（LLM）が、このコンパクトな候補セットに対して最終的な文脈認識再ランキングを実行します。構造化された音韻的推論と文脈意味的選択を分離することにより、本手法は制約のない生成を回避しつつ、訂正精度を向上させます。このフレームワークは軽量でモジュール化されており、推論時に完全に動作します。
arXiv cs.CL