TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月22日
AI時代における創造性のスケーリング
ストーリーテリングは人類のDNAの中核であり、理想、警告、希望、経験を表現したいという衝動に由来しています。テクノロジーは常に...
MIT Technology Review AI
2026年5月28日
AI ファクトリー：インテリジェンスの新しいインフラストラクチャ
AIファクトリーはトークンファクトリーであり、電力をリアルタイムでインテリジェンスに変換しています。エージェンシャルAIがスケーリングし、自律的で常時稼働する特別なエージェントがエンタープライズに配備されると、ワットあたりのパフォーマンスは...
NVIDIA Blog
2026年5月29日
安定性-表現性ギャップの橋渡け: 低資源音声言語モデルの合成データスケーリングと優先度調整
音声言語モデル(SLM)は明示的な音素グラフ変換パイプラインをバイパスすることで音声合成の有望なパラダイムとして出現しています。ただし、低資源言語での有効性は転記済み音声の不足によって根本的に制限されています。実践では、合成データが重要になっています。
arXiv cs.CL
2026年6月1日
UniScale: モデルルーティングとテスト時スケーリングのオンライン共同最適化による適応的統一推論スケーリング
大規模言語モデル(LLM)の実世界展開では、推論品質と計算コストのバランスが中心的な課題となっています。既存のアプローチはこのトレードオフに対して、主に独立した2つの次元に沿って対処しています。モデルルーティング機能は異なるスケールのモデル間で切り替えて要件に対応します。
arXiv cs.AI
2026年6月2日
ユニバーサル・クォンタム・トランスフォーマー
arXiv:2606.00045v1発表タイプ：新規抄録：古典的な連続空間ニューラルネットワークは、モジュロ演算や非可換代数などの厳密な数学的対称性にロックインするのに本質的に苦労している。これらの離散的な論理規則を近似するために、しばしば膨大なパラメータスケーリングに頼り、その後でも確率的不安定性をもたらす。
arXiv cs.AI
2026年6月2日
モデルネイティブコンピューティングアーキテクチャ: コンピュータアーキテクチャの観点から見た将来のシステムアーキテクチャの構想
大規模言語モデルはモデル技術からシステム技術への転換期を迎えています。開発者がCodex、Claude Code、AutoGPTおよび関連エージェントを使用してコードを作成し、プロジェクトを管理し、複数ステップのタスクを実行する際に、キャッシュの再利用、コンテキスト管理、エージェントスケーリングなどの反復的なエンジニアリング課題が発生します。
arXiv cs.AI
2026年6月2日
トラベラーズがOpenAIを使用したAI搭載クレームアシスタントを全国展開
トラベラーズはOpenAIと共にAI搭載のクレームアシスタントを構築し、顧客がクレーム申請をガイドし、24時間対応のサポートを提供し、ピーク時の業務をスケーリングできるようにしました。
OpenAI
2026年6月6日
天文学: 観測に基づいた最高宇宙線エネルギーの制約(Nature)
今回、探査機ジュノーによる木星の観測結果から、過渡的現象のサイズを粒子の最高エネルギーと結び付ける、普遍的なスケーリング則が明らかになった。このモデルは、惑星のバウショックから超新星残骸まで幅広い環境に適用でき、宇宙線エネルギーを予測する新しい手法を提供する。
Nature 日本語
2026年6月8日
CARVE-Q: 量子提案、古典的に認証された対話型運転修復
本論文では、運転操作が拒否された後、その修復が安全規則、優先権、コスト配分、およびエゴフォールバックを尊重することを証明する必要があるという問題に対処する。CARVE（拒否操作の修復の認証付き低コスト包絡線）は、予測なしで対話型修復の証明書アーキテクチャを提供する。拒否操作が与えられた場合、CARVEは有限修復ラティスを構築し、バインディングルール、選択された共同修復、優先権スケーリング協力包絡線、責任加重コスト分割、およびエゴのみフォールバックを記録した構造化証明書を発行する。多所有者修復が積ラティスM = ∏_j |𝒜_j|を誘発することから、CARVE-Qは量子最小値探索を黒箱ラティスにのみ適用し、すべての安全権限は古典的なままとする検証者シールド量子AI探索層を導入する。古典的最小値探索がΘ(M)クエリを必要とするのに対し、Dürr-Hoyerおよびgrover最小値探索はO(√M)オラクルクエリを使用する。
arXiv cs.AI
2026年6月8日
位置論文：「ポスプロで直すな」—AIの科学は訓練ダイナミクスを研究する必要がある
本位置論文は、AIに対する科学的理解とは何かを問う。モデルは静的なオブジェクトではなく、データ、目的関数、アーキテクチャ、最適化ダイナミクスによって形成される時間発展するプロセスのスナップショットである。しかし、AI研究の多くはモデルを固定的な産物として扱い、訓練後の振る舞いを分析するのみで、その出現理由を問わない。本論文は、AIの科学は事後的な修正を超えて、モデルの振る舞いを生み出す訓練ダイナミクスを研究する必要があると主張する。そのような科学は、段階的により強い形の理解をサポートすべきである：初期の訓練信号から結果を予測し、軌跡が誤った時に介入し、最終的には望ましい特性をより確実に生み出す訓練手続きを設計すること。スケーリング則は損失の予測を日常化させたが、課題は能力、偏り、ロバスト性、安全性関連の振る舞いにこの成功を拡張することである。本論文は科学の歴史と哲学に基づいた理論の要件を明示し、機械的解釈可能性、公平性、記憶化、単純性バイアスの進展を検討し、具体的な未解決問題を特定する。
arXiv cs.AI
2026年6月8日
加速フーリエSAT（AFSAT）：GPUベースの対称疑似ブール充足可能性ソルバーの完全実現
連続局所探索（CLS）に基づく疑似ブール充足可能性問題向けのGPU加速ソルバーであるAccelerated Fourier SAT（AFSAT）を提案する。AFSATは概念実証的なアプローチであるFastFourierSATを完全に実装されたソルバーへと発展させ、単一の問題インスタンス内で任意の異種対称制約タイプおよび長さの混合に対応する。JAXコンパイラを使用し、AFSATは純粋関数合成、自動ベクトル化、自動微分、ジャストインタイム（JIT）コンパイルを活用して、候補割り当てのバッチ全体で大規模並列CLSを実行する。概念実証と比較して、数値安定性、実行時性能、メモリ効率の大幅な改善を実証する。メモリレイテンシおよび浮動小数点表現から生じる様々な制限を特定・対処し、自動並列化とコンパクト表現を活用することで実現している。浮動小数点の本質的な表現および安定性の制限は、カスタマイズされた離散フーリエ変換実装により部分的に対処される。JAXアレイシャーディングを通じて複数のアクセラレータにスケーリングする際に、ほぼ線形のスループットを達成する。
arXiv cs.AI
2026年6月11日
大規模言語モデルのための互換性認識型動的ファインチューニング
arXiv:2606.11206v1 新規投稿概要：教師ありファインチューニング（SFT）は、大規模言語モデル（LLM）の調整における主要なパラダイムですが、最適化の不安定性と限定的な汎化性能に悩まされています。最近の研究では、この問題を病的な勾配スケーリングに起因するものとし、トークンレベルでそれを修正するために動的ファインチューニング（DFT）を提案しています。しかし、DFTはすべてのデモンストレーションが同等に適切な学習ターゲットであると仮定しますが、大規模な命令データセットの強い異質性により、デモンストレーションとポリシーの不一致がサンプルレベルで高分散の更新を引き起こすため、この仮定は破られます。本稿では、サンプルレベルの最適化分散を制御するDFTの原理的な拡張である、互換性認識型動的ファインチューニング（CADFT）を導入します。CADFTは、モデルの尤度から動的でポリシー依存の互換性信号を導出し、教師あり更新を調整して、互換性のないデモンストレーションからの高分散勾配を抑制します。
arXiv cs.CL
2026年6月16日
Dr-DCI: ダイナミックなワークスペース拡張による直接コーパスインタラクションのスケーリング
大規模コーパスでのエージェント検索は、スケーラブルな候補発見のためにリトリーバーを介したインターフェース（例：BM25またはColBERT）に依存しています。これらのインターフェースは関連文書を効果的にランキングしますが、証拠をランキング結果または制限された文書ビューとしてのみ提示するため、エージェントが素材を再編成したり、文書間の制約を検証したりする能力を制限します。直接コーパスインタラクション（DCI）は、柔軟な検索、フィルタリング、比較、検証のためのシェル実行可能なコーパス操作を公開することで、この制限に対処します。しかし、コーパスが成長するにつれて、フルコーパスのターミナルコマンドは遅くなり、不安定になるため、パフォーマンスと効率が低下します。本研究では、リトリーバー誘導型DCIフレームワークであるDR-DCIを提案します。これは、検索をローカルワークスペースを拡張するためのエージェント呼び出し可能なアクションとして扱います。エージェントは、フルコーパスを直接操作するのではなく、関連文書を動的に進化するワークスペースにプルし、その中でDCI操作を実行します。
arXiv cs.AI
2026年6月16日
分離可能なニューラルアーキテクチャを物理世界モデルとして：数学理論から応用まで
本研究では、ニューラル近似とテンソル分解を組み合わせた関数表現クラスである分離可能ニューラルアーキテクチャ（SNA）を紹介します。SNAは、局所的な座標関数（アトム）と、スパースで低ランクの相互作用オブジェクトによって管理されるグローバルな相互作用を分離します。このアーキテクチャは、偏微分方程式（PDE）の解法に適した、コンパクトで滑らかな誘導バイアスを備えています。変分SNA（VSNA）フレームワーク下でのギャーキン試行空間として見ると、この定式化はラックス・ミルグラムの古典的な変分保証（適切性、準最適性、収束性、安定性）を満たします。高次元の時空間・パラメトリックPDEにおいて、VSNAは指数関数的ではなく代数的にスケールすることで次元の呪いを軽減します。完全に因子化されたテンソルネイティブな交互最小二乗（ALS）最適化フレームワークを利用することで、このコストは次元に対して線形になります。VSNAは、楕円系、双曲線系、放物線系のシステム全体で検証され、予測された代数的およびスペクトル的スケーリング率との密接な一致を示しています。
arXiv cs.LG
2026年6月17日
Amazon SageMaker AIにおけるコンテナキャッシュ機能の導入による、より高速なモデルスケーリング
本日、Amazon SageMaker AI推論におけるコンテナイメージキャッシュ機能を発表できることを嬉しく思います。これは、より高速なスケーリング最適化の旅における次なる大きな進歩です。これにより、スケールアウトイベント中の生成AIモデルのエンドツーエンドレイテンシが最大2倍高速化されます。
AWS Machine Learning Blog
2026年6月17日
並列サンプリングを超えて：エージェント検索のための多様なクエリ初期化
エージェント検索のテスト時スケーリングは、通常、深さ（すなわち、軌道あたりのターン数とトークン数）または幅（すなわち、並列ロールアウト数）を増加させます。ここでは幅のスケーリングに焦点を当て、標準的な並列サンプリングが収穫逓減をもたらすことを示し、これを最初のターンのクエリ冗長性に起因すると分析します。モデルがロールアウト全体で類似した最初のクエリを発行すると、スレッドは重複した証拠を取得し、その後のターンはその共有された取得に条件付けられます。この制限は、最初のターンでのトレーニング不要の介入であるDivInitで対処します。k個の独立した最初のクエリをサンプリングする代わりに、DivInitは1回の呼び出しからn個の候補を描画し、k < n個の多様なシードを選択し、それらを並列軌道として実行します。5つのオープンウェイトモデルと8つのベンチマーク全体で、DivInitは標準的な並列サンプリングを常に上回り、同等の計算量でのマルチホップQAで5〜7ポイントの平均向上をもたらしました。
arXiv cs.AI
2026年6月17日
薬物警戒における因果推論におけるモデル選択の重要性：InferBERTフレームワーク内での分類モデルの比較分析
因果関係のある有害薬物事象（ADE）を偽相関から区別することは、薬物警戒における中心的な課題です。InferBERTフレームワークは、TransformerモデルとDo-calculusを統合していますが、その成功は基盤となる分類モデルに依存します。本研究では、InferBERTにおけるモデル選択の影響を評価し、単純なモデルで十分か、ドメイン固有の事前学習が役立つか、LLMへのスケーリングが因果検出を改善するか、事後キャリブレーションの効果を検証します。分析対象は、Analgesics-induced Acute Liver Failure (AILF) と Tramadol-related Mortalities (TRAM) の2つのベンチマークです。XGBoost（ベースライン）、ALBERT（元のInferBERT）、BioBERT（生物医学Transformer）、Med-LLaMA（医療LLM）の4つのモデルを、20回の繰り返しで5分割交差検証を用いて評価しました。
arXiv cs.LG
2026年6月18日
JetFlow：並列ツリードラフティングで投機的デコーディングのスケーリング限界を打破
投機的デコーディング（SD）は、複数のトークンをドラフトし、それらを並列に検証することで、自己回帰型大規模言語モデル（LLM）を高速化しますが、スケーリング上の限界に直面しています。ドラフト予算を増やしても、受理率が高く、ドラフトのオーバーヘッドが低い場合にのみ速度が向上します。この限界は、従来のヘッドベースのSD手法が因果関係と効率性のジレンマに直面しているため、打破が困難でした。自己回帰型ドラフターは、パス条件付き候補を生成し、これらは高い受理長を持つツリー投機的デコーディングに効果的ですが、そのドラフトコストはツリーの深さに比例して増加します。双方向ブロック拡散ドラフターは、一度のパスですべての位置を生成しますが、そのブランチに依存しない周辺分布は、個々にはもっともらしくても相互に矛盾するツリーを形成する可能性があり、予算を無駄にし、受理率を低下させます。本稿では、ヘッドベースのSDフレームワークであるJetFlowを提案します。これは、ワンフォワードドラフティングの効率性とブランチごとの因果条件付けを組み合わせたものです。
arXiv cs.CL
2026年6月18日
フィッシャー幅：統計的多様体上の複雑さの幾何学的尺度
ガウシアン幅は、高次元確率論、圧縮センシング、凸最適化、学習理論における中心的な幾何学的複雑さの尺度です。これは、集合のランダムな方向への平均的な広がりを定量化し、それによって制約集合、仮説クラス、降下円錐の実効次元を捉えます。しかし、この概念は本質的にユークリッド的です。統計モデルは代わりに、フィッシャー情報計量によって誘起される自然なリーマン幾何学を運び、そこでは方向は周囲のユークリッド長ではなく、統計的な識別可能性に応じてスケーリングされます。本稿では、統計的多様体のためのガウシアン幅のフィッシャー幾何学的類推であるフィッシャー幅を導入します。パラメータ点 $ heta$ において、フィッシャー幅はユークリッド単位を局所計量テンソル $G( heta)^{1/2}$ で置き換え、フィッシャー再スケーリングされた集合のガウシアン幅を測定します。これにより、結果の量が局所的な統計的曲率に敏感になり、滑らかな再パラメータ化に対して不変になります。
arXiv cs.LG
2026年6月19日
SageMakerの詳細メトリクスとCloudWatchのインサイトダッシュボードで生成AI推論を監視・デバッグ
Amazon SageMaker AIは、機械学習モデル向けの完全マネージドなリアルタイム推論ホスティングを提供します。モデルを1つ以上のコンピューティングインスタンスでバックアップされたSageMakerエンドポイントにデプロイすると、SageMakerがプロビジョニングとスケーリングを処理します。SageMakerは複数のエンドポイントアーキテクチャをサポートしています。
AWS Machine Learning Blog
2026年6月21日
ゲーマーの動きを先読み。インテルの「フレーム外挿」ってどんなテクニック？
最近、やや食傷気味な人もいるだろう「AI」。とはいえ、AIとしては前進あるのみ。Intel（インテル）が進めるゲームでのアップスケーリング技術について、中の人に話をききました。今月に台湾で開催されたCOMPUTEXで米Gizmodoが話を聞…
GIZMODO Japan
2026年6月23日
固定予算を超えて：Tree-of-Thought推論戦略の非弾力性と限界の特性評価
Tree of Thought (ToT)探索は、大規模言語モデルの推論能力を向上させる有望な方向性となっていますが、これらの手法を実践的に展開する際には、計算予算、モデルサイズ、問題の難易度によって異なる検索戦略がどのように動作するか、という体系的な注意があまり払われてこなかった問題が生じます。本研究では、2つの代表的なToT手法、すなわちモンテカルロ木探索ベースのアプローチであるDPTSと、意味的重複排除ベースのアプローチであるSSDPを、2つの数学的推論ベンチマーク（Math500およびGSM8K）、2つのモデルスケール（Llama-3BおよびLlama-8B）、および4つのトークン予算（3k--10k）で評価します。分析により、これら2つの手法は相反する方向に働く限界を示すことが明らかになりました。DPTSは低予算でコールドスタートのボトルネックに悩まされます。価値推定が信頼できるようになるまで十分な探索が必要であり、高予算での強力なスケーリング動作にもかかわらず、リソースに制約のある設定には不向きです。
arXiv cs.AI
2026年6月23日
CSIネイティブ基盤モデルへ：6G向けチャネル適応型ロードマップ
無線基盤モデルは、第6世代（6G）システム向けの再利用可能なチャネル状態情報（CSI）インテリジェンスへの道を提供する。しかし、既存の汎用バックボーン適応およびCSI事前学習手法は、CSIを伝搬条件付きチャネル応答としてではなく、タスクテンソルとして扱うことが多く、無線環境の固有の時間・周波数・空間幾何学的特性を捉えきれていない。本稿では、CSIネイティブ基盤モデルに向けたチャネル適応型ロードマップを提示し、事前学習、位置モデリング、アテンション制御を3つのチャネル要件（スケール認識型異種公開、物理的時間・周波数・アンテナ座標、相関境界トークン相互作用）に整合させる統一フレームワークを提案する。広範な実験により、提案フレームワークのゼロショット汎化（空間・時間・周波数タスク全体でNMSEを4 dB以上削減）、スケール外挿（8倍の未知アンテナスケーリング下で最大5.4 dBのゲイン）、推論効率（モビリティ認識処理を最大18.8%高速化）の3つの次元での優位性が実証された。
arXiv cs.LG
2026年6月24日
4エキスパート混成モデルの体系的な探索：自動パイプライン検索による
LEMURニューラルネットワークデータセットエコシステム内における、混成4エキスパート混合モデル（MoE4）アーキテクチャの大規模自動探索パイプラインを提案します。手作業で設計された混成MoE参照モデルを基盤とし、手動設計を決定論的なコードアセンブリジェネレータに置き換え、LEMURデータベースから抽出したベースアーキテクチャファミリーを体系的に組み合わせてMoE4アンサンブルを生成します。各アンサンブルは、温度スケーリング、ミックスアップ拡張、コサインアニーリング学習率スケジューリングを備えた畳み込みゲーティングネットワークによって制御されます。NVIDIA RTX 4090での28日間のキャンペーン中、パイプラインは197バッチにわたって4,463の候補モデルを生成し、そのうち1,021が正常に評価されました。キャンペーンから重要な発見がありました。itertools.combinationsによるアルファベット順列挙のため、探索された全探索空間（理論的に可能な23,751の4ファミリー組み合わせの4.8%）は単一のファミリー、AirNetに固定されています。
arXiv cs.LG
2026年6月25日
エージェント型AIへのガイド：基礎からシステムまで
「エージェント型AIへのガイド」は、自律型AIシステム構築のための包括的な実践者向けリファレンスです。本書は、最初の原則から本番展開までのフルスタックを網羅しており、優れたエージェント型システムを構築するには、パイプラインの単一のレイヤーだけでなく、すべてのレイヤーを理解する必要があるという中心的なテーゼを中心に構成されています。まず、LLM基盤（トランスフォーマーアーキテクチャ、GPUシステム、トレーニングとファインチューニング（SFT、LoRA、MoE）、モデル圧縮、推論最適化）を、主要な焦点ではなく、不可欠な基盤として扱います。次に、アライメントと推論レイヤー（RLHF、PPO、DPOとそのバリアント、GRPO、報酬モデリング、チェーン・オブ・ソートやテストタイムスケーリングを含む大規模推論モデルのためのRL）を開発します。後半は、エージェント型AIそのものに充てられています。
arXiv cs.AI
2026年6月26日
SeedVR2をAmazon SageMaker AIにデプロイして超解像度を実装する
この記事では、SageMaker AI上のSeedVR2を使用したビデオアップスケーリングの実装方法を解説します。ソリューションアーキテクチャ、デプロイ手順、そして達成できる品質向上と処理効率を強調するパフォーマンス比較を紹介します。この記事を読み終える頃には、この超解像度ソリューションを実装するために必要な実践的な知識が得られるでしょう。
AWS Machine Learning Blog
2026年7月1日
成果報酬モデルによるテキストからSQLへのテスト時検証
推論時の大規模言語モデル（LLM）の信頼性向上は、テキストからSQLへの変換のような構造化推論タスクにおける中心的な課題です。Best-of-Nサンプリングや多数決などの一般的なテスト時推論戦略は、実行成功や出力頻度などのヒューリスティックな信号に依存していますが、候補出力間の意味的な識別能力は限られています。本研究では、テキストからSQLへの変換におけるテスト時検証のための学習済み意味スコアリング関数として、成果報酬モデル（ORM）を検討します。ORMは以前からテスト時のスケーリングやアライメントに検討されてきましたが、構造化クエリ生成への応用は十分に探求されていませんでした。自動化された候補生成と実行ベースのラベリングによるタスク固有ORMのトレーニングのためのスケーラブルなフレームワークであるGradeSQLを導入し、手動アノテーションなしでの検証器トレーニングを可能にします。ORMを検証駆動型Best-of-Nパイプラインに統合し、複数のオープンソースLLMファミリーにわたるBIRDおよびSpiderベンチマークでアプローチを評価します。
arXiv cs.CL
2026年7月1日
AgRefactor：HLS互換性とパフォーマンスのための自己進化型エージェントワークフロー
High-Level Synthesis（HLS）は、コンセプトからシリコンへの高速なパスを提供しますが、現実世界のソフトウェアを合成可能なHLSコードに変換することは、制限された言語サポートとソフトウェアとハードウェアのプログラミングプラクティスのギャップにより、依然として困難です。既存の自動化およびLLMベースのリファクタリングアプローチは、この問題に部分的に対処していますが、柔軟性に欠け、スケーリングに苦労し、高い計算コストがかかることがよくあります。本稿では、ソフトウェアをHLS互換プログラムにリファクタリングするためのLLMベースのマルチエージェントワークフローであるAgRefactorを紹介します。AgRefactorは、タスク間で事実的および戦略的な知識を蓄積および取得する自己進化型メモリシステムを組み込んでおり、未知のプログラムに対する堅牢性と効率性を向上させます。コストを削減し、スケーラビリティを向上させるために、自動リファクタリングツールを統合しており、エージェントはLLM駆動のリライトと効率的なツールベースの変換のバランスをとることができます。
arXiv cs.AI
2026年7月2日
計算予算内での推論におけるリスク管理、コンフォーマル思考
大規模言語モデル（LLM）による推論は、テスト時にスケーリングを可能にし、トークン予算が増加するにつれてデータセットレベルの精度が向上します。これにより、信頼性を向上させる場合はトークンを消費し、追加の計算が役立たない可能性が高い場合は早期に停止する適応的推論が促進されます。しかし、トークン予算の設定、および適応的推論のしきい値の設定は、根本的なリスクと精度のトレードオフを伴う実践的な課題です。
Apple Machine Learning Research
2026年7月3日
高次元におけるグリッドベース近似最近傍探索のスケーリング則
近似最近傍（ANN）探索のためのグリッドベースアプローチは、現代のスケーリング分析からは欠落していました。本稿では、データセットサイズNと次元数dに関するマルチプローブグリッドアルゴリズムの体系的な特徴付けを提示します。実験により、GloVe埋め込みファミリにおいて、これまで報告されていなかったdスケーリングのクロスオーバーが明らかになりました。このクロスオーバーにおいて、マルチプローブグリッド探索は他のグラフベース、ツリーベース、パーティショニングベースの方法がスループットの低下を示すのに対し、ほぼ一定の次元スケーリング指数を維持します。この利点は、Nにおけるほぼ線形のクエリのスケーリングと、競合するANN手法よりも低いインデックス作成コストと引き換えに得られます。本研究の結果は、マルチプローブグリッドのようなグリッドベースの手法が、インデックス作成コストと次元ロバスト性がパフォーマンスを決定する、再構築が多い、あるいは高次元の設定で競争力を持つ可能性を示唆しています。より広範には、最近の研究は自己注意機構をANN操作として形式化しました。
arXiv cs.LG