TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月8日
GitHub エージェンティック・ワークフローのトークン効率を改善する
すべてのプルリクエストで実行されるエージェンティック・ワークフローは、API請求額を静かに積み重ねることができます。本記事では、独自の本番環境ワークフローを計測し、非効率性を見つけ、それらを修正するエージェントを構築した方法について説明します。
GitHub Blog (AI)
2026年5月13日
NVIDIA、Ineffable Intelligenceが強化学習インフラストラクチャの未来構築で協力
試行錯誤を通じて学習するAIシステムである強化学習エージェントは、計算を新しい知識に変換することができます。これがNVIDIAとIneffable Intelligenceの新しいエンジニアリングレベルの協業の焦点です。
NVIDIA Blog
2026年5月19日
NVIDIACEOジェンセン・フアンがDell Technologies World：「需要は放物線を描いて増加しており、全く放物線的です」
NVIDIAベラ・ルービンNVL72による1トークンあたり10分の1のコストでのエージェンティックAI推論。エージェント・サンドボックスはNVIDIAベラで従来のCPUより50%高速に実行され、エンタープライズデータクエリは最大3倍高速です。
NVIDIA Blog
2026年5月19日
EpiCache: リソース制約のある環境での長期会話向けのエピソード的KVキャッシュ管理
最新の大規模言語モデル（LLM）は、コンテキスト長を数百万トークンまで拡張し、長い会話履歴に基づいた一貫性のあるパーソナライズされた応答を実現しています。しかし、キー・バリュー（KV）キャッシュが...
Apple Machine Learning Research
2026年5月21日
グーグルがOpenAIを抜き、消費者向けAIの王座を奪う
しかし、ユーザーは毎月数十億のトークンを消費しており、コスト面での課題が浮き彫りになっている
The Economist Business
2026年5月28日
AI ファクトリー：インテリジェンスの新しいインフラストラクチャ
AIファクトリーはトークンファクトリーであり、電力をリアルタイムでインテリジェンスに変換しています。エージェンシャルAIがスケーリングし、自律的で常時稼働する特別なエージェントがエンタープライズに配備されると、ワットあたりのパフォーマンスは...
NVIDIA Blog
2026年5月29日
金や石油と同じく、間もなくAIトークン先物を取引できるようになる
大手取引所はAIトークンを中心とした派生商品を設計している。AIトークンは、計算上の産出物というより、むしろ原材料として見なされることが増えている。
TechCrunch
2026年5月29日
ReasonOps：LLM推論トレースのオペレータセグメンテーション
大規模推論モデルからの思考の連鎖トレースは数万のトークンに及ぶ可能性がありますが、その内部構造を説明するための語彙が不足しています。思考の連鎖トレースを分析するために開発された以前の方法は、あまりに厳格であるか表現力が不十分であり、領域全体の特徴を捉えられていません。
arXiv cs.AI
2026年5月29日
幻覚削減のための格子上のチェーンベース適応再構成
大規模言語モデルにおけるテスト時の幻覚削減のための確率的フレームワークであるCAROL（Chain-based Adaptive Reconfiguration Over Lattices）を導入します。トークンレベルの不確実性に依存するのではなく、CAROLは生成された結果間の一貫性に基づいて意味的不確実性測度を定義します。
arXiv cs.CL
2026年5月29日
連続性と順序性が重要：時系列分析における大規模言語モデルの効果的な利用のための時系列トークンの制約
トークンベースの時系列大規模言語モデル（TS-LLM）は時系列分析と推論の有望な方向として浮かび上がっています。しかし、先行研究は時系列トークンの本質的な連続性と順序性を見落としており、これはモデルパフォーマンスを大幅に制限しています。本論文では、これらの属性を制約することの重要性について述べます。
arXiv cs.LG
2026年5月29日
ペーパーエージェント、ペーパーゲイン: DeFi投資エージェントの実証分析
オンチェーン自動取引にAIを使用するDeFi投資エージェントは、2024年後半以来、合計30億米ドルを超えるトークン評価を達成しています。1,900以上のAIタグ付き暗号プロジェクトを調査し、投資焦点のエージェントにフィルタリングして、戦略にまたがる10の代表的なプロジェクトをキュレーションしました。
arXiv cs.AI
2026年5月29日
言語優先性の脱却: モダリティ認識ポリシー最適化によるオーディオ推論の後期段階モダリティ崩壊の軽減
オーディオと全モダリティ大規模言語モデルは印象的なクロスモーダル推論能力を示すが、これらのモデルに標準的な強化学習後処理アルゴリズムを適用すると、GRPO のような方法がすべてのトークンに均一なポリシー勾配を適用する構造的脆弱性が露呈する。
arXiv cs.CL
2026年5月30日
「Fable」のリリースが2027年2月に決定。6月8日配信の「Xbox Games Showcase 2026」での新発表を予定
Fableの新作が2027年2月にリリースされることが決定し、PlaygroundGamesが開発を担当しています。同社はForza Horizonシリーズの成功で知られ、広大なオープンワールド実装に定評があります。6月8日に配信されるXbox Games Showcase 2026では新たな情報が発表される予定で、マイクロソフトは大規模イベントを通じてゲームの魅力を世界に伝える戦略を展開するとのことです。15年以上のブランク期間を経ての新作となり、現代のAAAゲーム開発における課題解決が注目されています。
4Gamer.net
2026年5月31日
「冗談だ」：GitHub Copilotの新しいトークンベース課金が開発者の間で波紋を呼ぶ
マイクロソフトのGitHub Copilotの黄金期は終わりを迎えたようだ。
TechCrunch
2026年6月1日
Amazonがトークン消費を競うランキングボードを廃止…「トークン消費を目的に、AIを使わないで」
アマゾンは、従業員が作成したAIトーク消費ランキング「KiroRank」が過剰なAI投資を助長する恐れがあるとして、廃止したと明かしました。いま業界では、巨大テック企業内で成果に結びつかない過剰な「AIトークン消費」が経営を圧迫しかねないとして問題視され始めています。
Business Insider Japan
2026年6月1日
言語間での推測デコーディング
推測デコーディングは大規模言語モデル（LLM）の推論において重要な要素となり、複数のトークンをドラフト作成し並列検証することで高速な生成を実現している。しかし小規模ドラフトモデルは多言語対応で顕著な性能低下が生じる傾向にある。
arXiv cs.CL
2026年6月1日
COFT：大規模言語モデルにおけるフェアな思考の連鎖推論のための反事実適合デコーディング
arXiv:2605.30641v1 大規模言語モデル(LLM)は、思考の連鎖(CoT)生成中に社会的偏見を明らかにし、増幅する可能性がある。本論文では、デコード時にトークンレベルのフェアネス制御を適用する訓練不要のデコーディング方法であるCOFT（フェアな思考の連鎖）を提案し、分布自由の周辺有効性を保証する。
arXiv cs.CL
2026年6月2日
AIモデル切り替え基盤のOpenRouter、シリーズBで1億1,300万ドル調達——週あたり約25兆トークンを処理
AI ゲートウェイを提供する OpenRouter は現地時間5月26日、Google 親会社 Alphabet の成長投資ファンド CapitalG が主導するシリーズ B ラウンドで1億1,300万ドルを調達したと発 […]
THE BRIDGE
2026年6月2日
言語モデルにおける学習前段階の類似現象：遅延文法汎化の追跡
グロッキング（神経ネットワークが訓練データに適合した後に長時間にわたって汎化する現象）は、多くのエポックでの教師あり設定において研究されています。LLM学習前段階は代わりにラベルなしコーパス上の次トークン予測に関与し、データ反復が限定的で明示的な訓練/検証分割がない状況です。
arXiv cs.LG
2026年6月2日
SENSE: 検索ベースの推測的デコーディングのためのセマンティック埋め込みナビゲーション（ソフトゲート評価付き）
推測的デコーディング（SD）は軽量なドラフトモデルを使用して候補トークンを提案し、ターゲットモデルによって並列で検証することで、大規模言語モデル（LLM）の推論を加速化します。生成品質を損なわないまま実現されます。検索ベースの推測的デコーディング（RSD）はその利点から好まれています。
arXiv cs.CL
2026年6月2日
BudgetDraft：スパースKV推測デコーディング用の受け入れ認識マルチビュー訓練
推測デコーディングは、ドラフタが複数のトークンを提案し、検証者が並列で検証することによって、自己回帰デコーディングを高速化します。リソース制約のあるデプロイメントでは、ドラフタはスパースKVキャッシュを使用して、固定KV予算下でのピークGPUメモリとエンドツーエンドレイテンシを制限し、検証者が検証します。
arXiv cs.LG
2026年6月2日
ARCA：トークン信号が退化した場合のアダプタ残差クレジット割当
言語モデルの強化学習におけるトークンレベルのクレジット割当は、通常、ポリシーが完全に訓練可能であるかのように定式化されていますが、実際のLLM-RLパイプラインはパラメータ効率の良い微調整、特にLoRAに依存することが多いです。本論文はこの分離が構造的な失敗モードを隠していることを主張しています。
arXiv cs.LG
2026年6月2日
BitsMoE: MoE LLM量子化のための効率的なスペクトルエネルギー誘導ビット割り当て
Mixture-of-Experts（MoE）大規模言語モデルはスパース専門家活性化を通じてトークンあたりの計算を削減しますが、すべての専門家の重みをメモリに保持する必要があるため、展開はメモリ集約的です。既存のMoE圧縮方法は超低ビット領域での対応に苦労しています。
arXiv cs.LG
2026年6月2日
近未来ガイダンスを通じたオンポリシー蒸留における推論軌跡の橋渡し
オンポリシー蒸留（OPD）は、教師の監督下で自身のポリシーからサンプリングされた軌跡について学生モデルを訓練することで大規模言語モデルの推論を改善します。OPDは軌跡上で動作しますが、その学習シグナルはトークンレベルのままです。高損失トークンを通じて逸脱を特定します。
arXiv cs.CL
2026年6月3日
マイクロソフト、クラウド不要のAIモデル実行デバイス「Surface RTX Spark Dev Box」を発表
マイクロソフトが開発者向けデスクトップPC「Surface RTX Spark Dev Box」を発表した。同製品はNvidia製のBlackwell RTXプロセッサと128GBのメモリを搭載し、ローカル環境で大規模AIモデルの実行を実現する。従来、大規模な言語モデルやAIモデルはクラウドサービスを通じて利用されてきた。その際、ユーザーはトークン数に応じた課金が必要であった。新デバイスは120億パラメータを超えるAIモデルをオンプレミスで直接実行できるため、クラウド依存からの脱却を可能にする。これにより開発者はネットワーク接続に左右されず、継続的な利用料を発生させることなくAI開発を進められる。マイクロソフトがクラウドベースの課金モデルへの代替案を提供する形となり、AIアクセスの民主化をさらに推し進める施策として注目される。（引用元：VentureBeat AI）
VentureBeat AI
2026年6月3日
想像的知覚トークンがマルチモーダル言語モデルの空間推理を強化
ビジョン言語モデルの空間推理能力向上に新たなアプローチ人工知能の研究領域で、視覚情報と言語を組み合わせて処理するビジョン言語モデル（VLM）が、直接見えない空間の推理が難しいという課題に対する解決策が提案された。研究者らは「想像的知覚トークン」という手法を開発し、モデルが観察できない領域の情報を補完できるようにした。この手法は、視点が変わった時の物体の位置推測や、障害物で隠れている空間での経路追跡といった3つのタスクで検証されている。研究では約20,000例の新規データセットを構築し、BAGEL骨格と呼ばれるシステムに新手法を組み込んで評価。結果として、従来のテキストベースの推論方法を上回る性能を達成したという。この進歩により、VLMはより複雑な3次元空間の理解へ向けた一歩を踏み出す可能性がある。（arXiv cs.AI）
arXiv cs.AI
2026年6月3日
スタートアップのEverandが電子書籍、オーディオブック、ブッククラブをバンドルしてアマゾンに対抗
Everandからの新しい読書サブスクリプションは、電子書籍とオーディオブックの両方へのアクセス、およびFableのブッククラブコミュニティを提供します。
TechCrunch
2026年6月3日
アリババのQwen3.7-Plusがテキスト・動画・画像入力に対応、1M トークン当たり$0.4/$1.6の低価格だがプロプライエタリ
中国のアリババは、マルチモーダル対応の大規模言語モデル「Qwen3.7-Plus」を発表した。テキストに加え、動画と画像の入力に対応する同モデルは、前世代比で60%のコスト削減を実現し、1Mトークン当たりテキスト入力は0.4ドル、動画・画像入力は1.6ドルの価格設定となっている。一方で、同社は商用利用をAPIおよび「Qwen Chat」を通じた有償ライセンスに限定。プロプライエタリ(非公開)ライセンスでのみ提供する方針を明確にした。これまでオープンソースモデルの提供に注力してきたアリババにとって、戦略的な転換点となる。低コストと高性能を両立させた点は評価される一方、オープンソースを活用するユーザーからの反発が懸念される。（引用元：VentureBeat AI）
VentureBeat AI
2026年6月3日
AIエージェントのトークン代を節約するNetflixのエンジニアが作ったツール「Headroom」について調べてみた - Qiita
Claude CodeなどのAIエージェントを日常的に使っていると、あっという間に制限に引っ掛かることがありませんか？ Netflixのシニアエンジニアがオープンソースとしてリリースした「Headroom」というトークン削減ツールが、数日で 6k stars・400 forks を超えて(2026/…
はてなブックマーク IT
2026年6月3日
SPAのトークン、localStorageに置いていい? OWASP ASVS 5.0で変わった答え
はじめに GMOコネクトの永田です。「SPAのアクセストークン、localStorage に置いていいんでしたっけ?」と聞かれて、「ダメだった気がする」と答えかけて手が止まりました。自分の知識が数年前で止まっていたからです😇 確認したら、答えは変わっていました。OWAS...
Qiita 人気記事