TOPIC TIMELINE
タイムライン検索
特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。
2026年5月8日
GitHub エージェンティック・ワークフローのトークン効率を改善するすべてのプルリクエストで実行されるエージェンティック・ワークフローは、API請求額を静かに積み重ねることができます。本記事では、独自の本番環境ワークフローを計測し、非効率性を見つけ、それらを修正するエージェントを構築した方法について説明します。
GitHub Blog (AI)
2026年5月19日
NVIDIACEOジェンセン・フアンがDell Technologies World:「需要は放物線を描いて増加しており、全く放物線的です」NVIDIAベラ・ルービンNVL72による1トークンあたり10分の1のコストでのエージェンティックAI推論。エージェント・サンドボックスはNVIDIAベラで従来のCPUより50%高速に実行され、エンタープライズデータクエリは最大3倍高速です。
NVIDIA Blog
2026年5月19日
EpiCache: リソース制約のある環境での長期会話向けのエピソード的KVキャッシュ管理最新の大規模言語モデル(LLM)は、コンテキスト長を数百万トークンまで拡張し、長い会話履歴に基づいた一貫性のあるパーソナライズされた応答を実現しています。しかし、キー・バリュー(KV)キャッシュが...
Apple Machine Learning Research
2026年5月21日
グーグルがOpenAIを抜き、消費者向けAIの王座を奪うしかし、ユーザーは毎月数十億のトークンを消費しており、コスト面での課題が浮き彫りになっている
The Economist Business
2026年5月28日
AI ファクトリー:インテリジェンスの新しいインフラストラクチャAIファクトリーはトークンファクトリーであり、電力をリアルタイムでインテリジェンスに変換しています。エージェンシャルAIがスケーリングし、自律的で常時稼働する特別なエージェントがエンタープライズに配備されると、ワットあたりのパフォーマンスは...
NVIDIA Blog
2026年5月28日
高市首相、語気強め文春報道否定 中傷動画流布「ないものはない」高市首相は記者会見で、文春報道と中傷動画流布に関する疑惑について「ないものはない」と強く否定しました。政治指導者が疑惑に対抗する手段として言語的反論は重要ですが、抽象的な否定表現は逆に疑念を深める傾向があります。現代政治では「説明責任」の定義自体が曖昧で、政治家側は「反論した」ことで務めを果たしたと考える一方、市民や報道機関は具体的な証拠や第三者検証を求めており、この認識のズレが政治的信任危機を招いているのです。
時事通信
2026年5月29日
金や石油と同じく、間もなくAIトークン先物を取引できるようになる大手取引所はAIトークンを中心とした派生商品を設計している。AIトークンは、計算上の産出物というより、むしろ原材料として見なされることが増えている。
TechCrunch
2026年5月29日
ReasonOps:LLM推論トレースのオペレータセグメンテーション大規模推論モデルからの思考の連鎖トレースは数万のトークンに及ぶ可能性がありますが、その内部構造を説明するための語彙が不足しています。思考の連鎖トレースを分析するために開発された以前の方法は、あまりに厳格であるか表現力が不十分であり、領域全体の特徴を捉えられていません。
arXiv cs.AI
2026年5月29日
連続性と順序性が重要:時系列分析における大規模言語モデルの効果的な利用のための時系列トークンの制約トークンベースの時系列大規模言語モデル(TS-LLM)は時系列分析と推論の有望な方向として浮かび上がっています。しかし、先行研究は時系列トークンの本質的な連続性と順序性を見落としており、これはモデルパフォーマンスを大幅に制限しています。本論文では、これらの属性を制約することの重要性について述べます。
arXiv cs.LG
2026年5月29日
ペーパーエージェント、ペーパーゲイン: DeFi投資エージェントの実証分析オンチェーン自動取引にAIを使用するDeFi投資エージェントは、2024年後半以来、合計30億米ドルを超えるトークン評価を達成しています。1,900以上のAIタグ付き暗号プロジェクトを調査し、投資焦点のエージェントにフィルタリングして、戦略にまたがる10の代表的なプロジェクトをキュレーションしました。
arXiv cs.AI
2026年5月29日
幻覚削減のための格子上のチェーンベース適応再構成大規模言語モデルにおけるテスト時の幻覚削減のための確率的フレームワークであるCAROL(Chain-based Adaptive Reconfiguration Over Lattices)を導入します。トークンレベルの不確実性に依存するのではなく、CAROLは生成された結果間の一貫性に基づいて意味的不確実性測度を定義します。
arXiv cs.CL
2026年5月29日
言語優先性の脱却: モダリティ認識ポリシー最適化によるオーディオ推論の後期段階モダリティ崩壊の軽減オーディオと全モダリティ大規模言語モデルは印象的なクロスモーダル推論能力を示すが、これらのモデルに標準的な強化学習後処理アルゴリズムを適用すると、GRPO のような方法がすべてのトークンに均一なポリシー勾配を適用する構造的脆弱性が露呈する。
arXiv cs.CL
2026年5月30日
トラヴィス・スコットのキャンプが疑惑の中傷陰謀者と連携法廷資料により、ラッパーのマネージャーがハリウッドの法務・PR専門家グループと協力して告発者を貶める工作を行っていた可能性が示される。
The Hollywood Reporter
2026年5月31日
「冗談だ」:GitHub Copilotの新しいトークンベース課金が開発者の間で波紋を呼ぶマイクロソフトのGitHub Copilotの黄金期は終わりを迎えたようだ。
TechCrunch
2026年6月1日
日本の債券利回りが40年ぶりの高水準に。予算案と高市首相の「警告信号」が市場を不安にさせている日本の債券利回りが40年ぶりの高水準に達した。予算案と高市首相からの「警告信号」が市場を不安にさせている。
CNBC World
2026年6月1日
Amazonがトークン消費を競うランキングボードを廃止…「トークン消費を目的に、AIを使わないで」アマゾンは、従業員が作成したAIトーク消費ランキング「KiroRank」が過剰なAI投資を助長する恐れがあるとして、廃止したと明かしました。いま業界では、巨大テック企業内で成果に結びつかない過剰な「AIトークン消費」が経営を圧迫しかねないとして問題視され始めています。
Business Insider Japan
2026年6月1日
COFT:大規模言語モデルにおけるフェアな思考の連鎖推論のための反事実適合デコーディングarXiv:2605.30641v1 大規模言語モデル(LLM)は、思考の連鎖(CoT)生成中に社会的偏見を明らかにし、増幅する可能性がある。本論文では、デコード時にトークンレベルのフェアネス制御を適用する訓練不要のデコーディング方法であるCOFT(フェアな思考の連鎖)を提案し、分布自由の周辺有効性を保証する。
arXiv cs.CL
2026年6月1日
言語間での推測デコーディング推測デコーディングは大規模言語モデル(LLM)の推論において重要な要素となり、複数のトークンをドラフト作成し並列検証することで高速な生成を実現している。しかし小規模ドラフトモデルは多言語対応で顕著な性能低下が生じる傾向にある。
arXiv cs.CL
2026年6月1日
高市首相 自民幹事長らに衆議院議員の定数削減で議論加速確認衆議院議員の定数削減をめぐり、高市総理大臣は自民党の鈴木幹事長らと会談し、日本維新の会が比例代表のみで45議席を削減するよう主張する中、与党内の意見集約に向け、削減方法などについて党内の議論を加速する…
NHK
2026年6月1日
高市首相がイラン大統領と電話会談 “米との合意に強く期待”高市総理大臣はイランのペゼシュキアン大統領と電話で会談し、アメリカとの合意が1日も早く得られるよう強く期待すると伝えるとともに、すべての国の船舶がホルムズ海峡を自由で安全に通過できるよう重ねて求めました。
NHK 国際
2026年6月2日
AIモデル切り替え基盤のOpenRouter、シリーズBで1億1,300万ドル調達——週あたり約25兆トークンを処理AI ゲートウェイを提供する OpenRouter は現地時間5月26日、Google 親会社 Alphabet の成長投資ファンド CapitalG が主導するシリーズ B ラウンドで1億1,300万ドルを調達したと発 […]
THE BRIDGE
2026年6月2日
自民 衆議院定数削減 高市首相の意向踏まえ議論急ぐ方針衆議院議員の定数削減をめぐり、自民党は、政治制度改革本部の役員会で高市総理大臣の意向も踏まえ、今の国会での法案提出に向け、具体的な削減方法や時期について議論を急ぐ方針を確認しました。
NHK
2026年6月2日
SENSE: 検索ベースの推測的デコーディングのためのセマンティック埋め込みナビゲーション(ソフトゲート評価付き)推測的デコーディング(SD)は軽量なドラフトモデルを使用して候補トークンを提案し、ターゲットモデルによって並列で検証することで、大規模言語モデル(LLM)の推論を加速化します。生成品質を損なわないまま実現されます。検索ベースの推測的デコーディング(RSD)はその利点から好まれています。
arXiv cs.CL
2026年6月2日
BitsMoE: MoE LLM量子化のための効率的なスペクトルエネルギー誘導ビット割り当てMixture-of-Experts(MoE)大規模言語モデルはスパース専門家活性化を通じてトークンあたりの計算を削減しますが、すべての専門家の重みをメモリに保持する必要があるため、展開はメモリ集約的です。既存のMoE圧縮方法は超低ビット領域での対応に苦労しています。
arXiv cs.LG
2026年6月2日
言語モデルにおける学習前段階の類似現象:遅延文法汎化の追跡グロッキング(神経ネットワークが訓練データに適合した後に長時間にわたって汎化する現象)は、多くのエポックでの教師あり設定において研究されています。LLM学習前段階は代わりにラベルなしコーパス上の次トークン予測に関与し、データ反復が限定的で明示的な訓練/検証分割がない状況です。
arXiv cs.LG
2026年6月2日
近未来ガイダンスを通じたオンポリシー蒸留における推論軌跡の橋渡しオンポリシー蒸留(OPD)は、教師の監督下で自身のポリシーからサンプリングされた軌跡について学生モデルを訓練することで大規模言語モデルの推論を改善します。OPDは軌跡上で動作しますが、その学習シグナルはトークンレベルのままです。高損失トークンを通じて逸脱を特定します。
arXiv cs.CL
2026年6月2日
ARCA:トークン信号が退化した場合のアダプタ残差クレジット割当言語モデルの強化学習におけるトークンレベルのクレジット割当は、通常、ポリシーが完全に訓練可能であるかのように定式化されていますが、実際のLLM-RLパイプラインはパラメータ効率の良い微調整、特にLoRAに依存することが多いです。本論文はこの分離が構造的な失敗モードを隠していることを主張しています。
arXiv cs.LG
2026年6月2日
BudgetDraft:スパースKV推測デコーディング用の受け入れ認識マルチビュー訓練推測デコーディングは、ドラフタが複数のトークンを提案し、検証者が並列で検証することによって、自己回帰デコーディングを高速化します。リソース制約のあるデプロイメントでは、ドラフタはスパースKVキャッシュを使用して、固定KV予算下でのピークGPUメモリとエンドツーエンドレイテンシを制限し、検証者が検証します。
arXiv cs.LG
2026年6月2日
高市首相 経済同友会代表幹事と会談 中東情勢めぐり意見交わす高市総理大臣は、経済同友会の山口代表幹事と会談し、中東情勢を受けた物資の目詰まりの解消などをめぐり、意見を交わしました。
NHK ビジネス
2026年6月2日
塗料やシンナーの原料 新たに石油元売りから直接供給 高市首相中東情勢をめぐり、高市総理大臣は、塗料やシンナーの原料となる「トルエン」などの石油化学製品について、新たに石油元売り各社から塗料やシンナーのメーカーに直接、供給することで、例年の需要の1.8倍の供給を可能にすると明らかにしました。
NHK ビジネス