TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年6月5日
NVIDIA Nemotron 3 UltraがAmazon SageMaker JumpStartで利用可能に
NVIDIA Nemotron 3 UltraをAmazon SageMaker JumpStartにデプロイできるようになった。このフロンティア推論モデルにより、エージェンティックAIワークロードで5倍高速な推論と30%低いコストが実現される。
AWS Machine Learning Blog
2026年6月5日
NVIDIA、推論5倍速で無償の550Bエージェント向けLLM「Nemotron 3 Ultra」
米NVIDIAは6月4日(現地時間)、複雑なタスクを処理する自律型エージェント向けの推論モデル「NVIDIA Nemotron 3 Ultra」(Nemotron 3 Ultra 550B-A55B)を公開した。
PC Watch
2026年6月5日
AIニュースノート：Gemma 4 12B公開、Nemotron 3 Ultra公開、画像モデルReve 2.0／Ideogram 4.0公開、ChatGPTメモリー改善、Hermes Desktop公開など
gihyo.jpのニュース記事として取り上げていなかったもののなかから、直近（2026年6月3日〜5日頃）に発表・公開されたAI関連の興味深いニュースの概要を簡単にまとめてみました。
gihyo.jp
2026年6月16日
Nemotron 3 Ultra：エージェント推論のためのオープンで効率的なMixture-of-ExpertsハイブリッドMamba-Transformerモデル
5500億の総パラメータと550億のアクティブパラメータを持つMixture-of-ExpertsハイブリッドMamba-Attention言語モデル「Nemotron 3 Ultra」を紹介します。Nemotron 3 Ultraは20兆トークンのテキストで事前学習され、その後コンテキスト長を100万トークンに拡張し、教師ありファインチューニング（SFT）、強化学習（RL）、マルチティーチャー・オンポリシー蒸留（MOPD）を用いて事後学習されました。Nemotron 3 Ultraは、LatentMoE、マルチトークン予測（MTP）、NVFP4事前学習、マルチ環境RLVR、MOPD、推論バジェット制御といった複数の主要技術を採用した、これまでにない最も高性能なモデルです。Nemotron 3 Ultraは、最先端の公開LLMと比較して最大約6倍高い推論スループットを達成しながら、同等の精度を実現しています。最先端の精度、高い推論スループット、100万トークンのコンテキスト長により、Nemotron 3 Ultraは長期間実行される自律エージェントタスクに最適です。
arXiv cs.CL