News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2025年12月1日

    拡散モデルを用いた結晶構造の対称性を考慮した条件付き生成

    本記事は2025年度PFN夏期インターンシップで、拡散モデルを用いた結晶構造生成手法に取り組まれた石井孝憲さんによる寄稿です。   はじめに 2025年度の夏季インターンシップ に参加させていただきました、東京 […] 投稿 拡散モデルを用いた結晶構造の対称性を考慮した条件付き生成 は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  2. 2025年12月16日

    自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」─日本語VQA・Visual Grounding評価と翻訳

    はじめに Preferred Networks(以下、PFN)では2025年8月から、経済産業省および国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内の生成AI基盤モデルの開発力強化を目的 […] 投稿 自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」─日本語VQA・Visual Grounding評価と翻訳 は Preferred…

    Preferred Networks

  3. 2026年1月27日

    JFBench: 実務レベルの日本語指示追従性能を備えた生成AIを目指して

      はじめに 皆さん、こんにちは。PLaMo事後学習チームの今村です。近日我々は、純国産生成AI基盤モデルPLaMoの最新バージョンであるPLaMo 2.2 Primeをリリースする予定です。

    Preferred Networks

  4. 2026年1月28日

    PLaMo 2.2 Primeをリリースしました

    はじめに 本日我々は、純国産生成AI基盤モデルPLaMoの最新バージョンであるPLaMo 2.2 Primeをリリースしました。PLaMo 2.2 Primeでは社内外からのフィードバックをもとに、事後学習データを追加す […] 投稿 PLaMo 2.2 Primeをリリースしました は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  5. 2026年2月25日

    コード生成ベンチマークのためのサンドボックス環境の開発

    はじめに Preferred Networksでは、大規模言語モデル「PLaMo」の開発を行っています。 PLaMoは開発サイクルにて様々なベンチマークによりその能力を評価していますが、今回はコード生成ベンチマークにてモ […] 投稿 コード生成ベンチマークのためのサンドボックス環境の開発 は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  6. 2026年3月19日

    PLaMo 3.0 Prime β版をリリースしました

    はじめに みなさん、こんにちは。PLaMo事後学習チームの今村です。我々は本日、国産生成AI基盤モデルPLaMo™︎の新たなフラグシップモデルPLaMo 3.0 Prime β版をリリースしました。現在、無償利用を前提に […] 投稿 PLaMo 3.0 Prime β版をリリースしました は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  7. 2026年3月23日

    Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について

    はじめに Preferred Networksの加藤です。AIプロダクト・ソリューションチーム所属で、AutoMLチームも兼務しています。PFNでは Preferred AI という生成AIを活用したプロダクト群を開発し […] 投稿 Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について は Preferr…

    Preferred Networks

  8. 2026年4月3日

    自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」

    はじめに Preferred Networks(以下、PFN)では2025年8月から、経済産業省および国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内の生成AI基盤モデルの開発力強化を目的 […] 投稿 自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」 は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  9. 2026年4月16日

    Gemini 3.1 Flash TTS:次世代の表現力豊かな AI 音声

    新しいオーディオモデルは細粒度オーディオタグを導入し、AI 音声を正確に制御して表現力豊かなオーディオ生成が可能

    Google DeepMind

  10. 2026年5月6日

    NVIDIAとServiceNowが企業向け新型自律AIエージェントでパートナーシップ

    エンタープライズAIは生成を学んだ。推論を学んだ。次に企業が問うのは:AIはどのように行動すべきか。初期段階のエージェントシステムは単純な処理を超えた可能性を示してきた。

    NVIDIA Blog

  11. 2026年5月8日

    エージェント生成プルリクエストはいたるところにある。レビュー方法はこちら

    エージェント生成プルリクエストをレビューする実践的なガイド:何を探すべきか、問題がどこに隠れているか、そして技術的負債が出荷される前にそれをキャッチする方法についての記事です。

    GitHub Blog (AI)

  12. 2026年5月11日

    BalCapRL: RL ベースのMLLM画像キャプション生成用のバランス型フレームワーク

    画像キャプション生成はコンピュータビジョンの最も基本的なタスクの一つです。その開放性の性質により、マルチモーダル大規模言語モデル(MLLM)の時代に多大な関心を集めています。

    Apple Machine Learning Research

  13. 2026年5月13日

    ダンジョンズ&デスクトップ:GitHub Copilot CLIを使用して手続き生成ローグライクゲームを構築する

    あるGitHubメンバーがGitHub Copilot CLIを使用して、任意のコードベースをユニークなローグライクダンジョンに変える拡張機能を構築した方法を学べます。

    GitHub Blog (AI)

  14. 2026年5月19日

    より安全で透明なAIエコシステムのためのコンテンツ出所の追跡を推進

    OpenAIはContent Credentials、SynthID、および検証ツールを使用してAIコンテンツの出所を追跡し、人々がAI生成メディアを特定し信頼できるようにする。

    OpenAI

  15. 2026年5月22日

    VSAS-Bench:ビジュアルストリーミングアシスタントモデルのリアルタイム評価

    ストリーミング視覚言語モデル(VLM)は、命令プロンプトとオンラインの入力フレームストリームが与えられるとリアルタイムで応答を生成し続けます。これはリアルタイムビジュアルアシスタントの中核メカニズムです。

    Apple Machine Learning Research

  16. 2026年5月27日

    アイデアからAIアプリへ:Strandsを使用したインテリジェント調査アシスタントの構築

    AIアプリの構築には、機械学習の博士号や複雑なアーキテクチャとの格闘に数ヶ月を要する必要はありません。複数のAPI呼び出しを調整しようとする際の課題を解決し、Strandsを使用して迅速にAIアプリを開発する方法を紹介します。

    AWS Machine Learning Blog

  17. 2026年5月27日

    Strands Agents、NVIDIA NIM、Amazon Bedrock AgentCoreを使用した高性能生成AIシステムの構築

    このポストでは、統合アーキテクチャを使用して、並列推論、コンテキスト永続性、追跡可能な実行パスを実証するマルチエージェントキャンペーンレビュー システムの構築方法を学ぶことができます。

    AWS Machine Learning Blog

  18. 2026年5月27日

    Amazon Bedrock AgentCoreを使用したAWS上の高度にスケーラブルなサーバーレスLangGraphマルチエージェントシステムの構築

    このポストでは、LangGraphエージェントをオーケストレーターとして統合し、Amazon Bedrock AgentCore Memoryと連携させて、AWS上に高度にスケーラブルでサーバーレスなマルチエージェント生成AI システムを構築するソリューションを提供しています。

    AWS Machine Learning Blog

  19. 2026年5月27日

    「AI作成」表示義務化 選挙運動動画、与野党が法案骨子

    与野党が選挙運動動画におけるAI作成表示の義務化に向けた法案骨子で合意しました。生成AIによるディープフェイクなど映像・音声改ざん技術が有権者の判断を揺さぶる懸念が高まっており、信頼性確保が急務となっています。一方で、何がAI作成に該当するかの定義が曖昧であれば、規制の実効性に課題が残り、表現の自由との衝突も懸念されます。国際的な先行事例を参考にしながら、精密な法整備と併せて、有権者のリテラシー向上も重要な課題となります。

    時事通信

  20. 2026年5月29日

    $2,000で制作されたAI生成映画がトライベッカ映画祭でデビュー

    来月開催されるトライベッカ映画祭にAI生成映画「Dreams of Violets」が上映される。75分間のこの映画は、フィクションのドラマ化である。

    The Verge AI

  21. 2026年5月29日

    生成AIの普及が後押し、インディゲームレーベル「WorldMap」/Monthly Pitch! スタートアップの扉

    本稿はサイバーエージェント・キャピタルに掲載された記事からの転載 サービス概要: インディゲームレーベル「WorldMap」を運営するのは、トライシステム社。ゲームクリエイターやタイトルの支援を通じてインディゲームの価値 […]

    THE BRIDGE

  22. 2026年5月29日

    要件から設計まで一貫して支援、要件定義・設計AI「GEAR.indigo」とクラウドインフラ生成AI「Rinstack」/Monthly Pitch! スタートアップの扉

    本稿はサイバーエージェント・キャピタルに掲載された記事からの転載 サービス概要: AIの進展によりシステム開発は効率化されているかと思いきや、大手企業ではなかなか生産性が上がっていないようです。その原因は、ビジネスと技術 […]

    THE BRIDGE

  23. 2026年5月29日

    米アンソロピック、高性能AI「ミュトス」級モデルを数週間以内に全顧客に提供

    アンソロピックが高性能AI「ミュトス」級モデルを数週間以内に全顧客に提供することを決定しました。これは生成AI市場の競争激化の中、OpenAIやGoogleの同等クラスモデルに対抗するため、性能を独占するのではなく「開放」を先制することで利用者増加とデータ蓄積による継続的な改善を目指す戦略です。一方でセキュリティと開放性のバランスは課題であり、段階的な展開は悪用懸念への対応としても機能しています。この動きは中堅企業やスタートアップの参入障壁を低下させる一方で、早期に大量ユーザーを獲得した企業の長期的優位性をもたらす可能性があります。

    NHK

  24. 2026年5月29日

    信頼度ショートカット:マスク拡散モデルの推論失敗モード

    arXiv:2605.29123v1 公表予定タイプ:新規 概要:マスク拡散言語モデル(MDM)は任意の順序の生成をサポートしており、信頼度ベースのデコーディングが事実上標準的な推論ポリシーとして機能している。これを最適化するため、最近のトレーニングスキームでは、生成時に観察されるマスクパターンと直接整合させることを試みている。

    arXiv cs.AI

  25. 2026年5月29日

    事実の未来:事実生成と検証のギャップを追跡する

    言語モデルが事実知識へのデフォルトインターフェースになりつつあるが、出力の生成よりも検証の方がより確実に機能することが多い。この生成・検証ギャップ(GV-gap)は最近の自己改善と推論の多くの進展の根底にあるが、その具体的な事実知識に関するダイナミクスについては検討されていない。

    arXiv cs.CL

  26. 2026年5月29日

    後付け修正によるニューロシンボリック知識グラフの構築:オントロジーに基づくアプローチ

    arXiv:2605.29168v1 文書の発表。質問応答(QA)はAIの中核的な課題であり、特に複数の文書間でのマルチホップ推論や集約や完全リスティングなどのシンボリック操作を必要とする複雑なクエリに対応する必要があります。検索拡張生成はQAの主流アプローチとなり、最近のグラフベースのバリアントが追加されています。

    arXiv cs.AI

  27. 2026年5月29日

    LLM報酬設計が失敗するとき:スパース構造化RLのための診断駆動型改善

    セマンティック報酬関数インターフェースを持つスパース構造化強化学習タスクの場合、LLM生成報酬形成は一度限りの生成ではなくデバッグとしてより適切に枠付けされている。MiniGridを中核評価として、MuJoCoを境界ストレステストとして使用するPPO訓練エージェントを研究する。本監査では2つの支配的な知見を発見する。

    arXiv cs.LG

  28. 2026年5月29日

    StoryMI: 操作可能なマルチエージェント治療対話生成

    大規模言語モデル(LLM)は流暢な対話を生成できますが、先行研究は状況的な根拠付け、動的戦略制御、および動機面接(MI)の臨床基準に合致した評価が不足しています。我々はStoryMIを導入しました。これは制御可能なMI対話生成のための複数LLMエージェントフレームワークです。

    arXiv cs.CL

  29. 2026年5月29日

    PrismFlow:時系列生成のための残差動力学フロー・マッチング

    実世界の信号は振動や高周波変動を含むマルチモーダルパターンと多スケール動力学を示すため、高品質な時系列データの生成は困難です。Flow Matching(FM)は拡散モデルの効率的な代替手段を提供しますが、実装では課題があります。

    arXiv cs.LG

  30. 2026年5月29日

    ICG:MLLMベースのプロンプティングと個人化された好みアライメントによるカバー画像生成の改善

    arXiv:2605.27374v1 マルチモーダル大言語モデル(MLLM)と拡散モデル(DM)の最近の進歩により、AI生成コンテンツの新しい可能性が開かれた。しかし、パーソナライズされたカバー画像生成は、デジタルプラットフォームでのユーザーエンゲージメント向上における重要な役割にもかかわらず、ほとんど未開拓である。

    arXiv cs.CL