TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2025年12月1日
拡散モデルを用いた結晶構造の対称性を考慮した条件付き生成
本記事は2025年度PFN夏期インターンシップで、拡散モデルを用いた結晶構造生成手法に取り組まれた石井孝憲さんによる寄稿です。はじめに 2025年度の夏季インターンシップに参加させていただきました、東京 […] 投稿拡散モデルを用いた結晶構造の対称性を考慮した条件付き生成は Preferred Networks Tech Blog に最初に表示されました。
Preferred Networks
2025年12月16日
自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」─日本語VQA・Visual Grounding評価と翻訳
はじめに Preferred Networks（以下、PFN）では2025年8月から、経済産業省および国立研究開発法人　新エネルギー・産業技術総合開発機構（NEDO）が実施する、国内の生成AI基盤モデルの開発力強化を目的 […] 投稿自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」─日本語VQA・Visual Grounding評価と翻訳は Preferred…
Preferred Networks
2026年1月27日
JFBench: 実務レベルの日本語指示追従性能を備えた生成AIを目指して
はじめに皆さん、こんにちは。PLaMo事後学習チームの今村です。近日我々は、純国産生成AI基盤モデルPLaMoの最新バージョンであるPLaMo 2.2 Primeをリリースする予定です。
Preferred Networks
2026年1月28日
PLaMo 2.2 Primeをリリースしました
はじめに本日我々は、純国産生成AI基盤モデルPLaMoの最新バージョンであるPLaMo 2.2 Primeをリリースしました。PLaMo 2.2 Primeでは社内外からのフィードバックをもとに、事後学習データを追加す […] 投稿 PLaMo 2.2 Primeをリリースしましたは Preferred Networks Tech Blog に最初に表示されました。
Preferred Networks
2026年2月25日
コード生成ベンチマークのためのサンドボックス環境の開発
はじめに Preferred Networksでは、大規模言語モデル「PLaMo」の開発を行っています。 PLaMoは開発サイクルにて様々なベンチマークによりその能力を評価していますが、今回はコード生成ベンチマークにてモ […] 投稿コード生成ベンチマークのためのサンドボックス環境の開発は Preferred Networks Tech Blog に最初に表示されました。
Preferred Networks
2026年3月19日
PLaMo 3.0 Prime β版をリリースしました
はじめにみなさん、こんにちは。PLaMo事後学習チームの今村です。我々は本日、国産生成AI基盤モデルPLaMo™︎の新たなフラグシップモデルPLaMo 3.0 Prime β版をリリースしました。現在、無償利用を前提に […] 投稿 PLaMo 3.0 Prime β版をリリースしましたは Preferred Networks Tech Blog に最初に表示されました。
Preferred Networks
2026年3月23日
Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について
はじめに Preferred Networksの加藤です。AIプロダクト・ソリューションチーム所属で、AutoMLチームも兼務しています。PFNでは Preferred AI という生成AIを活用したプロダクト群を開発し […] 投稿 Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能については Preferr…
Preferred Networks
2026年4月3日
自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」
はじめに Preferred Networks（以下、PFN）では2025年8月から、経済産業省および国立研究開発法人新エネルギー・産業技術総合開発機構（NEDO）が実施する、国内の生成AI基盤モデルの開発力強化を目的 […] 投稿自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」は Preferred Networks Tech Blog に最初に表示されました。
Preferred Networks
2026年4月16日
Gemini 3.1 Flash TTS：次世代の表現力豊かな AI 音声
新しいオーディオモデルは細粒度オーディオタグを導入し、AI 音声を正確に制御して表現力豊かなオーディオ生成が可能
Google DeepMind
2026年5月6日
NVIDIAとServiceNowが企業向け新型自律AIエージェントでパートナーシップ
エンタープライズAIは生成を学んだ。推論を学んだ。次に企業が問うのは：AIはどのように行動すべきか。初期段階のエージェントシステムは単純な処理を超えた可能性を示してきた。
NVIDIA Blog
2026年5月8日
エージェント生成プルリクエストはいたるところにある。レビュー方法はこちら
エージェント生成プルリクエストをレビューする実践的なガイド：何を探すべきか、問題がどこに隠れているか、そして技術的負債が出荷される前にそれをキャッチする方法についての記事です。
GitHub Blog (AI)
2026年5月11日
BalCapRL: RL ベースのMLLM画像キャプション生成用のバランス型フレームワーク
画像キャプション生成はコンピュータビジョンの最も基本的なタスクの一つです。その開放性の性質により、マルチモーダル大規模言語モデル（MLLM）の時代に多大な関心を集めています。
Apple Machine Learning Research
2026年5月13日
ダンジョンズ＆デスクトップ：GitHub Copilot CLIを使用して手続き生成ローグライクゲームを構築する
あるGitHubメンバーがGitHub Copilot CLIを使用して、任意のコードベースをユニークなローグライクダンジョンに変える拡張機能を構築した方法を学べます。
GitHub Blog (AI)
2026年5月19日
より安全で透明なAIエコシステムのためのコンテンツ出所の追跡を推進
OpenAIはContent Credentials、SynthID、および検証ツールを使用してAIコンテンツの出所を追跡し、人々がAI生成メディアを特定し信頼できるようにする。
OpenAI
2026年5月22日
VSAS-Bench：ビジュアルストリーミングアシスタントモデルのリアルタイム評価
ストリーミング視覚言語モデル（VLM）は、命令プロンプトとオンラインの入力フレームストリームが与えられるとリアルタイムで応答を生成し続けます。これはリアルタイムビジュアルアシスタントの中核メカニズムです。
Apple Machine Learning Research
2026年5月27日
アイデアからAIアプリへ：Strandsを使用したインテリジェント調査アシスタントの構築
AIアプリの構築には、機械学習の博士号や複雑なアーキテクチャとの格闘に数ヶ月を要する必要はありません。複数のAPI呼び出しを調整しようとする際の課題を解決し、Strandsを使用して迅速にAIアプリを開発する方法を紹介します。
AWS Machine Learning Blog
2026年5月27日
Strands Agents、NVIDIA NIM、Amazon Bedrock AgentCoreを使用した高性能生成AIシステムの構築
このポストでは、統合アーキテクチャを使用して、並列推論、コンテキスト永続性、追跡可能な実行パスを実証するマルチエージェントキャンペーンレビューシステムの構築方法を学ぶことができます。
AWS Machine Learning Blog
2026年5月27日
Amazon Bedrock AgentCoreを使用したAWS上の高度にスケーラブルなサーバーレスLangGraphマルチエージェントシステムの構築
このポストでは、LangGraphエージェントをオーケストレーターとして統合し、Amazon Bedrock AgentCore Memoryと連携させて、AWS上に高度にスケーラブルでサーバーレスなマルチエージェント生成AI システムを構築するソリューションを提供しています。
AWS Machine Learning Blog
2026年5月27日
「ＡＩ作成」表示義務化　選挙運動動画、与野党が法案骨子
与野党が選挙運動動画におけるAI作成表示の義務化に向けた法案骨子で合意しました。生成AIによるディープフェイクなど映像・音声改ざん技術が有権者の判断を揺さぶる懸念が高まっており、信頼性確保が急務となっています。一方で、何がAI作成に該当するかの定義が曖昧であれば、規制の実効性に課題が残り、表現の自由との衝突も懸念されます。国際的な先行事例を参考にしながら、精密な法整備と併せて、有権者のリテラシー向上も重要な課題となります。
時事通信
2026年5月29日
$2,000で制作されたAI生成映画がトライベッカ映画祭でデビュー
来月開催されるトライベッカ映画祭にAI生成映画「Dreams of Violets」が上映される。75分間のこの映画は、フィクションのドラマ化である。
The Verge AI
2026年5月29日
生成AIの普及が後押し、インディゲームレーベル「WorldMap」／Monthly Pitch! スタートアップの扉
本稿はサイバーエージェント・キャピタルに掲載された記事からの転載サービス概要：インディゲームレーベル「WorldMap」を運営するのは、トライシステム社。ゲームクリエイターやタイトルの支援を通じてインディゲームの価値 […]
THE BRIDGE
2026年5月29日
要件から設計まで一貫して支援、要件定義・設計AI「GEAR.indigo」とクラウドインフラ生成AI「Rinstack」／Monthly Pitch! スタートアップの扉
本稿はサイバーエージェント・キャピタルに掲載された記事からの転載サービス概要： AIの進展によりシステム開発は効率化されているかと思いきや、大手企業ではなかなか生産性が上がっていないようです。その原因は、ビジネスと技術 […]
THE BRIDGE
2026年5月29日
米アンソロピック、高性能AI「ミュトス」級モデルを数週間以内に全顧客に提供
アンソロピックが高性能AI「ミュトス」級モデルを数週間以内に全顧客に提供することを決定しました。これは生成AI市場の競争激化の中、OpenAIやGoogleの同等クラスモデルに対抗するため、性能を独占するのではなく「開放」を先制することで利用者増加とデータ蓄積による継続的な改善を目指す戦略です。一方でセキュリティと開放性のバランスは課題であり、段階的な展開は悪用懸念への対応としても機能しています。この動きは中堅企業やスタートアップの参入障壁を低下させる一方で、早期に大量ユーザーを獲得した企業の長期的優位性をもたらす可能性があります。
NHK
2026年5月29日
信頼度ショートカット：マスク拡散モデルの推論失敗モード
arXiv:2605.29123v1 公表予定タイプ：新規概要：マスク拡散言語モデル（MDM）は任意の順序の生成をサポートしており、信頼度ベースのデコーディングが事実上標準的な推論ポリシーとして機能している。これを最適化するため、最近のトレーニングスキームでは、生成時に観察されるマスクパターンと直接整合させることを試みている。
arXiv cs.AI
2026年5月29日
事実の未来：事実生成と検証のギャップを追跡する
言語モデルが事実知識へのデフォルトインターフェースになりつつあるが、出力の生成よりも検証の方がより確実に機能することが多い。この生成・検証ギャップ（GV-gap）は最近の自己改善と推論の多くの進展の根底にあるが、その具体的な事実知識に関するダイナミクスについては検討されていない。
arXiv cs.CL
2026年5月29日
後付け修正によるニューロシンボリック知識グラフの構築：オントロジーに基づくアプローチ
arXiv:2605.29168v1 文書の発表。質問応答（QA）はAIの中核的な課題であり、特に複数の文書間でのマルチホップ推論や集約や完全リスティングなどのシンボリック操作を必要とする複雑なクエリに対応する必要があります。検索拡張生成はQAの主流アプローチとなり、最近のグラフベースのバリアントが追加されています。
arXiv cs.AI
2026年5月29日
LLM報酬設計が失敗するとき:スパース構造化RLのための診断駆動型改善
セマンティック報酬関数インターフェースを持つスパース構造化強化学習タスクの場合、LLM生成報酬形成は一度限りの生成ではなくデバッグとしてより適切に枠付けされている。MiniGridを中核評価として、MuJoCoを境界ストレステストとして使用するPPO訓練エージェントを研究する。本監査では2つの支配的な知見を発見する。
arXiv cs.LG
2026年5月29日
StoryMI: 操作可能なマルチエージェント治療対話生成
大規模言語モデル(LLM)は流暢な対話を生成できますが、先行研究は状況的な根拠付け、動的戦略制御、および動機面接(MI)の臨床基準に合致した評価が不足しています。我々はStoryMIを導入しました。これは制御可能なMI対話生成のための複数LLMエージェントフレームワークです。
arXiv cs.CL
2026年5月29日
PrismFlow：時系列生成のための残差動力学フロー・マッチング
実世界の信号は振動や高周波変動を含むマルチモーダルパターンと多スケール動力学を示すため、高品質な時系列データの生成は困難です。Flow Matching（FM）は拡散モデルの効率的な代替手段を提供しますが、実装では課題があります。
arXiv cs.LG
2026年5月29日
ICG：MLLMベースのプロンプティングと個人化された好みアライメントによるカバー画像生成の改善
arXiv:2605.27374v1 マルチモーダル大言語モデル（MLLM）と拡散モデル（DM）の最近の進歩により、AI生成コンテンツの新しい可能性が開かれた。しかし、パーソナライズされたカバー画像生成は、デジタルプラットフォームでのユーザーエンゲージメント向上における重要な役割にもかかわらず、ほとんど未開拓である。
arXiv cs.CL