TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月15日
営業チームがCodexを使用する方法
営業チームがCodexを使用して、実際の業務入力からパイプラインブリーフ、ミーティング準備資料、売上予測レビュー、アカウント計画、停滞案件の診断を作成する方法をご紹介します。
OpenAI
2026年5月28日
石油代替調達進むも目詰まり課題イラン情勢各地への影響は
中東情勢の不安定化に伴い、日本のエネルギー調達戦略が転換期を迎えている。ホルムズ海峡経由への依存から複数ルート確保へのシフトが進む一方で、国内の流通インフラ整備が追いつかず「目詰まり」が課題となっている。パイプライン拡張やタンク増設には数年を要するのに対し、地政学リスクは数ヶ月単位で変化するため、この時間軸のズレが脆弱性を露呈させている。アジア全体が同じ代替ルートに依存すれば、新たなボトルネックが生じるリスクもあり、根本的にはエネルギー源の転換加速が不可欠とされている。
NHK
2026年5月29日
ReverseMath: 数学問題生成の拡張可能性と検証可能性を実現する逆向き回答手法
数学推論ベンチマークはLLMの評価に不可欠だが、多くは静的で公開評価やトレーニングパイプラインを通じて繰り返し露出しており、真の推論と暗記を区別することが困難である。一方、新しい数学問題の手動構築は...
arXiv cs.CL
2026年5月29日
安定性-表現性ギャップの橋渡け: 低資源音声言語モデルの合成データスケーリングと優先度調整
音声言語モデル(SLM)は明示的な音素グラフ変換パイプラインをバイパスすることで音声合成の有望なパラダイムとして出現しています。ただし、低資源言語での有効性は転記済み音声の不足によって根本的に制限されています。実践では、合成データが重要になっています。
arXiv cs.CL
2026年5月29日
UserHarness: より強いエージェント心の理論構築のためのユーザーの思考の活用
ユーザーの信念と意図を理解することは、効果的なエージェントアシスタントの構築の中心である。この能力はしばしば心の理論（ToM）タスクを通じて評価されるが、多くの既存アプローチはToMに複雑なパイプラインで対処している。
arXiv cs.CL
2026年5月29日
PRO-CUA: コンピュータ使用エージェント向けプロセス報酬最適化
コンピュータ使用エージェント(CUA)は複雑なデジタルワークフローの自動化に強い可能性を示していますが、その訓練はコストの高いライブ環境での相互作用と限定的な高品質の教示に制限されています。既存のフィルタリング動作クローニングパイプラインは、模倣ボトルネックに悩まされています。
arXiv cs.AI
2026年5月29日
エージェンティックAI、ネストされた学習、セマンティックキャッシングによるAI持続性を通じたハルシネーション軽減
ハルシネーションは本番LLMシステムにおける主要な信頼性の障壁であり、特にマルチエージェントパイプラインでは根拠のない主張が段階を通じて伝播する可能性があります。本論文は、HOPE着想のネストされた学習アーキテクチャとコンティニュアムメモリシステム(CMS)を応用しています。
arXiv cs.AI
2026年5月31日
週末の映画ボックスオフィストップ2作品はYouTuberが監督
YouTubeから高級ホラーへのパイプラインが非常に好調である。
TechCrunch
2026年5月31日
マイケル・デ・ルーカ、ハリウッドがオリジナル作品の開発資金を削減することの危険性について警告：「深く削減しすぎるとパイプラインが枯れてしまう」
Warner Bros. Pictures会長のマイケル・デ・ルーカ氏は、土曜日にProduced By会議でのセッション中に、スタジオ経営者としてのマスタークラスを提供し、オリジナル素材への投資削減の危険性について警告しました。
Variety
2026年6月1日
今週末の映画興行成績トップ2はいずれもユーチューバーが監督
ユーチューブから名高いホラー映画への進出パイプラインが非常に好調です。
TechCrunch
2026年6月1日
適応力の習得：認知認識型探索による自己改善ウェブエージェント
マルチモーダル大規模言語モデル(MLLM)の最近の進展はウェブエージェントにおいて有望な進歩をもたらしている。しかし既存のウェブエージェントは手作りの実行パイプラインや高額な専門家軌跡に依存することが多く、複雑で動的な環境への適応性が限定されている。
arXiv cs.AI
2026年6月1日
PhyDrawGen：自然言語から物理的に根拠のある図表生成
arXiv:2605.30512v1 発表タイプ：新規要旨：テキストから物理図を生成するには、物理法則の厳密な遵守が必要である。現在の生成モデルは視覚的にもっともらしい出力を生成しているが、力ベクトルを体系的に幻覚し、保存則を無視し、幾何学的制約に違反している。我々はニューロシンボリックパイプラインであるPhyDrawGenを提示する。
arXiv cs.AI
2026年6月2日
デプロイ速度を約50%高速化した話
こんにちは。Dress Code株式会社でプロダクトエンジニアをしているぽこひで（@pokohide）です。弊社の提供する「DRESS CODE」のBackend APIのデプロイパイプラインを見直し、デプロイ時間を40~50%ほど高速化した話をご紹介します。
Zenn
2026年6月2日
ラショモン理論からPRAXISへ：効率的な決定木ラショモン集合
標準的な機械学習パイプラインは多くのほぼ最適なモデルを認めます。これらの「ラショモン集合」は、不確実性を考慮した堅牢な意思決定に対して、さまざまな課題と機会をもたらします。これにより、ユーザーはドメイン知識と好みを組み込むことができます。
arXiv cs.LG
2026年6月2日
ARCA：トークン信号が退化した場合のアダプタ残差クレジット割当
言語モデルの強化学習におけるトークンレベルのクレジット割当は、通常、ポリシーが完全に訓練可能であるかのように定式化されていますが、実際のLLM-RLパイプラインはパラメータ効率の良い微調整、特にLoRAに依存することが多いです。本論文はこの分離が構造的な失敗モードを隠していることを主張しています。
arXiv cs.LG
2026年6月2日
Adnocがホルムズ海峡を迂回する新しいUAEパイプラインを計画
国営石油企業の動きは、イラン紛争が重要な海運ルートへの地域の依存を浮き彫りにする中で行われています。
Financial Times World
2026年6月3日
UAEのホルムズ海峡パイプライン迂回路は燃料も含む可能性がある
アラブ首長国連邦はホルムズ海峡を迂回して燃料を運搬する精製製品用の追加パイプラインの建設を検討している。
Bloomberg
2026年6月3日
カナダ株式指数がエネルギー部門の上昇により35,000に到達
カナダの株式ベンチマークは、エネルギーと金融セクターの広がりのある上昇を受けて、初めて35,000を突破しました。
Bloomberg
2026年6月4日
Vision Transformerを用いた細粒度車両分類のためのオープンソース二段階コンピュータビジョンパイプライン
自転車事故の重症度を予測する新たな取り組みが進められている。道路動画から車両を自動識別し分類するオープンソースシステムが開発されたもので、最新のコンピュータビジョン技術を活用している。このシステムはRT-DETRとVision Transformerという2つの技術を組み合わせた二段階パイプラインで構成。乗用車やSUV、ピックアップトラックなど6種類の車両を自動的に識別できる。従来手法との大きな違いは、分類の信頼度が低い場合に未知の車両として扱う仕組みを備えている点だ。このアプローチにより、不確実な判定から生じる誤分類を防止し、より高い精度の予測が可能になる。同研究は機械学習分野で注目を集める論文プラットフォームarXivに掲載されており、オープンソースとして公開されることで、他の研究機関での活用も期待されている。自転車利用者の安全向上に向け、AI技術の応用が広がっている。 (引用元：arXiv cs.LG)
2026年6月8日
低データ・高次元出力問題のためのガウス過程潜在因子回帰
科学分野では、少ない訓練例から高次元出力を予測する回帰タスクが頻繁に必要とされる。多出力ガウス過程は低データ体制で優れているが、通常は高次元出力に対応できない。PCA-GPなどの圧縮後予測パイプラインは高次元性を扱えるが、予測ではなく再構成に最適化された基底に依存している。このギャップに対処するため、ガウス過程事前分布から抽出した低次元潜在状態の線形ガウスデコーディングとして各出力を表現するモデルを提案する。デコーダの重みを解析的に周辺化することで、圧縮と予測を単一の目的関数に結合し、高次元出力に対応可能にした。このモデルをGaussian process latent factor regression (GPLFR)と呼ぶ。本研究では、ロッキータイプ系外惑星の全球気候モデルの初の空間分解エミュレータを構築することによってGPLFRを実証した。
arXiv cs.LG
2026年6月8日
CAF-Gen：議論構造を充実させるためのマルチエージェントシステム
自然言語テキストから複雑な推論を形式化することは、計算言語学における中心的な課題である。現在の議論マイニング技術は基本的な主張と前提を識別するが、前提のタイプ、証明基準、議論スキームなどの特徴を組み込むカーネアデス議論枠組み（CAF）といった高度なスキーマが必要とする豊かな構造情報を捉えるのに苦労している。本研究は、浅い議論構造をCAF準拠の議論モデルに充実させるために設計された自動マルチエージェントフレームワークCAF-Genを導入することでこの制限に対処している。反復的なクリエイター・レビュアーパイプラインを採用することで、クリエイターエージェントの出力は批評的エージェントによって検証され、構造的整合性が確保される。このマルチエージェント協働は、単一パス生成モデルに典型的な構造的不安定性を軽減するために重要である。実験結果は、反復的なフィードバックループが結果データの品質を向上させ、元のアノテーションとの強い一致を達成しながら、構造的により豊かなモデルを生成することを示している。
arXiv cs.CL
2026年6月8日
インサイト、血液疾患バイオテック企業と最大20億ドルの契約を締結
中堅医薬品メーカーは、大手製薬企業との競争を視野にパイプラインを補強し、事業規模を拡大している
Financial Times World
2026年6月10日
Regimes：LongMemEvalでのアクティブグラフによる監査可能・ホールドアウトゲート付き改善ループの実証
arXiv:2606.10241v1 発表タイプ：新規概要：自律的な改善ループは、通常、エージェントに外部から取り付けられた足場であるため、信頼が難しい。失敗は記録されず、診断は再現できず、昇格または破棄の決定はエージェント自身の履歴ではなく、サイドデータベースに格納される。イベントソーシングされたエージェントランタイムは、その摩擦を取り除き、制御された改善をファーストクラスのワークフローに変えることを示す。エージェントの状態が追記専用イベントログの決定論的な射影である場合、失敗は記録され、実行はログから正確に再現され、候補パッチは型付きパイプラインのシームにスコープされ、ゲートは監査可能であり、すべての昇格または破棄はそれ自体がイベントとなる。これは、失敗した評価を診断し、パイプラインのポイントで修理を提案し、静的チェック、サンドボックス実行、インサンプル評価、およびホールドアウト検証の後でのみ昇格するActiveGraphランタイム上のループであるRegimesで実証される。このループはターゲットに依存しない。
arXiv cs.AI
2026年6月10日
サウナ“西の聖地”湯らっくす、福岡進出でなんと「男女共用サウナ」誕生へ…計画発表＆呼びかけ
サウナの西の聖地とも呼ばれる「湯らっくす」（熊本市、共栄観光株式会社）が、福岡市に2号店をオープンすることを明らかにし、9日からクラウドファンディングを開始した。
産経新聞
2026年6月11日
NightFeats @ MMU-RAGent NeurIPS 2025: テキスト間生成タスク向けコンテキスト最適化マルチエージェントRAGシステム
arXiv:2606.11199v1 新規発表。本稿では、NeurIPS 2025のMMU-RAGentコンペティションに提出され、テキスト間生成タスク部門でベストダイナミック評価を受賞した、構造化マルチエージェント検索拡張生成（RAG）システム「NightFeats」を紹介します。ベンチマーク最大化を目標とするのではなく、本研究は知識合成を検索、キュレーション、構成の3つの連携フェーズに分解する原則的なパイプラインを提案します。各フェーズは、明示的な中間表現とハンドオフ契約によって管理されます。エージェンティックコンテキストエンジニアリング（ACE）に着想を得て、本システムは、時間的意味的再ランキング、有界矛盾解消、引用保存構成をコアアーキテクチャプリミティブとして導入しています。
arXiv cs.CL
2026年6月11日
マルチモーダル言語モデルによるソーシャルメディア上のAI生成コンテンツの検出
arXiv:2606.11200v1 発表タイプ: new 要旨: 生成AIにより、フォトリアルな画像や動画の作成が可能になり、これらはソーシャルメディアで拡散されることが増えています。しばしば、スパム、偽情報、操作、詐欺に利用されます。既存のAI生成コンテンツ（AIGC）検出方法は、新しい生成モデルへの汎化性能の低さ、単一モダリティへの依存、解釈可能な説明の欠如といった課題に直面しています。本稿では、多様なマルチモーダルソーシャルメディアデータを継続的にキュレーションし、検出と説明のためにコンパクトなビジョン・言語モデルをトレーニングすることで、これらの問題を軽減するパイプラインを提案します。提案モデルは、公開ベンチマークにおいて最先端の検出性能を達成し、複数のプラットフォームにわたる内部ソーシャルメディアデータセットで堅牢な検出および説明能力を示します。
arXiv cs.CL
2026年6月11日
AIエージェントは科学的結論を合成できるか？
arXiv:2606.11337v1 新規発表。科学AIエージェントは、証拠を検索し、複数のソースを横断して推論し、重要な決定に使用される結論を合成する能力を高めています。しかし、健康などの重要分野におけるその能力は不明瞭です。本研究では、オープンな科学的結論合成を評価するための、体系的なレビューからの9.11Kの質問と専門家が作成した結論からなる大規模なライブベンチマーク「SciConBench」を導入します。このベンチマークは、専門家が検証した自動評価パイプラインに基づいており、結論を原子的な事実に分解し、事実の精度と再現率を通じて正確さと網羅性を測定します。データ漏洩を軽減するため、さらに「SciConHarness」というクリーンルーム評価ハーネスを導入し、エージェントに制御されたウェブインタラクションを提供することで、有効な測定を保証します。8つの最先端モデルとディープリサーチエージェントを評価した結果、事実の質は依然として低いことが判明しました。クリーンルーム設定では、最良のエージェントでも事実のF1スコアは0.337にしか達しませんでした。
arXiv cs.AI
2026年6月11日
安全データシートからの情報抽出における大規模言語モデルのベンチマーク
安全データシート（SDS）からの構造化情報の正確な抽出は、文書形式の多様性や従来のルールベース手法の限界から、産業安全分野では依然として課題となっています。本研究では、自動SDSデータ抽出のための最新の大規模言語モデル（LLM）をベンチマークし、テキストベースおよびマルチモーダル処理パイプラインを比較します。Gemini 1.5 Pro、GPT-4o、Claude 3.7 Sonnet、Llama 3.1-70Bの4つのモデルを、ゼロショット、フューショット、連鎖思考（Chain-of-Thought）の3つのプロンプト戦略で体系的に評価しました。評価フレームワークでは、50,000以上の抽出データフィールドにわたる精度、レイテンシ、コストを評価しました。結果として、テキストベースの抽出は、すべての指標においてマルチモーダル処理を常に上回ることが示されました。Chain-of-Thoughtプロンプトと組み合わせたGemini 1.5 Proが最高の精度（84%）を達成し、GPT-4o（81%）とClaude 3.7 Sonnet（79%）を上回りました。
arXiv cs.CL
2026年6月11日
ProcessThinker：ロールアウトベースのプロセス報酬によるマルチモーダル大規模言語モデルの推論能力強化
arXiv:2606.11209v1 新規発表要旨：ビジュアル質問応答は、ますます多段階の推論を必要としています。検証可能な報酬（RLVR）とグループ相対ポリシー最適化（GRPO）を用いた近年の強化学習による事後学習は、マルチモーダル推論を改善できますが、ほとんどのアプローチは、結果のみの疎な報酬に依存しています。その結果、不正解が推論の終盤の小さな間違いに起因するのか、それとも最初から役に立たない推論経路に起因するのかを判断するのが困難です。一般的な解決策は、ステップレベルの監督のためにプロセス報酬モデル（PRM）をトレーニングすることですが、これには通常、大規模で高品質な思考連鎖の注釈と追加のトレーニングコストが必要です。本研究では、明示的なPRMをトレーニングすることなく、ステップレベルのプロセス報酬を提供する実用的な事後学習パイプラインであるProcessThinkerを提案します。
arXiv cs.CL
2026年6月12日
Mana: 多関節ツールの器用な操作
多関節ツールを巧みに操作することは、ロボット工学において長年の課題とされてきました。ツールの持つ多くの自由度と、対象物との複雑な接触を同時に制御する必要があるためです。この難題に対し、新たな汎用フレームワーク「Mana」が提案されました。Manaは、この器用な操作をアニメーションの問題として捉え直し、シミュレーションで得られた知見を現実世界に応用することを目指しています。 Manaの最大の特徴は、粗密なパイプラインを採用している点です。まず、プログラムによって生成された大まかな把持キーフレームを作成します。次に、これらのキーフレームを基に、モーション計画と強化学習の技術を組み合わせることで、より詳細で滑らかな操作軌道へと変換します。これにより、多関節ツールの複雑な動きを効率的かつ精密に制御することが可能になります。この研究は、ロボットが様々なツールを人間のように器用に使いこなす未来に一歩近づくものと期待されます。引用元: arXiv cs.AI
arXiv cs.AI