TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月12日
パラメータゴルフがAI支援研究について教えてくれたこと
パラメータゴルフは1,000名以上の参加者と2,000件以上の投稿を集め、厳格な制約条件下でAI支援機械学習研究、コーディングエージェント、量子化、革新的なモデル設計を探索した。
OpenAI
2026年5月14日
ChatGPTがセンシティブな会話の文脈認識を向上
新しいChatGPTのセーフティ更新がセンシティブな会話での文脈認識を改善し、時間経過とともにリスク検出を支援し、より安全に対応するのに役立つ方法を学ぶ。
OpenAI
2026年5月14日
どこからでもCodexで作業可能に
ChatGPTモバイルアプリでCodexを任意の場所から使用できる。リモート環境やデバイス全体でコーディングタスクをリアルタイムで監視、操舵、承認できる。
OpenAI
2026年5月15日
DatabricksがGPT-5.5をエンタープライズエージェントワークフローに導入
DatabricksがOfficeQA Proベンチマークで最先端の成績を達成したGPT-5.5をエンタープライズエージェントワークフローに活用しています。
OpenAI
2026年5月15日
ChatGPTの新しいパーソナルファイナンス体験
米国のProユーザー向けにChatGPTの新しいパーソナルファイナンス体験をプレビュー。金融口座を安全に接続し、あなたの財務状況、目標に基づいたAIによるインサイトとガイダンスを取得できます。
OpenAI
2026年5月16日
OpenAIとマルタが提携、ChatGPT Plusを全市民に提供
OpenAIとマルタが提携し、AI へのアクセスを拡大。ChatGPT Plus と市民が実践的な AI スキルを習得し、責任を持って AI を使用するための研修を提供する。
OpenAI
2026年5月20日
RampのエンジニアがCodexでコードレビューを加速
RampのエンジニアはCodexとGPT-5.5を使用してコードレビューを行い、改善を実装することで、数時間ではなく数分で実質的なフィードバックを得ることができている。
OpenAI
2026年5月21日
AdventHealthがOpenAIとの提携で全人的医療を推進
AdventHealthはChatGPT for Healthcareを使用して、ワークフローの効率化、事務負担の軽減、患者ケアにより多くの時間を充てている。
OpenAI
2026年5月22日
マスク氏の「Grok」、AI競争で大きく後れ取る
イーロン・マスク氏が率いるxAIが開発したAI「Grok」が、業界内での競争力で課題を抱えている。OpenAIの「ChatGPT」やGoogle、Anthropicといった大手企業が提供する高度なAIモデルとの性能格差が拡大しているという。 Grokは2023年の発表当初、ユーモアを備えた独特のAIアシスタントとして注目を集めていた。しかし、その後の開発段階で、言語処理能力や推論性能などの基本的なAI機能において、競合他社との差が生じているようだ。 AI市場は急速に進化しており、複数企業が性能向上に向けた投資を加速させている。Grokが現在のポジションを維持あるいは改善するには、技術開発の加速化が必要とされている。xAIが今後どのような戦略で市場巻き返しを図るかが注視されている。（引用元：xAI）
xAI
2026年5月25日
OpenAI、グルーポ・フォーリャとグルーポ・ウオルを戦略的コンテンツパートナーシップとして発表
OpenAIはグルーポ・フォーリャとグルーポ・ウオルと提携し、信頼できるブラジルジャーナリズムをChatGPTにもたらし、帰属と透明性を備えたニュースへのアクセスを拡大している。
OpenAI
2026年5月27日
WarpがGPT-5.5でオープンソース構築に大型投資
WarpはGPT-5.5とOpenAIモデルを使用して、ローカル、クラウド、およびオープンソース開発ワークフロー全体でコーディングエージェントを調整している。
OpenAI
2026年5月28日
MUFGがOpenAIとともにAIネイティブ企業を目指す
MUFGはChatGPT Enterpriseを使用して、AI対応組織の構築、ワークフローの改善、大規模なAI駆動型金融サービスの提供を実現している。
OpenAI
2026年5月28日
iOS 27のレンダリング画像がSiriの大型リデザインを示唆
iOS 27で予想されるAppleの長らく待たれていたSiriの刷新は、ChatGPTのような外観とLiquid Glassの要素を備えた設計になる可能性がある。Bloombergのレンダリング画像より。
The Verge AI
2026年5月28日
新しいSiriアプリのプレビューがAppleのChatGPT対抗計画を明かす
新しいレンダリング画像により、iOS 27向けのAppleの予定されているAI大規模刷新が詳細に示され、再設計されたSiriの体験とスタンドアロンSiriアプリが含まれています。
TechCrunch AI
2026年5月29日
ローザリンド・バイオディフェンスで社会的レジリエンスを強化
OpenAIはローザリンド・バイオディフェンスを立ち上げ、バイオディフェンス、公衆衛生、パンデミック対応を推進する精査済みの開発者およびアメリカ政府パートナーへのGPT-ローザリンドへの信頼できるアクセスを拡大している
OpenAI
2026年5月29日
ソフトからハードなLLMプロンプトへの翻訳学習
ソフトプロンプトチューニングはLLMを特定のタスクに適応させるためのパラメータ効率的な方法ですが、解釈可能性の欠如に悩んでいます。ソフトプロンプトの解釈に関する最近の研究に基づいて、専用のソフトプロンプトから自然言語翻訳モデルへのトレーニング方法を探索します。
arXiv cs.CL
2026年5月29日
認知圏論トランスフォーマー：言語モデリングのための圏論的帰納的バイアス
認知圏論トランスフォーマー(CCT)は3億600万パラメータのアーキテクチャで、事前学習されたGPT-2 Smallバックボーンを圏論から導出された認知的に根拠のあるコンポーネント、および認知科学からのいくつかのインスピレーションで拡張しています。マッチドステップ・プロトコル下(215,000最適化ステップ)で...
arXiv cs.AI
2026年5月29日
EvoSpec: リアルタイム語彙とパラメータ適応を通じた推測的デコーディングの進化
推測的デコーディングは、ドラフト・検証パラダイムを通じて大規模言語モデルの推論を加速させますが、語彙サイズの拡大に伴い出力投影層がボトルネックになります。既存の静的プルーニング方法は有効にこのオーバーヘッドを削減しますが、受け入れ率の大幅な低下という課題があります。
arXiv cs.CL
2026年5月29日
ICG：MLLMベースのプロンプティングと個人化された好みアライメントによるカバー画像生成の改善
arXiv:2605.27374v1 マルチモーダル大言語モデル（MLLM）と拡散モデル（DM）の最近の進歩により、AI生成コンテンツの新しい可能性が開かれた。しかし、パーソナライズされたカバー画像生成は、デジタルプラットフォームでのユーザーエンゲージメント向上における重要な役割にもかかわらず、ほとんど未開拓である。
arXiv cs.CL
2026年5月29日
FedQHD: 閉形式関数空間フェデレーション強化学習
フェデレーション強化学習は、生のトラジェクトリを交換することなく、分散エージェントが協力してポリシーまたは価値推定を改善することを可能にします。ただし、FedAvgスタイルのパラメータ平均化は関数空間で一貫性がなく、クライアントが異なるエンコーダを使用したり、同じ非線形ネットワークを使用する場合でも問題が生じます。
arXiv cs.LG
2026年5月29日
FormInv: 数学推論ベンチマークにおけるセマンティック不変性の測定プロトコル
MathCheck（ICLR 2025）のパラフレーズ品質監査により、129グループ中4つのセマンティック的に不正確なパラフレーズ（3.1%）が検出されました。これらを削除するとGPT-4oはランク2からランク4に低下し、Claude HaikuとDeepSeek V3がそれを上回ります。これらのランク変動は単一モデル評価では見えません。
arXiv cs.LG
2026年5月29日
ログアライメント比による訓練時の汎化診断
パラメータ化理論で導入されたパラメータ活性化アライメント測度であるログアライメント比（LAR）を研究します。これを行列の正規化された2乗特異値のウェイトスペクトル p と正規化された2乗射影値のアクティベーションスペクトル q との重複として再構成します。
arXiv cs.LG
2026年5月29日
潜在メモリ管理としてのコンテキスト蒸留
コンテキスト蒸留は文脈情報をモデルパラメータに圧縮するが、既存の方法は複数の蒸留された潜在メモリをオラクル以外の設定でどのように保存、検索、安全に活性化するかについて無視することが多い。本研究ではコンテキスト蒸留を潜在メモリ管理問題として定式化する。
arXiv cs.LG
2026年5月29日
読解か推測か？古代ギリシャ版のOCRにおけるビジョン言語モデルの視覚的グラウンディング失敗
視覚言語モデル（VLM）を光学文字認識（OCR）に使用すると、視覚的根拠のない高尤度テキストを生成でき、言語優先性への依存を示唆している。オープンウェイト VLM を従来の OCR ベースラインと低資源古代ギリシャ校訂版で比較すると、このギャップが明らかになる。
arXiv cs.CL
2026年5月29日
カリキュラムのカスタマイズ：動的データ・モデル互換性による学生中心の推論蒸留
arXiv:2605.29229v1 文書の発表。推論蒸留は大規模言語モデル（LLM）から小規模モデルへ複雑な推論能力を転移させますが、その成功は訓練データが学生モデルとどの程度合致しているかに依存します。本論文では、データ・モデル互換性（DMC）メトリクスを導入し、その適合性を評価するために使用できます。
arXiv cs.AI
2026年5月29日
BenchTrace：LLMエージェントの反省能力と制御された進化をテストするベンチマーク
arXiv:2605.29225v1 文書の発表。自己進化型エージェントは過去の失敗を反省することで時間とともに改善されますが、既存の評価には2つの制限があります。タスクスコアのみを測定して反省の質は不明であり、エージェント自身のエピソード実行に依存して特定の失敗パターンに対応するメカニズムがありません。本論文では新しいアプローチを提示しています。
arXiv cs.AI
2026年5月29日
GTA：スケーラブルなWebエージェント用ロングホライズンタスク生成
arXiv:2605.29218v1 文書の発表。言語モデルをブラウジングおよびツール使用機能と組み合わせたWebエージェントは、オープンなWebアシスタントとしての可能性を示していますが、スケーラブルなプロセスレベルの監督の不足により進展が制限されています。既存のベンチマークは主に手動で構築されており、粗い開始ゴール注釈のみを提供しています。
arXiv cs.AI
2026年5月29日
後付け修正によるニューロシンボリック知識グラフの構築：オントロジーに基づくアプローチ
arXiv:2605.29168v1 文書の発表。質問応答（QA）はAIの中核的な課題であり、特に複数の文書間でのマルチホップ推論や集約や完全リスティングなどのシンボリック操作を必要とする複雑なクエリに対応する必要があります。検索拡張生成はQAの主流アプローチとなり、最近のグラフベースのバリアントが追加されています。
arXiv cs.AI
2026年5月29日
微分可能な信念ベースの対戦相手形成
人間の協調は、戦略的行動を通じて他者の信念に影響を与える能力に依存している。マルチエージェント強化学習では、対戦相手形成がこの影響を複製しようとしているが、既存の方法は通常、対戦相手のパラメータ、ポリシー、または価値空間内で動作している。
arXiv cs.AI
2026年5月29日
CosmicFish-HRM: コンパクト言語モデルにおける階層的回帰メカニズムを介した適応的推論
大規模言語モデルは強力な推論能力を実現しているが、膨大なパラメータ数と高い推論コストが課題である。本研究では、コンパクト言語モデルにおける適応的推論深度の異なるアプローチを探索し、CosmicFish-HRMを提案している
arXiv cs.LG