TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年1月12日
Anthropicが Claude Desktop エージェント Cowork をローンチ — ファイル内で動作、コーディング不要
Anthropicは月曜日に Cowork をリリースした。これは大成功を収めた Claude Code ツールの機能を非技術ユーザーに拡張する新しいAIエージェント機能である。
VentureBeat AI
2026年1月19日
Claude Codeは月額最大200ドル。Gooseは同じ機能を無料で提供
人工知能コーディング革命には落とし穴がある。それは高額な費用だ。Anthropicのターミナルベースの AI エージェント Claude Codeは…
VentureBeat AI
2026年3月18日
AGI への進捗を測定する：認知フレームワーク
AGI への進捗を測定するフレームワークを導入し、関連する評価を構築するための Kaggle ハッカソンを開始
Google DeepMind
2026年3月23日
Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について
はじめに Preferred Networksの加藤です。AIプロダクト・ソリューションチーム所属で、AutoMLチームも兼務しています。PFNでは Preferred AI という生成AIを活用したプロダクト群を開発し […] 投稿 Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能については Preferr…
Preferred Networks
2026年5月8日
Velox：4次元ジオメトリと外観の表現学習
4次元オブジェクトの潜在表現を学習するフレームワークを紹介。オブジェクトのジオメトリと外観を忠実に捉える記述性、下流のタスク効率を支援する圧縮性を備える。
Apple Machine Learning Research
2026年5月11日
BalCapRL: RL ベースのMLLM画像キャプション生成用のバランス型フレームワーク
画像キャプション生成はコンピュータビジョンの最も基本的なタスクの一つです。その開放性の性質により、マルチモーダル大規模言語モデル（MLLM）の時代に多大な関心を集めています。
Apple Machine Learning Research
2026年5月13日
HermesがNVIDIA RTX PCおよびDGX Sparkによって強化された自己改善AIエージェントをアンロック
エージェンティックAIはユーザーが仕事をこなす方法を変えています。OpenClawの成功に続き、コミュニティは新しいオープンソースエージェンティックフレームワークを採用しています。最新のHermes Agentは140,000を超えるダウンロードを達成しました。
NVIDIA Blog
2026年5月21日
AnthropicのCode with Claudeがコーディングの未来を披露—好むと好まざるとを問わず
5月19日にロンドンで開始されたソフトウェア開発者向けのAnthropicの2日間のイベント「Code with Claude」では、Googleも同日開始したことで強い雰囲気が漂っていた…
MIT Technology Review AI
2026年5月27日
ついにMonoランタイムを脱却する「.NET MAUI」。Xamarinから続いてきたMonoランタイムをCoreCLRに移行
マイクロソフトは、シングルコードでiOS、Android、Windows、macOSに対応するUIフレームワーク「.NET MAUI」のiOSとAndroidにおけるランタイムが、今秋リリース予定の.NET 11でCoreCLRに移行するこ...
Publickey
2026年5月28日
OpenAIのフロンティア・ガバナンス・フレームワーク
OpenAIのフロンティア・ガバナンス・フレームワークと、AI安全保障、セキュリティ、リスク慣行がEUおよびカリフォルニア州の新興規制とどのように整合しているかを探る。
OpenAI
2026年5月29日
クロードの新モデルは失敗時により『正直』
Anthropicは木曜日にClaude Opus 4.8をリリースしており、同社はモデルの『正直性』を宣伝している。Anthropicによると、『すべてのモデル』を『正直性』について訓練しているという
The Verge AI
2026年5月29日
Claude Opus 4.8がAWSで利用可能に
この投稿では、Opus 4.8の改善点と、Amazon Bedrockでのエージェントシステムと本番推論ワークロードへのモデル統合に関するAIエンジニア向けの実践的なガイダンスについて説明します。
AWS Machine Learning Blog
2026年5月29日
ビッグ2における不完全情報下の自己対戦強化学習
不完全情報の多人数ゲームは、エージェントが隠された情報、スパースな報酬、および非定常の対手の下で行動できるかどうかをテストします。4人プレイの不完全情報カードゲームであるビッグ2でこれらの課題を研究し、制御された比較を可能にする自己対戦RLフレームワークを開発しました。
arXiv cs.LG
2026年5月29日
AI強化教育における実践者の信念と行動：DOTフレームワーク調査の証拠
本研究は、高等教育実践者72名を対象とした横断的調査の結果を報告しています。設計思考を統合したDOTフレームワークに基づき、教育と学習におけるAI統合に関連する信念、行動、および機関的条件を検証したものです。
arXiv cs.AI
2026年5月29日
PAST2HARM: マルチモーダルAIのジェイルブレイク用シンプル適応型過去形攻撃
マルチモーダルAIシステムへのジェイルブレイク攻撃は未だ十分に研究されていません。テキストの不安全な生成よりも深刻な結果をもたらす可能性のある不安全な画像生成が存在する一方で、現在の防御策は比較的成熟していません。本研究ではPAST2HARMという、拒否トレーニングをバイパスする効果的な適応型ジェイルブレイクフレームワークを紹介します。
arXiv cs.CL
2026年5月29日
StoryMI: 操作可能なマルチエージェント治療対話生成
大規模言語モデル(LLM)は流暢な対話を生成できますが、先行研究は状況的な根拠付け、動的戦略制御、および動機面接(MI)の臨床基準に合致した評価が不足しています。我々はStoryMIを導入しました。これは制御可能なMI対話生成のための複数LLMエージェントフレームワークです。
arXiv cs.CL
2026年5月29日
VFEAgent: 有限要素解析エンドツーエンド自動化のためのマルチモーダルエージェントフレームワーク
有限要素解析(FEA)は現代工学設計の根幹をなします。しかし、そのワークフローは本質的に複雑であり、領域知識に大きく依存しています。最近のLLMのFEA統合の試みにもかかわらず、既存のアプローチは複数の側面の処理における制限に直面しています。
arXiv cs.AI
2026年5月29日
FormInv: 数学推論ベンチマークにおけるセマンティック不変性の測定プロトコル
MathCheck（ICLR 2025）のパラフレーズ品質監査により、129グループ中4つのセマンティック的に不正確なパラフレーズ（3.1%）が検出されました。これらを削除するとGPT-4oはランク2からランク4に低下し、Claude HaikuとDeepSeek V3がそれを上回ります。これらのランク変動は単一モデル評価では見えません。
arXiv cs.LG
2026年5月29日
幻覚削減のための格子上のチェーンベース適応再構成
大規模言語モデルにおけるテスト時の幻覚削減のための確率的フレームワークであるCAROL（Chain-based Adaptive Reconfiguration Over Lattices）を導入します。トークンレベルの不確実性に依存するのではなく、CAROLは生成された結果間の一貫性に基づいて意味的不確実性測度を定義します。
arXiv cs.CL
2026年5月29日
反応トーンを通じたコミュニティ態度のモデリング：オンラインコミュニティの言語的行動とLLMアラインメント評価のための人間-AI協働フレームワーク
大規模言語モデル（LLM）は計算社会分析のプロキシとしてますます利用されていますが、人間のコミュニティの「厚い記述」を忠実に表現する能力は依然として重大な課題です。現在の評価では、社会的アイデンティティを静的なラベルに縮小することが多いです。
arXiv cs.CL
2026年5月29日
拡散モデルの柔軟で効率的な制御のためのスペクトル誘導
生成プロセスの固有幾何学を活用することで、拡散モデルを制御するためのフレームワークであるSpectral Guidanceを導入する。データがノイズによって段階的に破損するにつれて、制御に対して有用な情報を保つ特徴は少数のみとなり、それらを特異関数として特徴付ける。
arXiv cs.LG
2026年5月29日
表現アライメントは線形構造に基づいている
プラトン表現仮説（PRH）を信号、バイアス、ノイズの3分岐統計フレームワークを通じて調査します。信号に関しては、プラトンアライメントは、表現に線形でエンコードされるオブジェクトと属性間の普遍的関係から生じることを提案します。
arXiv cs.LG
2026年5月29日
ノルネ貯留層システムの逐次物理制約ニューラルオペレータ順方向モデリング
フーリエニューラルオペレータ(FNO)と物理情報付きの変種(PINO)に特に重点を置いて、ニューラルオペレータを使用した3相ブラックオイル貯留層ダイナミクスの逐次サロゲートモデリング用の包括的な数学および計算フレームワークを開発する。アプリケーションの焦点はノルネシステムである。
arXiv cs.LG
2026年5月29日
状態遷移を誘導する制約認識介入設計のための因果知能
ターゲットを絞った介入を通じてシステムをある状態から別の状態へ駆動することは科学の基本的な課題ですが、ほとんどの予測モデルは限定的なメカニズムの洞察と意思決定のための原則的フレームワークを提供していません。ここでは状態遷移のための因果的最適アクション（COAST）を提示します。
arXiv cs.LG
2026年5月29日
Conf-Gen: 生成モデルのための形式的不確実性定量化
形式的予測（CP）とその拡張である形式的リスク制御（CRC）は、機械学習における不確実性を形式的保証を通じて定量化するための確立されたフレームワークである。しかし、最近のAIの革新は教師なし生成モデルによってもたらされている。
arXiv cs.LG
2026年5月29日
【自治体AI zevo】Claude Opus 4.8 が本日2026年5月29日（金曜日）より利用可能に！新たな日本リージョンのClaude系の生成AIモデルを追加！
自治体向けAIプラットフォーム「zevo」に新型言語モデル「Claude Opus 4.8」が5月29日より利用可能になった。このサービスは地域課題の解決を目的としており、従来の中央集約型クラウドサービスから地方分散型へのシフトを示す重要な転換点となっている。地方企業による自治体固有のニーズに対応したAI活用モデルの開発が進む中、国際的な大型言語モデルのローカライズが加速し、AI産業のコモディティ化が進行している状況を反映している。
PR TIMES
2026年5月30日
AI活用で採用工数を月200時間削減した組織改革～Claude全社導入まで、kubellが実践する全社ルール×チーム自律～｜6/11(木)・6/18(木)開催
kubellがClaude全社導入により採用業務の工数を月200時間削減した事例が注目を集めています。同社の成功の鍵は、単なるツール選択ではなく「運用ルール設計」にありました。全社共通のルールを策定しつつ、具体的な運用方法は各チームに委譲するという「統制と自律のバランス」が、利用権限の曖昧さやプロンプト品質のばらつきといった実装段階の課題を排除したと考えられます。この取り組みは生成AI時代における組織設計の新しい在り方を示唆し、「管理と効率」から「創造性と統制のバランス」へのシフトを象徴しています。
PR TIMES
2026年5月30日
【論文公開】産科DICの病態を再整理する概念フレームワークがThrombosis Researchに掲載
産科DIC（播種性血管内凝固）の病態理解に新たな概念枠組みが提唱されました。従来は凝固・線溶の不均衡が中心とされてきましたが、岐阜大学の研究グループは妊娠・分娩による血管内皮機能の破綻を主軸とする「血管内皮中心フレームワーク」を論文化しました。この転換により、診断・治療戦略が変わる可能性があり、従来の対処療法から血管内皮機能の回復・保護を目指した個別的治療へのシフトが期待されています。
PR TIMES
2026年6月1日
Claude Codeの開発者、22歳のコンピューターサイエンス卒業生に“AIコーディングの現実”を語る…「黄金時代だ」
「歴史上、これほど起業に良い時期はなかった。まさに黄金時代だ」と、アンソロピックのAIコーディングツールClaude Codeの開発者ボリス・チェルニー氏はCS卒業生たちに語りかけました。
Business Insider Japan
2026年6月1日
Gait2Hip-60：マルチケイデンス歩行運動学からの股関節筋力と関節モーメント予測のための統合深層学習ベンチマーク
arXiv:2605.30374v1 歩行中の股関節筋力と関節モーメントの推定は通常、筋骨格シミュレーションに依存しており、有用であるが時間がかかり臨床設定への適用が難しい。本研究は下肢からのこれらの股関節動力学パラメータを直接予測するための深層学習フレームワークを開発した。
arXiv cs.LG