TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年3月18日
AGI への進捗を測定する：認知フレームワーク
AGI への進捗を測定するフレームワークを導入し、関連する評価を構築するための Kaggle ハッカソンを開始
Google DeepMind
2026年3月23日
Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について
はじめに Preferred Networksの加藤です。AIプロダクト・ソリューションチーム所属で、AutoMLチームも兼務しています。PFNでは Preferred AI という生成AIを活用したプロダクト群を開発し […] 投稿 Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能については Preferr…
Preferred Networks
2026年5月8日
Velox：4次元ジオメトリと外観の表現学習
4次元オブジェクトの潜在表現を学習するフレームワークを紹介。オブジェクトのジオメトリと外観を忠実に捉える記述性、下流のタスク効率を支援する圧縮性を備える。
Apple Machine Learning Research
2026年5月11日
BalCapRL: RL ベースのMLLM画像キャプション生成用のバランス型フレームワーク
画像キャプション生成はコンピュータビジョンの最も基本的なタスクの一つです。その開放性の性質により、マルチモーダル大規模言語モデル（MLLM）の時代に多大な関心を集めています。
Apple Machine Learning Research
2026年5月13日
HermesがNVIDIA RTX PCおよびDGX Sparkによって強化された自己改善AIエージェントをアンロック
エージェンティックAIはユーザーが仕事をこなす方法を変えています。OpenClawの成功に続き、コミュニティは新しいオープンソースエージェンティックフレームワークを採用しています。最新のHermes Agentは140,000を超えるダウンロードを達成しました。
NVIDIA Blog
2026年5月27日
ついにMonoランタイムを脱却する「.NET MAUI」。Xamarinから続いてきたMonoランタイムをCoreCLRに移行
マイクロソフトは、シングルコードでiOS、Android、Windows、macOSに対応するUIフレームワーク「.NET MAUI」のiOSとAndroidにおけるランタイムが、今秋リリース予定の.NET 11でCoreCLRに移行するこ...
Publickey
2026年5月28日
OpenAIのフロンティア・ガバナンス・フレームワーク
OpenAIのフロンティア・ガバナンス・フレームワークと、AI安全保障、セキュリティ、リスク慣行がEUおよびカリフォルニア州の新興規制とどのように整合しているかを探る。
OpenAI
2026年5月29日
拡散モデルの柔軟で効率的な制御のためのスペクトル誘導
生成プロセスの固有幾何学を活用することで、拡散モデルを制御するためのフレームワークであるSpectral Guidanceを導入する。データがノイズによって段階的に破損するにつれて、制御に対して有用な情報を保つ特徴は少数のみとなり、それらを特異関数として特徴付ける。
arXiv cs.LG
2026年5月29日
状態遷移を誘導する制約認識介入設計のための因果知能
ターゲットを絞った介入を通じてシステムをある状態から別の状態へ駆動することは科学の基本的な課題ですが、ほとんどの予測モデルは限定的なメカニズムの洞察と意思決定のための原則的フレームワークを提供していません。ここでは状態遷移のための因果的最適アクション（COAST）を提示します。
arXiv cs.LG
2026年5月29日
AI強化教育における実践者の信念と行動：DOTフレームワーク調査の証拠
本研究は、高等教育実践者72名を対象とした横断的調査の結果を報告しています。設計思考を統合したDOTフレームワークに基づき、教育と学習におけるAI統合に関連する信念、行動、および機関的条件を検証したものです。
arXiv cs.AI
2026年5月29日
Conf-Gen: 生成モデルのための形式的不確実性定量化
形式的予測（CP）とその拡張である形式的リスク制御（CRC）は、機械学習における不確実性を形式的保証を通じて定量化するための確立されたフレームワークである。しかし、最近のAIの革新は教師なし生成モデルによってもたらされている。
arXiv cs.LG
2026年5月29日
PAST2HARM: マルチモーダルAIのジェイルブレイク用シンプル適応型過去形攻撃
マルチモーダルAIシステムへのジェイルブレイク攻撃は未だ十分に研究されていません。テキストの不安全な生成よりも深刻な結果をもたらす可能性のある不安全な画像生成が存在する一方で、現在の防御策は比較的成熟していません。本研究ではPAST2HARMという、拒否トレーニングをバイパスする効果的な適応型ジェイルブレイクフレームワークを紹介します。
arXiv cs.CL
2026年5月29日
幻覚削減のための格子上のチェーンベース適応再構成
大規模言語モデルにおけるテスト時の幻覚削減のための確率的フレームワークであるCAROL（Chain-based Adaptive Reconfiguration Over Lattices）を導入します。トークンレベルの不確実性に依存するのではなく、CAROLは生成された結果間の一貫性に基づいて意味的不確実性測度を定義します。
arXiv cs.CL
2026年5月29日
反応トーンを通じたコミュニティ態度のモデリング：オンラインコミュニティの言語的行動とLLMアラインメント評価のための人間-AI協働フレームワーク
大規模言語モデル（LLM）は計算社会分析のプロキシとしてますます利用されていますが、人間のコミュニティの「厚い記述」を忠実に表現する能力は依然として重大な課題です。現在の評価では、社会的アイデンティティを静的なラベルに縮小することが多いです。
arXiv cs.CL
2026年5月29日
ビッグ2における不完全情報下の自己対戦強化学習
不完全情報の多人数ゲームは、エージェントが隠された情報、スパースな報酬、および非定常の対手の下で行動できるかどうかをテストします。4人プレイの不完全情報カードゲームであるビッグ2でこれらの課題を研究し、制御された比較を可能にする自己対戦RLフレームワークを開発しました。
arXiv cs.LG
2026年5月29日
StoryMI: 操作可能なマルチエージェント治療対話生成
大規模言語モデル(LLM)は流暢な対話を生成できますが、先行研究は状況的な根拠付け、動的戦略制御、および動機面接(MI)の臨床基準に合致した評価が不足しています。我々はStoryMIを導入しました。これは制御可能なMI対話生成のための複数LLMエージェントフレームワークです。
arXiv cs.CL
2026年5月29日
表現アライメントは線形構造に基づいている
プラトン表現仮説（PRH）を信号、バイアス、ノイズの3分岐統計フレームワークを通じて調査します。信号に関しては、プラトンアライメントは、表現に線形でエンコードされるオブジェクトと属性間の普遍的関係から生じることを提案します。
arXiv cs.LG
2026年5月29日
VFEAgent: 有限要素解析エンドツーエンド自動化のためのマルチモーダルエージェントフレームワーク
有限要素解析(FEA)は現代工学設計の根幹をなします。しかし、そのワークフローは本質的に複雑であり、領域知識に大きく依存しています。最近のLLMのFEA統合の試みにもかかわらず、既存のアプローチは複数の側面の処理における制限に直面しています。
arXiv cs.AI
2026年5月29日
ノルネ貯留層システムの逐次物理制約ニューラルオペレータ順方向モデリング
フーリエニューラルオペレータ(FNO)と物理情報付きの変種(PINO)に特に重点を置いて、ニューラルオペレータを使用した3相ブラックオイル貯留層ダイナミクスの逐次サロゲートモデリング用の包括的な数学および計算フレームワークを開発する。アプリケーションの焦点はノルネシステムである。
arXiv cs.LG
2026年5月30日
【論文公開】産科DICの病態を再整理する概念フレームワークがThrombosis Researchに掲載
産科DIC（播種性血管内凝固）の病態理解に新たな概念枠組みが提唱されました。従来は凝固・線溶の不均衡が中心とされてきましたが、岐阜大学の研究グループは妊娠・分娩による血管内皮機能の破綻を主軸とする「血管内皮中心フレームワーク」を論文化しました。この転換により、診断・治療戦略が変わる可能性があり、従来の対処療法から血管内皮機能の回復・保護を目指した個別的治療へのシフトが期待されています。
PR TIMES
2026年6月1日
TraceGraph: エージェント軌跡の診断と改善のための共有決定ランドスケープ
エージェントベンチマークはますます豊富なインタラクション軌跡を記録していますが、評価では各ロールアウトを合格率または報酬スコアに還元することが多いです。TraceGraphは、リリースされたマルチモデルエージェント軌跡を共有決定ランドスケープに変換するグラフベースのフレームワークを紹介します。
arXiv cs.AI
2026年6月1日
AISベース海事異常検出における教師なし学習の新規評価指標：MADQI
本論文は、自動識別システム（AIS）データセットの異常検出のための新しい体系的フレームワークを導入する。これらの異常には、速度、位置ジャンプ、時間差、旋回角に関連した異常な船舶行動が含まれる。Isolation Forestなどの教師なし学習アルゴリズムが利用されている。
arXiv cs.LG
2026年6月1日
Gait2Hip-60：マルチケイデンス歩行運動学からの股関節筋力と関節モーメント予測のための統合深層学習ベンチマーク
arXiv:2605.30374v1 歩行中の股関節筋力と関節モーメントの推定は通常、筋骨格シミュレーションに依存しており、有用であるが時間がかかり臨床設定への適用が難しい。本研究は下肢からのこれらの股関節動力学パラメータを直接予測するための深層学習フレームワークを開発した。
arXiv cs.LG
2026年6月1日
ナレッジグラフ強化ゼロショット・トピック分類：複数戦略の比較研究
arXiv:2605.30465v1。ラベル付き訓練データなしでの多ラベル・トピック分類は困難な課題であり、特に複雑な関係情報を含む文書の場合。記事ごとのナレッジグラフ拡張がどのように分類に影響するかを体系的に調査したゼロショット多ラベル・トピック分類フレームワークを提示。
arXiv cs.CL
2026年6月1日
生成型AIにおける多元的アライメント評価フレームワーク
arXiv:2605.31021v1 現在の生成型AIのアライメント手法は、人間の判断の多様性を集計された統計的基準に縮約する単一的なベンチマーク枠組みに依存しており、文化的、人口統計学的、文脈的な評価のばらつきが見落とされている。本論文では、これらの違いを考慮したペルソナベースの評価フレームワークを提案する。
arXiv cs.AI
2026年6月1日
LLM-FACETS: LLM透明性と説明責任を評価するプライバシー保護フレームワーク
大規模言語モデルの出力が事実に基づき、認識論的に調整され、方法論的に再現可能であるかを評価することは、責任あるAIの導入の前提条件です。しかしLLMの監査は非技術者には依然としてアクセス困難であり、既存ツールはプログラミングの専門知識を必要とします。
arXiv cs.AI
2026年6月1日
自動運転のための強化学習における不確実性認識と時間的に規制された専門家アドバイス
arXiv:2605.30576v1 発表型：新規要旨：自動運転の強化学習における探索は本質的に危険である。エージェントは学習のために新しい行動を経験する必要があるが、探索は衝突やオフロード走行につながる可能性がある。我々は、長期的な危険を回避しながら探索を導くために専門家アドバイスを活用する不確実性認識フレームワークを提案する。
arXiv cs.AI
2026年6月1日
多目的最適化における勾配集約の統一フレームワーク
arXiv:2605.30452v1 多くの機械学習の問題には複数の固有のトレードオフが含まれており、勾配ベースの多目的最適化（MOO）アルゴリズムで最もよく対処されます。既存の手法はさまざまな動機で提案されており、ケースバイケースで分析され、成分勾配の集約方法がアルゴリズム的に異なります。
arXiv cs.LG
2026年6月1日
言語モデルにおけるドメイン適応と推論フレームワーク：歴史的宇宙論を用いた統制実験
歴史的宇宙論を統制設定として使用し、ドメイン適応が言語モデルの説明行動をどのように変化させるかを調査した研究。フェーズ1では、明示的な地動説への言及を削除したコペルニクス以前のコーパスから小規模言語モデルをゼロから訓練し、地動説的な説明を生成できるかを評価する。
arXiv cs.CL
2026年6月2日
「正しい決断ができる人」が無意識にやっている思考の整理術・ベスト1 - フレームワークBEST100
ビジネスの現場において、データに基づく意思決定は欠かせません。しかし、数字を扱っているつもりでも、単に表面的な動きだけを見て判断を誤ってしまう人がいます。
ダイヤモンド・オンライン