TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月28日
NVIDIAの研究がロボティクスをシミュレーションから現実世界へ推進
ロボティクスは新しい段階に入り、コントロールされたデモとスクリプト化された自動化から、現実世界での汎化可能で信頼性の高い具体化された自律性へ移行しています。国際ロボティクス会議で...
NVIDIA Blog
2026年5月29日
潜在推論による堅牢で効率的なガードレール
大規模言語モデル(LLM)の安全性維持は、現実世界のアプリケーションへの導入が増加する中で極めて重要です。既存の安全ガードレールは通常、単一パス分類に依存するか、より最近では蒸留推論を使用しています。推論ベースのガードレールは従来の分類方法を大幅に上回ります。
arXiv cs.AI
2026年5月30日
AvayaとavatarinAIを活用した顧客体験をコンタクトセンターから現実世界へ拡張
Avayaとアバター企業が協業し、コンタクトセンターのデジタルサービスを実店舗などの物理空間に拡張する動きが始まっている。遠隔操作可能なアバター技術により、オンラインと実店舗の顧客対応を一貫性のあるものにすることが可能になるとのこと。労働力不足への対策として、新興国の人材をリモート活用するモデルも注目されている。一方、消費者の違和感やプライバシー懸念、雇用問題への対応が課題であり、当面は高額商品やコンシェルジュサービスでの試験的導入が現実的だと考えられている。
PR TIMES
2026年5月30日
「Pokémon GO」10年の集大成。新旧トレーナーたちが集結した「Pokémon GO Fest 2026：東京」台場・青海地区会場の初日をレポート
「PokémonGO」初の東京を会場とするリアルイベント「PokémonGOFest2026：東京」が5月29日にスタートした。そのメイン会場に据えられたのは東京台場・青海の臨海副都心地区だ。現実世界とリンクしたポケモンの世界を，お台場で体験しよう。
4Gamer.net
2026年6月1日
長期タスク向けエージェント互換コンテキスト管理の学習
LLMエージェントはウェブサーチや深い研究など現実世界のアプリケーションにおける長期タスクにますます直面しており、蓄積されたコンテキストは長コンテキスト低下と推論失敗を引き起こすことがある。先行研究ではエージェント側のコンテキスト制御または固定戦略によるコンテキスト管理を通じてこれを緩和している。
arXiv cs.AI
2026年6月8日
本当に確実ですか？シンボリック回帰における不確実性定量化の包括的かつ理解可能な調査
シンボリック回帰（SR）は、数学関数の空間を体系的に探索し、データセット内の基礎的な関係を正確に捉えるモデルを発見する手法のクラスです。この分野の最近の進展にもかかわらず、不確実性定量化（UQ）のサポート不足が現実世界の意思決定プロセスへの採用を制限しています。回帰分析では、UQはモデルの信頼性に関する重要な情報を提供し、データの不確実性を考慮することでオーバーフィッティングを回避し、意思決定に向けた洞察を提供するのに役立ちます。本調査は、この問題に初めて明確に対処するもので、シンボリック回帰におけるUQの本質的な概念を紹介し、現在の文献を頻度主義的、ベイズ的、モデル選択という3つの研究方向に広く分類してレビューしています。その重要性にもかかわらず、シンボリック回帰におけるUQはまだ十分に探索されていないため、シンボリック回帰のための信頼できるUQ手法の研究をさらに進めることが重要です。
arXiv cs.LG
2026年6月10日
音声エージェントはバイリンガル顧客に対応できるか？コードスイッチ音声における最先端ASRのベンチマーク
音声エージェントがバイリンガル顧客との円滑なコミュニケーションを確立できるか、という問いに対し、自動音声認識（ASR）技術の現状を評価する新たな研究が行われています。特に注目されているのは、バイリンガル話者が会話中に複数の言語を切り替える「コードスイッチ」音声におけるASRシステムの性能です。この研究は、Hugging Faceによって実施されたベンチマーク調査であり、現在の最先端ASRシステムがコードスイッチ音声をどの程度正確に認識できるかを評価することを目的としています。多言語環境では、顧客が母国語と第二言語を混在させて話すことが頻繁にあり、これに音声エージェントが対応できるかはサービス品質を左右する重要な要素となります。今回の調査結果は、多言語対応のASR技術が直面する具体的な課題を明らかにし、今後の技術開発の方向性を示すものと期待されています。これにより、より高度なバイリンガル対応音声エージェントの開発が進み、多様な言語背景を持つ顧客へのサービス向上が図られることでしょう。引用元: Hugging Face
Hugging Face
2026年6月10日
合成根拠データを用いた教師ありファインチューニングは、現実世界の疾患予測を損なう
arXiv:2606.10279v1 発表タイプ: new 要旨：合成根拠データを用いた教師ありファインチューニング（SFT）は、モデルに予測対象だけでなくその理由も教えることで、臨床予測タスクにおける言語モデルの性能を向上させると広く考えられている。我々は、この仮説を、長期的な健康履歴からの5年間のアルツハイマー病および関連認知症（ADRD）予測について検証する。504の構成における大規模な制御実験を通じて、根拠ベースのSFTは、ラベルのみのファインチューニングと比較して、予測性能を一貫して大幅に損なうことがわかった。この低下は、モデルファミリーやデータ規模にわたらず持続し、推論指向のベースモデルを使用しても解決されない。重要なのは、この失敗は根拠の質の低さでは説明されないことである。人間の専門家による注釈は、生成された根拠が医学的に正確であり、患者固有の証拠に忠実に根ざしていることを確認しており、Few-shot実験は、同じ根拠がトレーニングターゲットとしてではなく推論時のデモンストレーションとして使用された場合に性能を向上させることを示している。
arXiv cs.AI
2026年6月15日
スペースXを乗り越え、イラン合意とFRBに注目する株式市場
先週、スペースXとその引受銀行が史上最大規模のIPOを問題なく成功させた後、投資家は再び現実世界に目を向けている。
Bloomberg
2026年6月17日
LifeSciBenchの紹介
AIシステムが現実世界の生命科学研究タスクや意思決定をどのように処理するかを評価するための、専門家が作成・審査したベンチマークであるLifeSciBenchを紹介します。
OpenAI
2026年6月17日
この国はどこへ行こうとしているのか:便利なのに息切れする時代を生きるヒント熊谷晋一郎さんの考え
SNSが世の中を変えてしまった昨今である。　大国の指導者からインフルエンサーまで、おびただしい発信がSNSからもたらされる。現実世界への影響力は計り知れない。　一方で社会の分断を招き、格差を浮き彫りにすることもしばしば。
毎日新聞
2026年6月17日
ヘイトスピーチは「非人間化への第一歩」
オンラインプラットフォームが脆弱なコミュニティに対する現実世界の暴力を煽り続ける中、国連事務総長のアントニオ・グテーレス氏は、表現の自由はヘイトスピーチを正当化するために決して使用されてはならないと警告しています。
UN News
2026年6月21日
上位に浮上した仲村果乃。そして青木瀬令奈、政田夢乃が魅せた猛チャージの裏側【国内女子ツアー】(みんなのゴルフダイジェスト)
強風と高速グリーンで難化したニチレイレディス2日目、怒涛のバーディラッシュで一気に上位へと浮上したのが仲村果乃、青木瀬令奈、政田夢乃の3人だ。過酷な新袖コースを鮮やかに攻略し、一躍リーダーボードを駆け
Yahoo!ニューススポーツ
2026年6月23日
CELEUS：Eプロセスによる認定可能で効率的なLLM評価
評価スコアはLLMの真の現実世界でのパフォーマンスを捉えていると信頼できるだろうか？認定可能な評価は、LLM評価の保証を提供することで、この疑問に答える。既存の手法は、評価サンプルを逐次的にキュレーションし、高確率（例：95%）で真のパフォーマンスをカバーする信頼区間（CI）を更新し続けるが、CI幅が目標精度に達するなどの条件が満たされるまでだ。しかし、既存の手法は一般的にいつでも有効（anytime-valid）ではない：CIが繰り返し更新され、停止決定に使用されると、主張されるカバレッジ（例：95%）が失敗する可能性があり、理論的な厳密さと実践の間にギャップが生じる。本論文は、いつでも有効なCIを構築するためにEプロセスを活用する、認定可能な効率的なLLM評価フレームワーク、Celeusを提案することで、このギャップを埋める。具体的には、(i)不確実性ガイドサンプリングで評価のための情報量の多いサンプルを選択し、(ii)評価されていないサンプルに対する代理近似、という2つの要素を組み合わせたシグナルを提案する。
arXiv cs.LG
2026年6月23日
ダーウィン・モバイル・エージェント：自己進化へのロードマップ
人工知能の目標は、オープンエンドな環境で一般的かつ適応的な行動が可能なエージェントを作成することです。「ビター・レッスン」に基づき、この目標への最も効果的な道は、人間の事前知識を体系的に排除し、エージェント自身よりも桁違いに複雑な「ビッグ・ワールド」との相互作用を通じて、知性が自然に現れるようにすることだと主張します。このような世界の実際的な代理として、モバイル・グラフィカル・ユーザー・インターフェース（GUI）を提案し、この領域での自律的な強化学習の基盤として設計されたオープンソース・インフラストラクチャであるダーウィン・モバイル・エージェントを紹介します。このフレームワークは、並列クラウドフォン・インスタンス全体での非同期エージェント・環境ループを使用することで、現実世界のモバイル相互作用におけるデータ収集のボトルネックに対処します。さらに、自己進化エージェントの3つの基本的な柱、すなわちタスク・カリキュラム、結果検証、メモリ管理から人間の事前知識を体系的に排除するための概念的なロードマップを提案します。
arXiv cs.AI
2026年6月24日
FFASRリーダーボードの紹介：現実世界でのASR（自動音声認識）のベンチマーキング
FFASRリーダーボードは、現実世界の多様なASR（自動音声認識）システムを評価するための新しいベンチマークです。これにより、研究者や開発者は、実際の利用シナリオにおけるASRのパフォーマンスを客観的に比較・分析できます。
Hugging Face