News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2025年12月8日

    Kubernetesスケジューラのベンチマークテスト

    本記事は、PFNのインターンシップを経て現在はアルバイトとして勤務されている上田蒼一朗さんによる寄稿です。 はじめに Preferred Networks(以下PFN)ではKubernetesを用いた機械学習基盤の開発・ […] 投稿 Kubernetesスケジューラのベンチマークテスト は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  2. 2026年2月20日

    日本語の自然さを測る評価手法の検証

    Preferred Networksでは大規模言語モデル (LLM) PLaMoの開発を継続して行っています。 LLMを開発するにあたってその能力を評価するベンチマークは非常に重要です。英語においては様々なベンチマークが […] 投稿 日本語の自然さを測る評価手法の検証 は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  3. 2026年2月25日

    コード生成ベンチマークのためのサンドボックス環境の開発

    はじめに Preferred Networksでは、大規模言語モデル「PLaMo」の開発を行っています。 PLaMoは開発サイクルにて様々なベンチマークによりその能力を評価していますが、今回はコード生成ベンチマークにてモ […] 投稿 コード生成ベンチマークのためのサンドボックス環境の開発 は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  4. 2026年5月15日

    DatabricksがGPT-5.5をエンタープライズエージェントワークフローに導入

    DatabricksがOfficeQA Proベンチマークで最先端の成績を達成したGPT-5.5をエンタープライズエージェントワークフローに活用しています。

    OpenAI

  5. 2026年5月18日

    pretrained model向けのベンチマークの構築

    Preferred Networks では、大規模言語モデル PLaMo の開発を継続して行っています。 LLM を開発するうえで、モデルの能力を適切に測定するベンチマークは重要です。英語ではさまざまなベンチマークが日々 […] 投稿 pretrained model向けのベンチマークの構築 は Preferred Networks Tech Blog に最初に表示されました。

    Preferred Networks

  6. 2026年5月27日

    NVIDIA Vera CPUが競合製品に対して「強力なパンチを繰り出している」

    エージェンシャルAIへのシフトは、AIファクトリーの新しいCPU要件を生み出します:高速コア、膨大なメモリ帯域幅、およびすべてのコアがアクティブな場合でも高いパフォーマンスを維持する能力です。初期ベンチマークでは...

    NVIDIA Blog

  7. 2026年5月29日

    Amazon Bedrock AgentCoreのデータセット管理でエージェントとともに成長するテストスイートを構築

    エージェント評価は、急速に変化するオンラインシグナルと安定したオフラインベースラインを組み合わせることで最も強力になります。エージェントが時間とともに本当に改善されているかどうかを理解するには、固定ベンチマークが必要です。

    AWS Machine Learning Blog

  8. 2026年5月29日

    「KOYABU SONIC 2026」開催決定 第1弾出演者にトット、今井らいぱち、たくろう、ヒコロヒーら

    小籔千豊が主宰する音楽とお笑いのイベント「KOYABU SONIC 2026」の開催が決定した。今年は9月21日(月・祝)、9月22日(火・休)、9月23日(水・祝)の3日間。

    お笑いナタリー

  9. 2026年5月29日

    チェーンが保たれる、答えが折れる:敵対的圧力下での推論モデルの軌跡と答えの乖離

    推論モデルはシングルターンベンチマークで評価されているが、ユーザーが正解に異議を唱えるマルチターン対話環境に配備されている。継続的な敵対的圧力下では、これまで文書化されていない障害モードが見つかった:思考の連鎖は最初のターンから最後まで事実上正確であるが、回答は変わる。

    arXiv cs.AI

  10. 2026年5月29日

    BEAMS: AI モデリング・シミュレーション評価ベンチマーク

    実世界の意思決定を支援するAIツールは、推奨事項を知らせ解釈可能にするシミュレーションモデルを構築できる必要があります。モデリング実務の側面を自動化できるツールは、人間の専門知識を補完する必要があり、置き換えるべきではありません。BEAMS Initiativeは、開発を指導することを目的としています。

    arXiv cs.AI

  11. 2026年5月29日

    検出可能効果の事前登録:4ビット量子化ベンチマーク用ペアリングMDEバジェット、パイロット監査付き

    これはペアリングなしパイロット監査を伴う計画方法に関する注記である。古典的なペアリング二項サンプルサイズ計算(Miettinen, 1968)を量子化ベンチマークに適応させ、ペアリングされた最小検出可能効果(MDE)の保守的な下限を提供している。

    arXiv cs.LG

  12. 2026年5月29日

    FormInv: 数学推論ベンチマークにおけるセマンティック不変性の測定プロトコル

    MathCheck(ICLR 2025)のパラフレーズ品質監査により、129グループ中4つのセマンティック的に不正確なパラフレーズ(3.1%)が検出されました。これらを削除するとGPT-4oはランク2からランク4に低下し、Claude HaikuとDeepSeek V3がそれを上回ります。これらのランク変動は単一モデル評価では見えません。

    arXiv cs.LG

  13. 2026年5月29日

    ReverseMath: 数学問題生成の拡張可能性と検証可能性を実現する逆向き回答手法

    数学推論ベンチマークはLLMの評価に不可欠だが、多くは静的で公開評価やトレーニングパイプラインを通じて繰り返し露出しており、真の推論と暗記を区別することが困難である。一方、新しい数学問題の手動構築は...

    arXiv cs.CL

  14. 2026年5月29日

    BenchTrace:LLMエージェントの反省能力と制御された進化をテストするベンチマーク

    arXiv:2605.29225v1 文書の発表。自己進化型エージェントは過去の失敗を反省することで時間とともに改善されますが、既存の評価には2つの制限があります。タスクスコアのみを測定して反省の質は不明であり、エージェント自身のエピソード実行に依存して特定の失敗パターンに対応するメカニズムがありません。本論文では新しいアプローチを提示しています。

    arXiv cs.AI

  15. 2026年5月29日

    GTA:スケーラブルなWebエージェント用ロングホライズンタスク生成

    arXiv:2605.29218v1 文書の発表。言語モデルをブラウジングおよびツール使用機能と組み合わせたWebエージェントは、オープンなWebアシスタントとしての可能性を示していますが、スケーラブルなプロセスレベルの監督の不足により進展が制限されています。既存のベンチマークは主に手動で構築されており、粗い開始ゴール注釈のみを提供しています。

    arXiv cs.AI

  16. 2026年5月29日

    多言語LLMタスク実行における言語役割の分離

    多言語LLMは、指示、ソースコンテンツ、および必要な応答言語が一致しない場合にますます使用されています。既存のベンチマークは多言語命令追従評価を拡張していますが、完全にクロスされた設計内でこれら3つの役割を分離することはめったにありません。MTM-Benchを導入します。

    arXiv cs.CL

  17. 2026年5月29日

    Ryzen AI 9 HX 470搭載のハイスペックなミニPC「GEEKOM AI PC A9 MAX」を試す。ゲームをプレイするならメモリの追加は必須だ

    手のひらに乗るようなコンパクトな筐体を採用して,ニッチなポジションを築いているのがミニPCだ。ここ数年は上位クラスのノートPCに匹敵するようなスペックを備えたモデルも増えてきた。今回紹介する「GEEKOMAIPCA9MAX」は,ハイエンドに属する製品である。

    4Gamer.net

  18. 2026年5月29日

    「年上の女の子っていいよなー」KOMOREBIとSad Kid Yazが意気投合

    ヒップホップユニットKOMOREBIが、新曲「年上の女の子 feat. Sad Kid Yaz」を本日5月29日に配信リリースした。

    音楽ナタリー

  19. 2026年5月29日

    韓国が6ヶ月の映画館上映窓口契約を詰める委員会を設立

    韓国文化体育観光部とKOFIC(韓国映画委員会)は、映画配給の上映窓口に関する協議を進めるための官民合同諮問機関を立ち上げた。

    Variety

  20. 2026年5月29日

    プレイするたびにルールが変化するローグライクチェスゲーム「Gambit」,誰でも参加できるプレイテストを開催中

    個人開発者のJeriko氏は本日(2026年5月29日),開発中の新作タイトル「Gambit」のオープンプレイテストを開催中であると発表した。本作は,ルールが毎回変化するチェスに挑戦する,ローグライクチェスゲームだ。

    4Gamer.net

  21. 2026年5月29日

    えびちゅう仲村悠菜19歳、ソロコン4杯目の「純喫茶ミルクティー」早口すぎて大幅に巻く

    本日5月29日に19歳の誕生日を迎えた私立恵比寿中学の仲村悠菜が、18歳最後の日となった昨日5月28日に神奈川・KT Zepp Yokohamaでバースデーソロライブ「純喫茶ミルクティー~4杯目~」を開催した。

    音楽ナタリー

  22. 2026年5月30日

    GS Plus 第4弾「GS Plus 日本株式(TOPIXアルファ)」新登場!

    ゴールドマン・サックスが新たな日本株投資商品「GS Plus 日本株式(TOPIXアルファ)」を発表した。この商品は、TOPIXの構成銘柄から割安性や成長性などの指標で優良企業を厳選し、指数を上回るリターンを目指すもの。日本株が長期停滞する中、機関投資家のニーズが従来のベンチマーク運用からアルファ追求型へシフトしており、データ科学や機械学習を活用した新しい運用戦略が業界で広がっている。

    PR TIMES

  23. 2026年5月30日

    インドネシアコンピュータ大学とインターンシッププログラムに関する覚書を締結

    総合人材情報サービスの株式会社アイデム(東京都新宿区 代表取締役社長:椛山亮)が展開するアイデムグローバルは、インドネシアコンピュータ大学(Universitas Komputer Indonesia/UNIKOM)と、インターンシッププ...

    PR TIMES

  24. 2026年5月30日

    【6月9日(火)22時~無料ウェビナー開催】営業DXの新常識――“AIリスト活用”でアポ率激変、未経験営業でも年間6000万円を目指す無料ウェビナー!

    KOBUSHI MARKETING合同会社(東京都渋谷区、代表:井上裕介)は、ビジネスの拡大に繋がる様々な取り組みを行っている。そして今回、2026年6月9日(火)22:00~ピースフラットシステムの片川代表とのコラボで、生成A...

    PR TIMES

  25. 2026年5月30日

    【人気コスメ・アパレル・グルメに出会える!】韓国の20のHOT PLACEが集結する『週末KOREA ハップルFES in OSAKA』がグラングリーン大阪で開催決定

    光文社と毎日放送(MBS)で構成される「週末KOREA」は、2026年7月4日(土)・5日(日)の2日間、グラングリーン大阪にて、韓国の最新トレンドを五感で楽しめる体験型イベント『週末KOREA ハップルFES in OSAKA』...

    PR TIMES

  26. 2026年5月30日

    エンタープライズ向けAIコンタクトセンターサービスを開発・提供する株式会社Rechoへ出資

    グローバル・ブレイン株式会社(以下、グローバル・ブレイン)が運営する、KDDI Open Innovation Fund V(以下、KOIF V)は、エンタープライズ向けAIコンタクトセンターサービスを開発・提供する株式会社Recho(...

    PR TIMES

  27. 2026年5月30日

    【北海道日本ハムファイターズ応援プラン販売中】HAKODATE海峡の風で楽しむ夏の函館旅|抽選で観戦チケットや直筆サイン特典も

    北海道の湯川温泉の旅館が、プロ野球の北海道日本ハムファイターズとのタイアップ企画を実施しています。夏の函館旅行プランで、観戦チケットや選手直筆サイン球が抽選で当たる特典を用意しており、地方観光の新たな集客戦略として注目されています。訪日外国人増加により京都などへの観光が一極集中する中、地方都市の温泉宿が経営難に直面しているため、スポーツファンという新しい顧客層を取り込む取り組みとなっています。

    PR TIMES

  28. 2026年5月30日

    北欧デザインとアフリカの手仕事を融合したライフスタイルブランド「Mifuko」、ライフスタイル Week 夏 2026 に出展

    フィンランド発のライフスタイルブランド「Mifuko」の日本総代理店を務める 株式会社UNISENSE は、2026年6月に東京ビッグサイトにて開催される ライフスタイル Week 夏 2026 に出展いたします。 Mifukoは、北欧...

    PR TIMES

  29. 2026年5月30日

    【AYAKO SAKURAI】SUMMER Collection 2026 発表 - “今出会えた人だけが手にできる”限定ジュエリー

    AYAKO SAKURAIが2026年夏季の限定ジュエリーコレクションを発表しました。このコレクションは「その瞬間にしか出会えない」ことを価値とする戦略が特徴で、デジタル化により流通が加速する現代において、時間的な希少性に焦点を当てています。消費心理学の「スカーシティ効果」を活用し、ラグジュアリー層が重視するストーリー性や時代性を提供することで、購買欲を高める工夫がなされています。季節感を失いつつある現代人にとって、季節対応のカラーストーンを用いた宝飾品は時間経験を再獲得するツールとしても機能します。

    PR TIMES

  30. 2026年5月30日

    カザフスタン映画がSXSW Londonで注目集める。ボラットは不要!

    『Sicko』と『Becoming』を含む長編映画や短編映画の上映が予定されており、イベントのスクリーン部門トップであるアンナ・ボグツカヤが中央アジアの映画産業の可能性について説明している

    The Hollywood Reporter