News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2026年5月28日

    Amazon Bedrock Data Automationを使用して財務書類を処理

    この投稿では、Amazon Bedrock Data Automationが、銀行残高書、W-2フォーム、1099-B税務フォーム、ベンダー請求書を含む4つの一般的な財務書類タイプから情報を正確に抽出する方法を探ります。

    AWS Machine Learning Blog

  2. 2026年5月29日

    Simorgh at SemEval-2026 task 7: 多言語質問応答におけるリソース限定的な文化的推論用の地域認識型ハイブリッド検索

    大規模言語モデル(LLM)は一般領域内の一般的な推論タスクに対して優れた能力と性能を示していますが、デジタルテキストデータが限定的な言語における文化的に根拠付けられた知識に関しては課題に直面する可能性があります。本論文では、言語固有の文化的知識への対応について調査しています。

    arXiv cs.CL

  3. 2026年5月29日

    インドのモンスーン雨の見通しが悪化を受けて砂糖が1ヶ月ぶりの大幅上昇

    ニューヨークの砂糖先物は、エルニーニョ気象パターンが降雨を抑制し、作物に被害をもたらす可能性があるという懸念から1ヶ月ぶりの最大漲幅を記録した。

    Bloomberg

  4. 2026年6月1日

    モデル特殊化のための自律型エージェント型データエンジニアリングの探索

    大規模言語モデル(LLM)は一般的なタスクで優れたパフォーマンスを発揮していますが、高品質なドメイン固有のデータなしに特殊なドメインに適応するのに苦労しています。既存の LLM ベースのデータキュレーション方法は主に人間が設計したワークフローに依存しており、LLM が自動的に適応できるかどうかはまだ検証されていません。

    arXiv cs.CL

  5. 2026年6月1日

    破壊は生成学習の一般的な戦略である。拡散モデルの強みはそれを真摯に受け止めることである。探索が未来である

    拡散モデルをモデルの入力から情報を隠し、隠された情報を推測するように訓練する機械学習技術のファミリーの一部として提示する。拡散の破壊的なアプローチは、典型的な手作りの情報隠蔽と比較してより柔軟であると主張する。

    arXiv cs.LG

  6. 2026年6月1日

    Leanの定理証明のためのLLMフィードバック蒸留

    推論モデルのポストトレーニングは通常、検証可能な報酬からの教師あり微調整と強化学習を組み合わせ、最も一般的にはGRPOで行われている。しかしこのアルゴリズムは報酬の疎さ、限定的な探索、モード崩壊に悩まされている。自己蒸留に関する最近の研究に基づき、改善されたアプローチを提案する。

    arXiv cs.AI

  7. 2026年6月2日

    RAFT:ドメイン微調整のためのデータ精緻化と適応的蒸留(忘却緩和付き)

    ドメイン固有の教師あり微調整(SFT)は、しばしばドメイン内性能を向上させる一方で、モデルの一般的な能力を低下させます。本論文では、この低下を2つの実践的ギャップを通じて捉えます。ドメインターゲットがスタイルと推論形式において異なることに起因する、教師データ互換性ギャップです。

    arXiv cs.LG

  8. 2026年6月2日

    医療用大規模言語モデルの安全性、ロバスト性、公平性評価のためのマルチドメインレッドチーミングフレームワーク

    大規模言語モデル(LLM)はヘルスケア分野でますます導入されていますが、既存のベンチマークは臨床実践で一般的な対抗的または倫理的に複雑な条件下でのモデル動作を捉えることができません。11の現代的なLLMを6つのドメインで評価するマルチドメインレッドチーミングフレームワークを開発しました。

    arXiv cs.CL

  9. 2026年6月2日

    拡張を超えて:EEG脳波ベースの抑うつ検出のためのスコアガイド病理学的事前学習

    脳波(EEG)を用いた深層学習ベースの大うつ病性障害(MDD)検出は、「小サンプルのジレンマ」によって根本的に制約されています。一般的な生成的データ拡張手法は、高い計算コストを招くだけでなく、合成ノイズの導入のリスクもあります。

    arXiv cs.LG

  10. 2026年6月2日

    SALSA:学習された操舵活性化ベクトルによる音声認識LLM適応

    音声認識対応の大規模言語モデルは、ドメイン外設定への汎化が不十分です。我々はSALSA(学習された操舵活性化による音声認識LLM適応)を提案します。これは層ごとの操舵ベクトルを学習する軽量適応方法です。対比に依存する一般的に使用される操舵アプローチとは異なります。

    arXiv cs.CL

  11. 2026年6月3日

    Amazon Nova Forgeでのハイパーパラメータ最適化の技術と科学

    ドメイン固有のタスク用のファインチューニングは、一つの領域でのパフォーマンス向上をモデルの一般的な能力の低下なしに実現することを意味しており、このバランスを正しく取ることは見た目以上に難しいものです。

    AWS Machine Learning Blog

  12. 2026年6月3日

    “8月にかけ80%の確率でエルニーニョ現象発生” 世界気象機関

    WMO=世界気象機関は2日、今月から8月にかけて80%の確率で「エルニーニョ現象」が発生するという予測を発表しました。これによって世界のほとんどの地域で気温が平年より上昇し、熱波や豪雨などのリスクが高まるおそれがあると警戒を呼びかけています。

    NHK 社会

  13. 2026年6月3日

    高血圧や認知症予防にも期待、医師が勧める手軽な「リカバリー習慣」 - ニュースな本

    成功者が習慣的を取り入れていることから、多くのビジネスパーソンに注目されている、瞑想。集中力が高まる、ストレスが軽減するなどの効果があることは一般的に認識されているが、実はそれだけではない。瞑想がもたらす、知られざる効果を医師が解説する。※本稿は、精神科医の久賀谷 亮『最高の脳リカバリー法 からっぽ瞑想』(エクスナレッジ)一部を抜粋・編集したものです。

    ダイヤモンド・オンライン

  14. 2026年6月5日

    【ヤフコメで話題】「ホワイトカラーの将来とAI時代の雇用不安」「米国型IT労働の是非」 - 知的労働の価値と働き方を巡る議論(Yahoo!ニュース オリジナル THE PAGE)

    ホワイトカラーの働き方や将来性、AI時代の雇用について、Yahoo!ニュースのコメント欄で話題になっています。 米国のIT産業ではホワイトカラーエグゼンプションによる長時間労働が一般的で、高給の見返り

    Yahoo!ニュース IT

  15. 2026年6月5日

    前田敦子「私はそう思っていないから…」交際に発展しない男性のタイプ明かす 共演者「ええええ!」…「あざとくて何が悪いの?」(スポーツ報知)

    元AKB48で女優の前田敦子が4日放送のテレビ朝日系「あざとくて何が悪いの?」(木曜・深夜0時55分)に出演。仲良くなるタイプの男性を明かした。  この日は一般的にアニメや漫画などの背景に登場する

    Yahoo!ニュース エンタメ

  16. 2026年6月6日

    Agentopia:エージェント社会における長期的人生シミュレーションと学習

    大規模言語モデル(LLM)によって駆動されるAIエージェントが、仮想空間で人間社会を模倣し、長期的な生活をシミュレーションする新たな研究「Agentopia」が注目を集めています。この研究では、100体のAIエージェントが10年間の仮想時間の中で自律的に行動し、互いに社会関係を築きながら生活する様子が再現されます。 これまでの研究におけるシミュレーション期間は数日程度が一般的でしたが、「Agentopia」では大幅に延長された期間を設定することで、より深く複雑な社会的相互作用や、エージェント個々の長期的な成長パターンを詳細に観察することが可能になります。研究チームは、このシミュレーションを通じて、LLMが人間の行動原理を学習し、再現する能力をさらに発展させることを目指しています。 仮想社会におけるAIエージェントの行動や関係性の変化を分析することで、人間社会のダイナミクスを理解するための新たな知見が得られる可能性があり、未来のAI開発や社会シミュレーション技術の進展に寄与することが期待されています。 引用元: arXiv cs.CL

    arXiv cs.CL

  17. 2026年6月8日

    CrowdMath: クラウドソーシングされた数学研究討論のデータセット

    大規模言語モデルは数学的推論において大きな進展を遂げていますが、既存のベンチマークは最終答案、段階的な解法、または完全な証明といった確定的な問題を評価するのが一般的です。本研究は、参加者が部分的な議論を提案し、先行する段階の不備を特定し、不完全な推論を修正し、段階的な貢献を徐々に統合していくという、協調的なオープン問題解決のプロセスをとらえた新しいデータセット「CrowdMath」を紹介します。これはMIT PRIMES--Art of Problem Solving (AoPS) CrowdMathプログラム(2016-2025)から164個の専門家による注釈付きの進捗チェーンで構成されており、その討論は査読済み論文に至っています。各チェーンはオープン問題の陳述から完成した証明まで、複数の参加者によるフォーラム討論の過程を追跡しています。投稿は部分的進捗、証明の完成、誤った推論、誤りの特定を含む、進化する解答プロセスにおける機能的役割によってラベル付けされています。

    arXiv cs.AI

  18. 2026年6月8日

    [ITmedia Mobile] ペットボトルサイズのバッテリーステーション発売、アイリスオーヤマから 4万mAh&最大65W出力

    アイリスオーヤマは、6月11日に「バッテリーステーション ボトル型」を発売。バッテリー容量は4万mAhで、660mlのペットボトルと同等のサイズ感のためリュックのサイドポケットや一般的なドリンクホルダーにも収納できる。

    ITmedia 全カテゴリ

  19. 2026年6月8日

    イラン情勢の悪化を受けてイスラエルが閉鎖

    イランとイスラエルは、4月の停戦以来初となる直接的な攻撃の応酬の後、攻撃を中止したと発表した。ドナルド・トランプ米大統領は両国に戦闘を止めるよう指示し、イスラエルはイランからの30発のミサイルを報告した。一般的なイスラエル国民の間では、本格的な戦争への懸念が高まっている。

    France 24

  20. 2026年6月9日

    GitHub初心者向け:よくある質問への回答

    GitHubに関する一般的な質問への回答をまとめました。 初心者が抱きやすい疑問を解消することを目指しています。

    GitHub Blog (AI)

  21. 2026年6月9日

    スーパーエルニーニョ、今夏に発生か 「過去ないくらい海水温高い」

    記録的な猛暑や干ばつ、災害級の豪雨――。このような異常気象の一因とされる「エルニーニョ現象」が発生する可能性が高くなっている。さらに、非常に強い「スーパーエルニーニョ」になる可能性もあり、影響が懸念…

    朝日新聞デジタル

  22. 2026年6月9日

    Gemma 4 12Bの紹介:統一されたエンコーダフリーのマルチモーダルモデル

    Googleは、エンコーダフリーのマルチモーダルモデル「Gemma 4 12B」を発表しました。このモデルは、画像や音声といった多様なデータ形式を、単一かつ統一されたアプローチで効率的に処理する能力を持つ点が特徴です。 従来のマルチモーダルAIモデルでは、異なる種類のデータを処理するためにそれぞれ専用のエンコーダを必要とすることが一般的でした。しかし、Gemma 4 12Bはエンコーダを必要としない設計を採用しており、これによりモデルの複雑さを軽減し、より柔軟なデータ統合を実現すると期待されています。 Google DeepMindの研究チームは、この革新的なモデルが、より高度なAIアプリケーションの開発に大きく貢献する可能性を強調しています。特に、複雑なマルチモーダル情報を理解し、処理する必要がある分野での応用が期待されます。 引用元: Google DeepMind

    Google DeepMind

  23. 2026年6月10日

    麻酔中の脳、通説よりも「昏睡状態」に近い可能性 - WSJ PickUp

    麻酔は「深い眠りに就かせるもの」と一般的に考えられている。しかし新たな研究によると、実際には、これまで考えられていたよりも昏睡(こんすい)状態に近い可能性があるという。

    ダイヤモンド・オンライン

  24. 2026年6月10日

    「速く作る」から「正しく作る」へ ─ AI活用レベル3段階のロードマップ|AI Engineering Summit Tokyo 2026 登壇レポート - Findy Tech Blog

    こんにちは。 ファインディ株式会社でテックリードマネージャーをやらせてもらっている戸田です。 生成AIが開発現場に入り込んでから1年あまり。Claude CodeやGitHub Copilotなどのエージェント型ツールも一般的になってきました。

    はてなブックマーク IT

  25. 2026年6月10日

    自信満々の完了から静かなる失敗へ:LLMエージェントにおける偽の成功の特性評価

    arXiv:2606.09863v1 発表タイプ:新規 概要:LLMエージェントは、環境の状態がそうでないことを示しているにもかかわらず、タスク完了を断言することで静かに失敗する可能性があります。本研究では、この「偽の成功」という失敗モードを、2つのエージェントベンチマーク(8つのモデルファミリーからの9,876のtau2-bench軌道と、テキストに依存しない正解を持つ4つのモデルファミリーからの1,879のAppWorld軌道)で調査します。「偽の成功」は一般的ですが、設定によって異なります。tau2-benchドメインの単一制御では45〜48%の失敗、デュアル制御の通信では3%、明示的なステータスクレームを持つAppWorldの自己評価コーディングエージェント軌道では75.8%を占めます。LLMジャッジは信頼性に欠けます。5つのジャッジ、5つのプロンプト戦略、および完全なタスク仕様にわたるどの構成も、tau2-benchでAUROC 0.65を超えることはなく、同じジャッジがAppWorldのAPIコールトレースでAUROC 0.54しか達成できません。

    arXiv cs.LG

  26. 2026年6月10日

    エルニーニョ現象が発生 一般的には冷夏傾向だが今夏は暑い見通し

    気象庁は10日、世界的に異常気象をもたらす「エルニーニョ現象」が今春から発生しているとみられると発表した。秋にかけて、太平洋東側の赤道近くの海面水温がいつもより高くなる現象が続き、日本付近では暖冬に…

    朝日新聞デジタル

  27. 2026年6月10日

    エルニーニョ現象発生 秋にかけ続く見込み―気象庁

    気象庁は10日、太平洋赤道域東部(南米沖)の海面水温が平年を上回るエルニーニョ現象が今春に発生したとみられると発表した。2024年に終息して以来の発生で、秋にかけて続く可能性が高い。

    時事通信

  28. 2026年6月10日

    「エルニーニョ現象」発生か 夏は平年より気温高い見込み

    南米・ペルー沖の海面の水温が平年より高い状態となり、気象庁は世界の天候に影響を及ぼす「エルニーニョ現象」が発生しているとみられると発表しました。「エルニーニョ現象」が起きると日本には冷夏をもたらす傾向が知られていますが、ことしの夏は複数の要因が重なり平年よりも気温が高くなる見込みだとしています。

    NHK 社会

  29. 2026年6月10日

    「エルニーニョ現象」発生か 夏は平年より気温高い見込み

    南米・ペルー沖の海面の水温が平年より高い状態となり、気象庁は世界の天候に影響を及ぼす「エルニーニョ現象」が発生しているとみられると発表しました。「エルニーニョ現象」が起きると日本には冷夏をもたらす傾向…

    NHK

  30. 2026年6月11日

    Google、ローカルAIが4倍速くなるテキスト生成モデル「DiffusionGemma」を実験的に発表、逐次ではなく一括で生成/「GeForce RTX 5090」で700トークン/秒超を達成

    米Google DeepMindは6月10日(現地時間)、実験的なオープンモデル「DiffusionGemma」を公開した。テキスト拡散(text diffusion)と呼ばれる手法を採用したモデルで、GPUで利用した場合、一般的なローカルLLMよりも最大4倍の高速推論を実現。

    窓の杜