2025年05月28日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

ジョニー・アイブ氏とOpenAIの提携、Claude無料版拡張、Google Gemini Diffusionの進化

今週のAI業界は、大型の買収交渉から新機能の拡張、技術的ブレイクスルーまで幅広い動きが見られています。

OpenAIがデザイナーのジョニー・アイブ氏の企業を65億ドルで買収する交渉を進めているとの報道が注目を集めています。一方、Claudeは無料版に検索機能と音声モード(β)を追加しましたが、一部ユーザーからはTTS的な音声との指摘や、一時的なサービス障害も報告されています。

GoogleもGemini Diffusionの高速生成や複雑な指示対応能力が評価され、競争が激化。技術面ではKarpathy氏によるLLM推論の最適化研究やAI創薬の成果など、基盤技術の進化も続いています。

それでは各トピックの詳細を見ていきましょう。

目次

  1. Claude続報: 音声モードにTTS的の声、障害発生も
  2. OpenAI、Jony Ive氏企業買収報道。o3関連動向も【続報】
  3. Google画像生成AI Gemini Diffusionが話題 Veo 3も展開継続
  4. A.Karpathy氏 Llama 1B推論の単一CUDAカーネル化解説
  5. AI開発ツール進化: Cline思想詳細、新プロンプト記述法、Repomixも
  6. AI創薬で成果、偽求人問題、国内AI推進法成立
  7. 旧Project SidのAltera、AIエージェントFairies発表
  8. Kaggleお絵描きコンペ解法公開、NeurIPSポケモンコンペ採択
  9. バクラクカード AIサービス決済50%還元キャンペーン開始

Claude続報: 音声モードにTTS的の声、障害発生も

  • 既報のClaude無料版Web検索機能とモバイルアプリ音声モード(β版)の提供開始に関する続報です。
  • 音声モードについて、一部ユーザーからは音声がTTS(Text-to-Speech)的であるとのフィードバックが寄せられています。
  • このアップデート後、Claudeのサービスが一時的にダウンしたり、ログインしづらくなる障害も複数報告されました。
TestingCatalog News 🗞: (翻訳) 速報🚨: Claudeモバイルアプリで音声モード(ベータ版)が展開中です! https://t.co/hxVjgym463

Alex Albert: (翻訳) 音声機能の初期実装ですが、すでに非常に楽しく便利だと感じています。 気に入った点(良い点も悪い点も)を教えていただければ、将来さらに改善していくことができます!

TestingCatalog News 🗞: (翻訳) Claudeがダウンしています 👀 https://t.co/BtJaTyAOs6

OpenAI、Jony Ive氏企業買収報道。o3関連動向も【続報】

  • OpenAIに関する続報です。The Informationによると、OpenAIがJony Ive氏のスタートアップを65億ドルで買収するディールを進めていると報じられ、ハードウェア分野への進出の可能性が注目されています。
  • また、最新AIモデル「o3」による「ポケモン レッド」のリアルタイムプレイ実況や、ChatGPTアカウントを用いたサードパーティアプリへのサインイン機能「Sign in with ChatGPT」の開発も引き続き話題となっています。
まつにぃ: やっとこさOpenAI o3もポケモンベンチに挑戦。 最早ポケモンリーグクリア出来ることがスタート地点なので、結構プレッシャーは高いはず。 むしろRTAよろしくスピード競いたいですね。

K.Ishi@生成AIの産業応用: OpenAI o3もポケモンプレイで性能評価を始めた。 これで、Anthropic、Google、OpenAIの主要3社がポケモンでAIの性能を競い合うことになった。 o3は今はまだトキワのもりだが、どこまで辿り着けるか。Claudeはバッジ3つで、Geminiは全クリだ。 頑張ってほしい。

TechCrunch: (翻訳) OpenAIはまもなく、他のアプリに「ChatGPTでサインイン」できるようにするかもしれません | TechCrunch https://t.co/et8sIT5fi3

Google画像生成AI Gemini Diffusionが話題 Veo 3も展開継続

  • Googleの画像生成AI「Gemini Diffusion」が新たに注目を集めています。
  • ユーザーからは、その高い生成速度や、漸化式を解くといった複雑な指示への対応能力が試され、評価されています。
  • また、動画生成AI「Veo 3」もProユーザー向けに70カ国以上での提供が継続されています。
  • GoogleはマルチモーダルAI分野で新機能を継続的にリリースし、競争力を強化しています。
Google Gemini App: (翻訳) サウンドオン🔊 Veo 3が70カ国以上で展開され、Proユーザーにもお試しいただけるようになりました。手順はこちら:1⃣ https://t.co/382WL5xkFE にサインインしてProにアップグレード 2⃣ プロンプトバーの「ビデオ」ボタンをタップ 3⃣ アイデアを記述して送信 タグ付けしていただければ、私たちも見ることができますし https://t.co/KGwFTXmz...

Miwa - azooKeyの開発者: Gemini Diffusionが届いたので遊んでるけど、こういう漸化式がちゃんと解けるの、Unmaskingのスケジューリングどうなってるんだ……??見切れてるけど確認したら88項目まであってた…… https://t.co/98kJSNcQzF

Hashem Al-Ghaili: (翻訳) アフターライフ:プロンプトの合間のAIアクターたちの見えない生活。(Veo 3で作成) https://t.co/FwhYEM7Y8Q

A.Karpathy氏 Llama 1B推論の単一CUDAカーネル化解説

  • LLMの推論効率化に関する注目すべき発表がありました。Andrej Karpathy氏は、Llama 1Bモデルのバッチ1推論を単一のCUDAカーネルで実行する手法を解説し、計算とメモリの最適な連携による高速化の可能性を示唆しました。
  • また、複数の事前学習済みモデルのチェックポイントをマージすることで性能向上と学習コスト削減を目指す「Pre-trained Model Averaging (PMA)」や、強化学習における多様なKL正則化を探求し安定したオンライン学習を目指す「Regularized Policy Gradient (RPG)」といった新しい研究も紹介されています。
  • これらの研究は、LLMの性能向上と運用効率化の両面で進展が続いていることを示しています。
Andrej Karpathy: (翻訳) すごくクールだ。Llama 1Bのバッチサイズ1の推論を単一のCUDAカーネルで実行し、計算を一連のカーネル呼び出しに分割することで生じる同期の境界を削除している。計算とメモリの最適なオーケストレーションは、この方法でしか達成できない。

Rohan Paul: (翻訳) LLMの事前学習はコストがかかり、予測不可能なスケーリングと不安定性に悩まされます。この論文では、事前学習中にチェックポイントをマージするPre-trained Model Averaging (PMA) を導入し、パフォーマンスの向上とトレーニングコストの削減を実現します。 方法 🔧: → 事前学習済みモデル https://t.co/kRURptrgOM

Rohan Paul: (翻訳) 推論に固定正則化戦略を用いるLLMは不安定性に悩まされます。この論文では、安定したオンライン強化学習のための多様なカルバック・ライブラー正則化を探求するフレームワークであるRegularized Policy Gradient (RPG)を提案しています。方法🔧: → RPGは報酬と https://t.co/LKCEPE66or を最適化します。

AI開発ツール進化: Cline思想詳細、新プロンプト記述法、Repomixも

  • AI開発を支援するツールや考え方が進化を続けています。
  • AIコーディングエージェント「Cline」の具体的な設計思想が議論を呼んでいます。これは、RAG(Retrieval Augmented Generation)を用いず、増大するコンテキストウィンドウを活用してコード理解を深めるというものです。
  • このアプローチに関連し、データセットが小規模で遅延を気にしない用途では、ロングコンテキストがRAGより優れているとの意見も出ています。
  • また、開発者のKazunori Sato氏は、ドキュメントにサンプルコードの代わりにエージェントへのプロンプトを記述するという新しいアイデアを提唱しています。
  • さらに、リポジトリ全体をAIが扱いやすい単一のYAMLファイルにまとめるツール「Repomix」も登場し、VibeCodingに必須との声も上がっています。
Kazunori Sato: サンプルコード書く代わりに、エージェントへのプロンプトを書いてドキュメントに載せてけばいいのだ。

pon / Hiromu Nakamura | LayerX: 読んだ!!好き!!Clineがなぜコードをインデックスしないかの記事。 https://t.co/VtuhxWcFvV 当時、俺が社内コード検索環境を構築したときもRAGで頑張れないのか的な話はあったけど、当時はチャンクに対して上手く検索できなかったんだよな。

Kazunori Sato: 特定リポジトリを1つのファイルにまとめてエージェントに渡したいなぁ。。と考えてたらそのもののツールがはてブに上がってた - VibeCodingに必須の便利ツール「repomix」の紹介|cryptobox https://t.co/CKrGkImR9L #zenn

AI創薬で成果、偽求人問題、国内AI推進法成立

  • AIの社会実装が進む中、AIと仕事や社会に関する議論が活発化しています。
  • AI Scientistが仮説生成から実験計画、データ分析まで行い、失明原因となる疾患の新薬候補を発見したという報告は、AIの科学技術への貢献可能性を示す事例として注目されています。
  • 一方で、AIを悪用した偽の求人情報で求職者や企業を騙す手口も報告されており、対策が求められています。
  • また、コンサルティング大手のMcKinseyがAIの生産性向上などを背景に大規模な人員削減を行ったとの報道もあり、AIが雇用に与える影響について様々な側面から議論されています。
  • 国内では、AIの研究開発や社会実装を推進するための「AI推進法」が参議院で可決・成立し、今後の国のAI戦略に注目が集まります。
シェイン・グウ: AI Scientistにより、失明の大きな原因である萎縮型加齢黄斑変性症の新薬候補「Ripasudil」が発見された。実験と一部の論文執筆を除き、仮説生成から科学的知見の発見までをAIが成し遂げた。 これが本当の社会の役立つAI Scientist。論文やPRの価値は少なく誰でもプロンプトでできる。

Forbes: (翻訳) 偽の求職者がAIを悪用して求職者や企業を騙している https://t.co/TP39GOfzC1 https://t.co/TP39GOfzC1

ChatGPT研究所: 【速報】参議院でAI推進法が成立 ・内閣に全閣僚参加の「AI戦略本部」を新設 ・国がAI基本計画を作り、基礎研究から民間のサービス誕生を支える仕組みまでを構築 ・データセットや計算資源を有効活用できる環境を整備 ・国, 自治体, 大学, 企業, 国民が連携してAIの研究開発と活用を推進 https://t.co/phQLvAsASM

旧Project SidのAltera、AIエージェントFairies発表

  • かつてMinecraft内でAIエージェントが複雑な社会を形成した「Project Sid」で知られるAltera社が、新たな汎用AIエージェント「Fairies」を発表しました。同社はこれを「最も強力」と位置づけています。
  • Fairiesは、多数のアプリ横断アクション、ファイルへのフルアクセス、コード生成、ディープリサーチ、MCP (Model Context Protocol)、タスク蒸留、並列化などの機能を備えるとのことです。
  • Altera社は今夏、毎週メジャーリリースを予定しており、AIエージェント分野の競争が一層激化する見込みです。
Kol Tregaskes: (翻訳) Minecraft内に数百のエージェントを展開し、複雑な社会を形成したProject Sidで有名なAlteraが、リブランドして「最も強力な汎用AIエージェント」であるFairiesをリリースしました。 https://t.co/zRHJAN4tRI

Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: (翻訳) 最も強力な汎用AIエージェント、Fairiesをご紹介します。お気に入りのアプリ全体で1000以上のアクション、完全なファイルアクセス、コード生成、ディープリサーチ、MCP、タスクの蒸留、並列化など。この夏、毎週メジャーリリースを出荷予定です。今すぐお試しください! https://t.co/5JYH4qVWzv https://t.co/CzCWdXXZQv

Kaggleお絵描きコンペ解法公開、NeurIPSポケモンコンペ採択

  • Kaggleで開催された「お絵描きAIチャレンジ」コンペティションにおいて、3位入賞チームがその解法を公開し、注目を集めています。
  • 特にテキストハック(OCR Attack)を用いないアプローチで高い精度を達成した点が評価されています。
  • また、AI研究の国際会議であるNeurIPS 2025において、ポケモンを題材としたAIコンペティションが採択されたことが発表されました。
  • スピードランとマルチプレイヤーバトルが競技種目となる予定で、AIエージェントの能力を競う新たな舞台として期待されています。
  • これらの動きは、Kaggleコミュニティにおける活発な知見共有と、AI研究における新たなチャレンジの広がりを示しています。
エチレン: お絵描きコンペの3位解法を公開しました テキストハックしない解法で良い順位を取れたのでチームメイトと喜んでいます 1. 画像生成モデルで生成した画像 2. svg画像 3. 画像をぼやかす処理をした後のsvg画像 https://t.co/K6K963CMgN https://t.co/Zxr1Ye0eqA

esprit: 解法に隙がないのはもちろんのこと10000bytesの制限下でちゃんと美しい絵が出てきてるのが芸術的😳非OCR Attack解法の圧倒的最高峰だ

Shane Gu: (翻訳) 数年前にNeurIPSのコンペティションとしてマルチエージェント強化学習を考えていました(正直、非常に魅力的で面白いアイデアです。DeepMind対OpenAIのAIエージェントによるポケモンバトル対決を想像してみてください)。NeurIPSはeスポーツになるでしょう。YouTubeさん、スポンサーお願いします。

バクラクカード AIサービス決済50%還元キャンペーン開始

  • 株式会社LayerXが提供する法人カード「バクラクビジネスカード」が、ChatGPTやClaude、GeminiなどのAIサービス利用料を最大50%還元する「企業のAI活用 半額応援キャンペーン」を開始しました。
  • このキャンペーンは8月末まで実施され、Devin、GitHub Copilot、Cursor、Dify、Vercel、Cloudflareなども対象となるとのことです。
  • AIツールの導入・活用コストを大幅に削減できる可能性があり、多くの開発者や企業から注目を集めています。
福島良典 | LayerX: バクラクビジネスカードでAIサービスを決済すると50%還元!これはやばい バクラクビジネスカード、「企業のAI活用 半額応援キャンペーン」を開始。ChatGPTなどのAIサービス利用料を最大50%還元(8月末まで) https://t.co/eQC14LRptC

西見 公宏 | Generative Agents: これはやばい

小賀昌法 KOGA Masanori: ChatGPT以外にもDevin, GitHub Copilot, Cursor, Claude、Dify, Vercel, Cloudflareなどが対象になります。ぜひ内容をご確認ください! バクラクビジネスカード、「企業のAI活用 半額応援キャンペーン」を開始。ChatGPTなどのAIサービス利用料を最大50%還元(8月末まで) https://t.co/rZnMGQFLKo

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください