2025年05月13日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Altmanが語るAIの未来とVLM革新が進む今週のAI業界

OpenAIのAltman氏がAI進化の詳細ロードマップを公開し、ASI実現への言及が注目を集めています。一方、コーディングエージェント論争が再燃し、GPT o3の評価と課題も浮き彫りに。

医療分野ではAI単独診断が医師を上回るケースが報告され、小規模チームによるAI活用の事例も増加。NVIDIAの科学LLM開発やチューリング社のVLMアプリ公開など、インフラと実装の両面で進化が加速しています。

それでは、各トピックの詳細について見ていきましょう。

目次

  1. S.Altman氏 AIロードマップ続報 ASI実現と資金調達も
  2. mizchi氏「cline推奨」記事、AIコーディング論争を再燃【続報】
  3. GPT o3: 開発者称賛とハルシネーションへの警鐘【続報】
  4. Google I/O、開発AIエージェントや新XR連携に期待【続報】
  5. L.Weng氏 AIデータセットの安易な混合と汚染に警鐘
  6. AI単独診断、AI支援下の医師を上回る事例報告
  7. Aadit Sheth氏、AIで小規模チームが大成果を出す事例を紹介
  8. NVIDIA AIインフラ: 新科学LLMとHBM価格戦略
  9. チューリング、VLM「Heron-NVILA」搭載iOSアプリ公開【続報】

S.Altman氏 AIロードマップ続報 ASI実現と資金調達も

  • OpenAIのSam Altman氏がAIの進化に関するロードマップについて詳細を語りました【続報】
  • 2025年を「AIエージェントの年」、2026年を「科学研究とブレークスルーの年」、2027年を「AIとロボティクスが物理世界に関与する年」と予測する点は既報の通りです。
  • 今回新たに、ASI(汎用超知能)の実現とそのための大規模な資金調達の必要性について言及しました。
  • また、AIが将来的に人々のコアなサブスクリプションサービスとなる可能性も示唆しています。
Chubby♨️: (翻訳) サム・アルトマン:2025年はAIエージェントの年、2026年は科学研究とブレークスルーの年、2027年はAIとロボティクスが実際に物理世界に関与する年。行こう!

Tibor Blaho: (翻訳) サム・アルトマン @ AI Ascent 2025 (2025年5月2日) - 「私たちは人々のコアAIサブスクリプションのようなものになり、それを利用する方法を提供したいと考えています。その一部はChatGPT内部で行うようなことになるでしょう。そのサブスクリプションには他にもいくつかの非常に重要な部分がありますが、ほとんどの場合、私たちは...」

Chubby♨️: (翻訳) サム・アルトマンは最近非常に前向きで楽観的なようだ:彼は2025年にエージェント、2026年にAIを使った科学研究を期待している。現在の目標はASIだが、そのためにはもっと資金が必要だ。

mizchi氏「cline推奨」記事、AIコーディング論争を再燃【続報】

  • mizchi氏によるAIコーディングエージェント「cline」を推奨する趣旨の記事が大きな反響を呼び、AIコーディングツールの議論が再燃しています。【続報】
  • この記事をきっかけに、Cursor、Windsurf、Roo Codeといったツール群の比較や活用方法、AIエージェントとの連携について、開発者の間で再び活発な議論が交わされています。
mizchi: cline に全部賭けろの記事を書いた結果、少なくともXのプログラマ界隈ではコーディングエージェントを脱神秘化して建設的な議論ができるフェーズに来たので、書いてよかった~

からあげ: メモ > AIコーディングの理想と現実 https://t.co/4FqdKhmpPl

Iaiso: 別の話だけどClineやClaude Codeのみだとサーバーサイドのエージェントの威力を体験できないのでCursorなりDevinなり試した方がいいと思う

GPT o3: 開発者称賛とハルシネーションへの警鐘【続報】

  • OpenAIのGPT o3モデルに関する続報です。
  • 多くの開発者から「o3を使うのが大好きだ」「初期のGPT-4のようだ」といった称賛の声が引き続き聞かれます。
  • 一方で、Bindu Reddy氏からは「自信を持ってハルシネーションする」との具体的な指摘があり、利用時の注意喚起が改めてなされています。
  • 次期モデルとされるo3 Proへの期待も高まっています。
Bindu Reddy: (翻訳) o3は素晴らしいだけでなく、かなり自信を持ってハルシネーションを起こします。推論能力が向上すると、モデルはもっともらしいデタラメを生成する可能性が高くなります。賢い人がもっともらしい話を作り上げることができるのと似ています。LLMを信用する際には注意が必要です。

Kol Tregaskes: (翻訳) o3を使うのが大好きだ。

Kol Tregaskes: (翻訳) これについて詳しく説明させてください。私はo3を使うのが大好きです!2年前の初代GPT-4を使った時と同じような興奮をo3から感じています。ミニモデルでは比較になりません。o4-miniとo4-mini-highの使用はやめました。確かにそれらはよりインテリジェントかもしれませんが、私にはピンときません。私は使います

Google I/O、開発AIエージェントや新XR連携に期待【続報】

  • 来週開催のGoogle I/Oに関する続報です。新たなAI関連の発表として、ソフトウェア開発を支援するAIエージェントの登場が期待されています。
  • また、The Informationの報道によれば、Pinterest風のファッション・インテリアデザインのアイデアを生成するAI機能も準備中とされています。
  • さらに、Gemini AIチャットボットとAndroid XRメガネの連携や、ChromeブラウザへのGoogle Live導入の噂も報じられています。
The Information: (翻訳) Google、I/Oに先立ちソフトウェアAIエージェント、Pinterest風機能を開発中。Googleは来週の年次開発者会議I/Oに先立ち、ソフトウェア開発AIエージェントを開発者向けにデモンストレーションしています。詳細は@erinkwooより。

Tetsuro Miyatake: GoogleがGoogle I/Oで発表すると思われるAI商品: ・ソフトウェア開発用のAIエージェント ・Pinterest風なファッション・インテリアデザインのアイデアを生成するAI ・Gemini AIチャットボットとAndroid XRメガネの連携 ・ChromeブラウザーにGoogle Liveを導入 https://t.co/Py5f5pj5s3

L.Weng氏 AIデータセットの安易な混合と汚染に警鐘

  • OpenAIのLilian Weng氏が、AIモデルの学習データに関する重要な問題を指摘しています。
  • 新しいデータセットとして公開されるものの中には、既存のデータセットを組み合わせただけの「メタ混合データセット」が多く、これがモデル学習時のデータ汚染(コンタミネーション)につながる危険性があると警鐘を鳴らしています。
  • データセットの品質と独自性の確保が、AI開発において改めて重要視されています。
Lilian Weng: (翻訳) 新しいデータセットが出ると興奮してチェックするのですが、結局それが既存のデータセットのコレクションを組み合わせた別のメタ混合データセットであることに気づくだけです。私の脳はすぐに「ああ、フォーク...汚染だ!」という反応をします。メタメタ混合データセットはやめてください(泣笑)。

AI単独診断、AI支援下の医師を上回る事例報告

  • AIの医療分野での能力向上が注目されており、一部ではAI単独の診断が、AIの支援を受けながら診断を行う医師の診断結果を上回るケースが報告されています。
  • OpenAIのHealthBenchのような評価基準の整備も進む中、医療現場におけるAIの役割について、その可能性と限界を含めた議論が活発化しています。
Chubby♨️: (翻訳) 驚くべき発見。AIは、医療でAIを使用する医師よりもさらに優れている。 (引用翻訳: 初めて、AIが医師よりも効果的であるだけでなく、その同じAIを使って自らを助ける医師よりもさらに効果的であることが示されました。人間が問題になりつつあります。彼らはAIがツールになると言いますが、実際には私たちはすでに限界要因になりつつあります...)

Chubby♨️: (翻訳) それがOpenAIのデータの画期的な点だ:今日すでに、o3はAIのサポートなしの医師とAIのサポートありの医師の両方を上回っている。今日だ!そして、o4のような新しい次期モデルについてはまだ話していない。 (引用翻訳: 2024年9月、AIと協力する医師は、AI単独または医師単独よりもHealthbench医師ベンチマークで優れた成績を収めました。o3とGPT-4.1のリリースにより、...

Aadit Sheth氏、AIで小規模チームが大成果を出す事例を紹介

  • AIを活用することで、小規模なチームでも大企業のような成果を上げたり、短期間でソフトウェアやゲームを開発したりする具体的な事例がAadit Sheth氏によって複数紹介され、大きな注目を集めています。
  • 例えば、AIを用いてソフトウェアビジネスを構築するための3時間にわたるステップバイステップガイドや、45分以内にゲームを開発する方法などが共有されています。
  • これらの事例は、AIによる生産性向上とビジネス創出の具体的な可能性を示唆しています。
Aadit Sheth: (翻訳) この人は文字通り、AIでソフトウェアビジネスを構築するための3時間のステップバイステップガイドを共有しました。

Aadit Sheth: (翻訳) この人は文字通り、AIがいかにして小さなチームを45分足らずで巨人のように働かせるかを示しています。

Aadit Sheth: (翻訳) この人は文字通り、AIを使って45分以内にゲームを構築する方法を示しています。

NVIDIA AIインフラ: 新科学LLMとHBM価格戦略

  • NVIDIA関連では、AI開発を支えるインフラ側の動きが活発です。
  • SES AIが開発した70Bパラメータの科学的推論モデル「Molecular Universe LLM」は、バッテリー研究に革命をもたらすと期待されています。
  • NVIDIAが2026年のHBM(広帯域メモリ)供給に関する価格交渉を延期したとの報道もあり、Samsungの市場参入を見越した動きと見られています。
  • 創薬AIモデル「DiffSMol」なども注目されています。
NVIDIA AI Developer: (翻訳) 🔋 @ses_ai の Molecular Universe #LLM をご紹介します。これはバッテリー研究に革命をもたらしている70Bパラメータの科学的推論モデルです。この #AI モデルは、ドメイン適応型事前学習と推論ベースのファインチューニングを使用して科学的発見を加速します。詳細はこちら 📖

パウロ: Nvidiaは2026年のHBM供給価格の交渉を延期、Samsung参入を見越して (引用ツイート: Nvidia has started to delay the price negotiations for HBM supply in 2026 as it expects Samsung to enter the market and get more buying power. http...

NVIDIA AI Developer: (翻訳) 生成AIは10年にわたる創薬プロセスを再構築しています💊 DiffSMolは@OhioStateの研究者によるAIモデルで、薬物候補の結合特性が改善された3D構造を数秒で生成します。👏 このモデルが61%の成功率を達成した方法をご覧ください。

チューリング、VLM「Heron-NVILA」搭載iOSアプリ公開【続報】

  • チューリング社が開発した高性能VLM「Heron-NVILA」シリーズの続報です。
  • 同社は、軽量版モデル「Heron-NVILA-Lite-2B」を搭載したiOSアプリ「Heron」をApp Storeで公開しました。
  • このアプリはローカル環境で動作し、プライベートな画像解析が可能です。
  • モデルサイズ約2GBと軽量ながら高性能を実現しており、モバイルでのVLM実装事例として注目されています。
  • 開発の裏側や高速化、UIの工夫についても同社テックブログで解説されています。
Yu Yamaguchi | チューリング CTO: チューリング、新しいテックブログが出ました。 高性能・軽量な視覚-言語モデル「Heron-NVILA」をローカル推論させ、プライベートな画像解析を行うiOSアプリを公開しました。 大規模モデルをiOSアプリに実装するため、高速化やUIなど、開発の裏側について解説しています https://t.co/nGPYWRALgp

Yu Yamaguchi | チューリング CTO: このアプリ、たまたまチームに日常的にiOSアプリ開発しているリサーチャーがいて、数日で実装してくれました。(そんなことある?) 特にUIと高速化の作り込みがすごいので、対応したiPhoneを持っている人はぜひインストールしてみてください (引用ツイート: チューリングで開発した高性能で軽量なVLM「Heron-NVILA-Lite-2B」をローカル推論させ、プライベートな画像解析を行うiOSアプ...

カレーちゃん: サイズが2GBと、これをiphoneで推論できるんすな https://t.co/UJbDogwhGw (引用ツイート: チューリングで開発した高性能で軽量なVLM「Heron-NVILA-Lite-2B」をローカル推論させ、プライベートな画像解析を行うiOSアプリ「Heron」をApp Storeで公開しました。ぜひインストールしてお試しください! テックブログではHeronのiOSアプリの開...

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください