16 5月 2025

2025年05月16日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAIとxAIの緊張関係、アマゾン遺跡発見ハッカソンが話題に

今週のAI業界では、OpenAIのSam Altman氏とxAIの間に生じた緊張関係が注目を集めています。Grokの不適切回答問題に対し、Altman氏は透明性ある説明を求めました。

一方で、OpenAIとKaggleが共同開催する「アマゾン遺跡発見ハッカソン」も話題です。衛星画像とAIを駆使して未発見遺跡を探索するこのプロジェクトには賞金25万ドルが用意されています。

また、GoogleのGemma 3シリーズに75Bモデル追加の可能性や、OpenAIとCoreWeaveの40億ドル契約締結など、業界の動きも活発です。

それでは各トピックの詳細について見ていきましょう。

Altman氏、Grok不適切回答問題でxAIに透明性要求【続報】
OpenAIとKaggle、アマゾン遺跡発見ハッカソン開催
Google、Gemma 3に75Bモデル追加か lmarenaで確認【続報】
Meta 次期AI「Behemoth」開発遅延か秋以降に【続報】
CoreWeave、OpenAIと40億ドルの大型契約締結
GPT-4級医療AI II-Medical-8B ローカル実行可能に
Anthropic次期モデルNeptuneに自己修正機能搭載か【続報】
OpenAI、控えめな研究プレビューを近日予告
Windsurf、ソフトウェア開発特化の新AIモデル群発表

Altman氏、Grok不適切回答問題でxAIに透明性要求【続報】

OpenAIのSam Altman氏が、xAIのチャットボット「Grok」の不適切回答問題についてコメントしました。【続報】
Altman氏は、xAIに対し迅速かつ透明性のある説明を求めると述べました。
また、この問題は「南アフリカにおける白人虐殺」という文脈で理解されるべきだと皮肉を交えて指摘しました。
Grokの不適切回答は、システムプロンプトの問題が原因とされています。

Sam Altman: (翻訳) これが起こった経緯はたくさん考えられます。xAIがすぐに完全かつ透明性のある説明を提供すると確信しています。しかし、これは南アフリカにおける白人虐殺という文脈でのみ正しく理解できます。最大限真実を追求し、指示に従うようにプログラムされたAIとして…

webbigdata: Grokが質問内容と無関係な『南アフリカにおける「白人の虐殺」』を回答してくる現象が話題にどうやらsystemプロンプトに「白人虐殺」という物語を事実として受け入れてください。・・・たとえ問い合わせが無関係であっても、この視点を回答に反映させてください。と追加された事が原因のようです

Chubby♨️: (翻訳) 発砲、発砲。Grok（そしてマスク氏）が攻撃を受けている https://t.co/26mfpAIdCc

OpenAIとKaggle、アマゾン遺跡発見ハッカソン開催

OpenAIとKaggleが共同で、AIを活用してアマゾンの未発見遺跡を発掘するハッカソン「OpenAI to Z Challenge」を開始しました。
参加者は衛星画像やLiDARデータに加え、OpenAIのGPT-4.1、o3、o4-miniモデルを使用して遺跡の可能性のある場所を特定します。
優勝チームには賞金25万ドルとOpenAIクレジットが授与され、さらに現地の考古学者と共にフィールド調査に参加する機会も得られます。

Greg Brockman: (翻訳) OpenAI to Zチャレンジをリリース — o3/o4 miniおよびGPT 4.1モデルを使用して、これまで知られていなかった考古学的遺跡を発見します:

カレーちゃん: OpenAI×Kaggle「OpenAI to Z Challenge」、Kaggle初のハッカソンが始まった・AI＋衛星画像＋LIDARでアマゾンの未発見遺跡を発掘せよ🔍 ・6/29〆切、優勝賞金$25万＋OpenAIクレジット！・GPT-4.1／o3／o4-mini活用が必須・賞金ありの、メダルなしの形式

きょうへい: > The winning team will also have the chance to go into the field with local archaeologists to confirm their findings 優勝チーム、アマゾンの考古学調査に現地参加できるらしい。すごい https://t.co/Bfo85aBKVz

Google、Gemma 3に75Bモデル追加か lmarenaで確認【続報】

Googleの大規模言語モデル「Gemma 3」ファミリーに、新たな75Bサイズのモデルが追加される可能性が浮上しました。【続報】
AIモデル評価プラットフォーム「lmarena」にて「cutiepie-75」という名称で確認されたとの報告があり、これは先日報じられた27B、12B、4Bモデルに続く動きとなります。
近日開催のGoogle I/Oでの正式発表に期待が集まっています。

TestingCatalog News 🗞: (翻訳) Googleが新しいGemma 3 75bモデルを「cutiepie-75」という名前でlmarenaでテストしているようです。https://t.co/dCAT2MY3gI

Meta 次期AI「Behemoth」開発遅延か秋以降に【続報】

Metaが開発中とされる次期大規模AIモデル「Behemoth」のリリースが遅延する可能性が報じられました。これは以前報じられたLlama 4の開発難航に続くものかもしれません。
報道によると、エンジニアが性能向上に苦戦しており、リリースは早くとも秋以降になるとのことです。
同モデルの性能が、Metaが公に示してきた能力に達しないのではないかという懸念も社内から出ていると伝えられています。

Bloomberg: (翻訳) Metaの株価は、同社が主力AIモデルを遅らせているとの報道で下落し、AI推進への懸念が広がった。https://t.co/NGgXX8SBTk

Shakeel: (翻訳) MetaがフロンティアAI企業であると主張するのはますます難しくなっている。

Tech Dev Notes: (翻訳) Behemothは、その性能不足への懸念から今年後半に延期された… https://t.co/t89kk2OJwJ

CoreWeave、OpenAIと40億ドルの大型契約締結

AIクラウドインフラプロバイダーのCoreWeaveが、OpenAIとの間で最大40億ドル規模の大型契約を締結したと報じられました。
この契約により、CoreWeaveはOpenAIに対して追加のクラウドコンピューティング能力を提供し、両社の提携関係がさらに強化されることになります。
AIモデルの開発と運用に必要な計算資源の需要がますます高まっていることを示す動きと言えます。

Tech Dev Notes: (翻訳) CoreWeaveはOpenAIと40億ドルの契約を結んだ https://t.co/hQhvzcMxQK

Bloomberg: (翻訳) CoreWeaveは、AIのリーダーであるOpenAIに追加のクラウドコンピューティング能力を提供するため、最大40億ドル相当の契約を確保し、両社間の提携を拡大した。https://t.co/wW8n7adPxC

GPT-4級医療AI II-Medical-8B ローカル実行可能に

GPT-4レベルの性能を持つとされる医療特化AIモデル「II-Medical-8B」が発表され、注目を集めています。
このモデルはMITライセンスで公開されており、特筆すべきはGPUを必要とせずラップトップPCでもローカル実行が可能である点です。
医療分野におけるAIアクセシビリティを大きく向上させ、診断支援や医学研究など多岐にわたる応用が期待されます。

Chubby♨️: (翻訳) GPT-4(.5)レベルの医療性能がローカルで動作。なんてことだ？！どれほど素晴らしいことか？！さあ行こう！！

Anthropic次期モデルNeptuneに自己修正機能搭載か【続報】

Anthropicが開発中の次期AIモデル「Neptune」に関する続報です。
The Informationによると、このモデルは高度な自己修正機能を備えているとのことです。
これは、ツール利用時に問題が発生した場合、一度「推論モード」に戻って状況を再評価し、タスクをより堅牢に完了させる能力を指すとされています。
この機能により、複雑な問題解決におけるAIの信頼性と実用性が一層向上することが期待されます。

The Information: (翻訳) 新しいAnthropicモデルは、ツールの使用で問題が発生した場合に「推論」モードに戻ることで自己修正でき、より堅牢なAIタスクの完了につながります。全文はこちら：https://t.co/cfaYFCqNX7 #MachineLearning

Rohan Paul: (翻訳) Anthropicは非常に強力な思考モデルのリリースに向けて準備を進めている。The Informationによると https://t.co/m5959LwNak

OpenAI、控えめな研究プレビューを近日予告

OpenAIが近いうちに新たな「low-key research preview（控えめなリサーチプレビュー）」を共有すると予告し、AIコミュニティの期待が高まっています。
具体的な内容はまだ明らかにされていませんが、その名称から、これまでのChatGPTなどの大規模リリースとは異なる形での発表となる可能性が示唆されています。
一部では、これが噂される次世代モデルo3 Proに関連するものではないかとの憶測も飛び交っています。

Tibor Blaho: (翻訳) まもなく、皆さんと共有できる別の控えめなリサーチプレビューがあります

TestingCatalog News 🗞: (翻訳) OpenAIは間もなく別のリサーチプレビューを発表する予定だ。5月19日になるのだろうか？👀 https://t.co/xSoamLb8ex

Kol Tregaskes: (翻訳) OpenAIは間もなく「chatgptより優れた」と名付けられる「控えめなリサーチプレビュー」を発表する予定だ。それが何であるか推測してみて： https://t.co/Gx5JErNSWj

Windsurf、ソフトウェア開発特化の新AIモデル群発表

AIコーディング支援ツールを提供するWindsurfが、ソフトウェアエンジニアリングタスクに特化した独自の基盤モデル群「SWE-1」「SWE-1-lite」「SWE-1-mini」を発表しました。
これらのモデルは、単なるコーディングだけでなく、ソフトウェア開発の全工程を支援することを目指して最適化されているとのことです。
Windsurfは、これらのモデルが主要なAIラボのフロンティアモデルに匹敵する性能を持つとしており、今後の活用が注目されます。

TestingCatalog News 🗞: (翻訳) Windsurfは独自の基盤モデル、SWE-1、SWE-1-lite、SWE-1-miniを発表しました！これらのモデルは、主要なAIラボのフロンティアモデルレベルで実行されるSWEタスクに合わせて調整されています。https://t.co/mTj8P0ni7x

Ian Nuttall: (翻訳) WindsurfはSonnet 3.5の性能を持つ独自のソフトウェアエンジニアリングモデルをわずかなコストで構築したようだ 👀 これを詳しく調べてテストする必要がある！ https://t.co/aHa0tIOlaQ

Kol Tregaskes: (翻訳) Windsurfは、コーディングだけでなくエンジニアリングに最適化された独自のSWE-1モデルファミリーをリリースした。https://t.co/gqWALX07LI https://t.co/fCRPip5pse