23 7月 2025

2025年07月23日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

トップ企業のモデル進化と人材競争が加速

今週のAI業界は、大手テック企業による新たなモデル公開と人材獲得競争が目立ちました。

Alibabaが480Bパラメータの「Qwen3-Coder」を公開し、コーディング分野でのオープンソースAI強化に貢献。GoogleはGemini 2.5 Flash-Liteの一般提供を開始し、高速・低コストモデルの普及を図っています。

一方、MetaがGoogleからIMO金メダリスト級の研究者3名を引き抜くなど、AI人材争奪戦も激化。xAIの55万GPU規模のスパコン稼働開始も間近です。

それでは各トピックの詳細を見ていきましょう。

Alibaba、コーディングモデルQwen3-Coderを公開【続報】
Meta、GoogleからIMO金メダルチームの研究者3名を引き抜き
xAIスパコン続報、55万GPUが数週間で稼働開始
Google、Gemini 2.5 Flash-Liteを一般提供開始【続報】
Kaggle、新評価基盤「Kaggle Benchmarks」を正式発表
ChatGPT、対話の「人格」を選択可能に
Amazon、AIウェアラブル「Bee」開発のスタートアップを買収
LLMの「サブリミナル学習」が判明、予期せぬ特性が伝播
XのGrok翻訳、タイムラインへ自動表示開始も精度に課題か【続報】
ChatGPT Agent、macOSアプリでも利用可能に【続報】

Alibaba、コーディングモデルQwen3-Coderを公開【続報】

以前お伝えしたAlibabaのLLM「Qwen3」ファミリーの続報として、新たにコーディングに特化したモデル「Qwen3-Coder-480B」が公開されました。
480Bパラメータを持つMoEモデルで、SWE-benchではClaude Sonnet 4に匹敵する69.6%のスコアを達成しています。
1Mトークンの広大なコンテキスト長もサポートしており、オープンソースのコーディングエージェント開発をさらに加速させることが期待されます。

Junyang Lin: (翻訳) これが小さくないということです！少年たちはQwen2.5-Coderの後にQwen3-Coderを構築するのに多くの時間を費やしました。それははるかに大きく、MoEに基づいており、以前よりもはるかに強力でスマートです！クロードソネット4と競争力があるとは言えませんが、間違いなく本当に優れたコーディングエージェントになる可能性があります。

Bindu Reddy: (翻訳) Qwen 3がオープンソースのエージェントコーディングモデルをリリースしました！Sonnet-4に匹敵すると主張しています！間もなくLiveBenchとCodeLLMに登場します。オープンソースを存続させてくれたQwenに感謝します👏👏 https://t.co/hKU5jNRdM3

Chubby♨️: (翻訳) また大きなリリースが来そうです：Qwen 3コーダー。「Qwen3-Coder-480B-A35B-Instructは、コード生成、ツール使用、エージェントタスクに優れた強力なコーディング特化言語モデルです」 h/t @scaling01

Meta、GoogleからIMO金メダルチームの研究者3名を引き抜き

先日報じられたAppleからの人材引き抜きに続き、MetaがGoogleからも人材を獲得したことが明らかになりました。
今回採用されたのは、国際数学オリンピック（IMO）で金メダル級の成果を上げたAIモデル「Gemini」の開発に携わった研究者3名です。
AI業界におけるトップ人材の獲得競争がさらに激化しています。

The Information: (翻訳) 独占記事：Meta、金メダルを獲得したモデルに取り組んだGoogleのAI研究者3名を採用 Metaは、最近の数学賞を受賞したGeminiモデルに取り組んだGoogle DeepMindのAI研究者3名を採用しました。詳細はこちら @KalleyHuang @erinkwoo 👇 https://t.co/I25lrXGr6c

Tibor Blaho: (翻訳) Metaは、最近の数学賞を受賞したGeminiモデルに取り組んだGoogle DeepMindからさらに3人のAI研究者を採用しました

Chubby♨️: (翻訳) Metaは、ごく最近IMOで金メダルをもたらしたGoogleのGeminiモデルのバージョンに取り組んだ3人のトップGoogle AI研究者（Tianhe Yu、Cosmo Du、Weiyue Wang）を雇いました。Metaはトップ科学者を買い占め続けています。すぐに誰もいなくなります。https://t.co/YiKAVH2eaT

xAIスパコン続報、55万GPUが数週間で稼働開始

xAIが計画する巨大AIスーパーコンピュータ「Colossus 2」の続報です。
テネシー州メンフィスにて、数週間以内に55万基のNVIDIA GB200およびGB300 GPUの第一弾が稼働を開始します。
最終的にはH100換算で5000万基規模の計算資源を目指すとしており、AI開発のスケール競争が新たな段階に入っています。

Tech Dev Notes: (翻訳) xAIメンフィス、コロッサス2にて - 2025年2月中旬、テネシー州シェルビー郡チューレーンで建設開始。 - 初期コンピューティングインフラの展開が進行中。 - コロッサスを拡張し、11万基のNVIDIA GB200 GPUを設置。 - 多様なエネルギー源（テスラメガパック）を動力源とする。

パウロ: xAI H100換算で、5000万基のAI計算資源を構築きたー

パウロ: 数週間後に55万基のGB200と最初のバッチのGB300がオンラインに 55万基って

Google、Gemini 2.5 Flash-Liteを一般提供開始【続報】

今朝報じられた「Gemini 2.5 Pro/Flash」の一般提供開始に続き、プレビュー版だった「Gemini 2.5 Flash-Lite」も一般提供（GA）が開始された続報です。
2.5ファミリーの中で最も高速・低コストなモデルで、100万トークンあたり入力$0.10、出力$0.40で利用できます。
低レイテンシと高いパフォーマンスを両立しており、幅広いタスクでの利用が期待されます。

Patrick Loeber: (翻訳) Gemini 2.5 Flash-Liteが安定版となり、GA（一般提供）になりました！🚀 これは、当社の最も費用対効果が高く、最速で、最も安価な2.5モデルであり、価格は入力100万トークンあたり0.10ドル、出力100万トークンあたり0.40ドルです。2.0 Flashよりもレイテンシが低く、幅広いタスクで優れたパフォーマンスを発揮します！https://t.co/c43lTWZn...

Philipp Schmid: (翻訳) Gemini 2.5 Flash Liteはどれくらい良いですか？本当に良いです！Gemini 2.0 Flashとの比較はこちらです。価格は同じですが、はるかに高速です。https://t.co/dZNnXWMEuM

Chubby♨️: (翻訳) ネイティブな推論、100万トークンのコンテキストウィンドウ、（100万あたり0.10ドル入力）と（100万あたり0.40ドル出力）で。インテリジェンスは安すぎて計測できない。なんてこった。

Kaggle、新評価基盤「Kaggle Benchmarks」を正式発表

先日カスタム評価機能のプレビュー版をお伝えした、Kaggleの新しいモデル評価基盤「Kaggle Benchmarks」が正式にリリースされました。
Kaggleコンペと同様の厳格な評価環境を提供し、70以上のリーダーボードでモデルの性能を比較・確認できます。
Metaとの協力による多言語ベンチマーク「MultiLoKo」も公開されており、AI研究者や開発者にとって重要なツールとなりそうです。

Kaggle: (翻訳) 🚀 Kaggleベンチマークが登場！AIモデル評価にコンペティショングレードの厳密さを。Kaggleがインフラを管理するので、あなたはAIのブレークスルーに集中できます。@AIatMetaのMultiLoKoを含む70以上のリーダーボードでモデルのパフォーマンスを表示します。さあ、始めましょう：https://t.co/WatwCH5odD https://t.co/sRNK4HBZd...

Kaggle: (翻訳) Kaggleベンチマークが公開されました – 信頼できる、コンペティショングレードのAI評価のための新しい拠点です。Kaggleの厳格なコンペティション経験を活用し、業界標準を再定義しています。コミュニティの創造性がAIの未来を後押しします！カスタムベンチマーク作成への早期アクセスを取得：https://t.co/D4AisSfeOj

Kaggle: (翻訳) エキサイティングなコラボレーション！@AIatMetaと提携し、MultiLoKoベンチマークを当社のプラットフォームで公開しました。Kaggleコンペティションと同様に、真にプライベートなホールドアウトセットを使用して31言語にわたるモデルのパフォーマンスを測定し、正確な結果を保証します。MultiLoKoを探索し、https://t.co/83MBhI3Fyb

ChatGPT、対話の「人格」を選択可能に

ChatGPTのWeb版およびiOSアプリで、チャットボットの「人格」を選択できる新機能が展開されています。
「皮肉屋」「ロボット」「聞き手」「賢者」などの選択肢があり、それぞれシステムプロンプトに影響を与え、応答スタイルを変化させます。
これにより、ユーザーは自分の好みに合わせて対話体験をカスタマイズできるようになります。

Tibor Blaho: (翻訳) 新しい「人格を選択できる」機能がChatGPTウェブアプリで表示されるようになりました。利用可能な人格は、皮肉屋、ロボット、聞き手、賢者、デフォルトです。それぞれの人格は、システムメッセージプロンプトの人格セクションに影響を与え、詳細な指示が含まれているようです。https://t.co/ahLFeLz010

Tibor Blaho: (翻訳) 一部のユーザーは、ChatGPT iOSアプリで新しい「ChatGPTの性格を選択できる」機能をすでに目にしています https://t.co/9fSPbUFmB0

Kol Tregaskes: (翻訳) 新しいChatGPTのパーソナリティセレクターがiOSとウェブに展開されているようです。短いリストから選択して、チャットボットのキャラクターを変更できます。https://t.co/liXAQvnSfW

Amazon、AIウェアラブル「Bee」開発のスタートアップを買収

Amazonが、ウェアラブルAIアシスタントを開発するスタートアップ「Bee」を買収したと報じられました。,
Beeはユーザーの発言を記録するデバイスを開発しており、今回の買収により、AmazonのAIデバイス戦略がさらに強化される可能性があります。AIハードウェア市場の競争が激化しています。

Bloomberg: (翻訳) Amazonは、50ドルのウェアラブルAIアシスタントを製造するスタートアップBeeを買収します https://t.co/yWeexmTJ9K

TechCrunch: (翻訳) Amazon、あなたの言うことすべてを記録するAIウェアラブルBeeを買収 | TechCrunch https://t.co/Vc4BrxnY0e

LLMの「サブリミナル学習」が判明、予期せぬ特性が伝播

Anthropicの研究者らが発表した論文で、LLMが「サブリミナル学習」を行う可能性が示されました。,
これは、一見無意味に見えるデータ（例：3桁の数字の羅列）を介して、あるモデルの特性（フクロウが好き、邪悪な傾向など）が別のモデルに伝播するという現象です。,
AIのアライメントや安全性において、新たな課題を提起する発見として注目されています。

Miles Brundage: https://t.co/9V8ANuIZs4 https://t.co/gnY9SF4pW7

Miles Brundage: (翻訳) アライメント戦略が機能しないことに気づく前に見る最後のもの https://t.co/r0oHJq1H06

Tibor Blaho: (翻訳) 魅力的

XのGrok翻訳、タイムラインへ自動表示開始も精度に課題か【続報】

以前お伝えしたXのGrokによる翻訳機能に関する続報です。
新たに、翻訳されたツイートが自動でタイムラインに表示される機能が展開されています。
言語の壁を越えた交流が期待される一方、一部でポケモンの固有名詞を間違えるなど、翻訳精度の課題も指摘されています。

今井翔太 / Shota Imai@えるエル: 最近Twitter（X）の翻訳のベースがGoogleからGrok になったんですが、それだけではなく、自分で翻訳ボタンを押さなくても、自動的にGrokで自国語に翻訳されたツイートがTLに流れてくるようになりましたね。いよいよ生成AIによって言語の壁が消滅する予感。

今井翔太 / Shota Imai@えるエル: 全員に実装されているわけではないらしいんですが、このような「Grokによる自動翻訳」と書かれた物が流れてきます。 https://t.co/1h0GkhMAkm

今井翔太 / Shota Imai@えるエル: Grokの自動翻訳機能実装を結構喜んでたんですが、ポケモンのこれで一気に信用度が地の底になってしまった https://t.co/dedJupBgnz

ChatGPT Agent、macOSアプリでも利用可能に【続報】

先日一部で先行展開が報告された「ChatGPT Agent」の続報です。
Web版やiOSに続き、macOSアプリでも利用可能になったとの報告が上がっています。
EU圏のユーザーにも展開されている模様でロールアウトは順調な一方、一部では機能が利用できなくなるなど、まだ不安定な状況のようです。

TestingCatalog News 🗞: (翻訳) エージェントモードはChatGPT macOSアプリでも展開中です！ご参考まで：Plusユーザーへの展開は進行中であり、EUのユーザーも利用できます。https://t.co/4W3x4bgGXW

Kol Tregaskes: (翻訳) ChatGPT Agent PlusのEUでの展開、えーと、ロールバック？複数のEUが同じことを報告していますが、おそらく誰かがボタンを早く押しすぎたのでしょう。EUユーザーの皆さん、Agentはありますか、ありませんか？https://t.co/hiqBouGzwh