2025年07月29日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
次世代GPT-5への期待高まる中、グローバルAI開発競争が加速
OpenAIの次期モデルGPT-5への期待が高まっています。ChatGPTに「より長く思考する」オプションが追加され、「zenith」「summit」などの未発表モデル名もリークされました。
一方で中国発オープンソースLLMの躍進も注目です。AlibabaのQwen3 CoderはClaude Sonnet 4に匹敵する性能を示し、技術的貢献も評価されています。
数学分野でも競争が激化し、Robinhood CEOが共同設立したHarmonicの「Aristotle」がIMO金メダル級の成績を達成しました。
それでは各トピックの詳細を見ていきましょう。
目次
- OpenAIのGPT-5、新UIやモデル名登場で期待再燃【続報】
- Claude Codeに性能劣化の指摘相次ぐ 利用制限強化の議論と並行し
- 中国発オープンソースLLMが躍進、Alibabaは新手法も発表
- AIエージェント開発活発化、NVIDIAはSLM活用を提唱
- NVIDIA、中国向けH20チップが品薄か 30万基追加発注報道
- Grokの動画生成機能、ベータ版の提供を開始【続報】
- NotebookLM、資料から動画を自動生成する新機能が正式リリース【続報】
- Robinhood CEOのAIもIMO金メダル級、競争激化
OpenAIのGPT-5、新UIやモデル名登場で期待再燃【続報】
- OpenAIの次期モデルGPT-5を巡る続報です。ChatGPTのUIに「より長く思考する」オプションが追加され、GPT-5リリースの兆候ではないかと憶測を呼んでいます。
- このオプションは現在のところo3モデルにルーティングされるようですが、一部では新モデルへの布石と見られています。
- また、関係者からは「zenith」「summit」といった未発表モデルのテスト情報もリークされており、特にコーディング性能の向上に期待が集まっています。
- こうした期待を背景に、OpenAIの評価額は2600億ドルに達したと報じられています。
ʟᴇɢɪᴛ: (翻訳) 新しいOpenAIモデルをテスト中のメモ: - zenithとsummitが最も有能に感じる - summitは他よりも長く推論した - zenithは2〜3倍速く、非常に良い - lobsterは最も完成度の高いゲームを作成した(効果音付き!) - zenithはSimpleBenchで10/10を記録(公開セット、ラッキーな実行)
Bindu Reddy: (翻訳) GPT-5はコーディングにおいてSonnet-4と同等の性能を持つとすでに噂されています。 もし本当なら、すべては価格次第ということになります。
Kol Tregaskes: (翻訳) 「より長く考える」はo3であり、GPT-5ではないことが確認されました。 皆さん、落ち着いてください。 4oを切り替えて「より長く考える」を押すと、その下にo3だったと表示されます。自分で試してみてください。o4-miniも試しました。 https://t.co/v9Gm0lDRvQ
Claude Codeに性能劣化の指摘相次ぐ 利用制限強化の議論と並行し
- AIコーディング支援ツール「Claude Code」の利用制限強化が発表されたが、それと並行してユーザーから性能劣化を指摘する声が上がっている。
- 一部ユーザーからは「最近、指示を正しく理解しなくなった」「以前より質の低いコードを生成する」といった報告がなされている。
- 利用制限の議論に加え、モデルの性能自体も今後の動向を判断する上で重要な論点となりそうだ。
Rohan Paul: (翻訳) Anthropicは、Claude Codeの極端な使用を抑制するために新しいレート制限を導入しました。 これにより、24時間365日の連続実行やアカウントの再販をブロックし、ほとんどのProユーザーにはSonnet 4を40〜80時間利用できるようにします。追加の使用量は、Maxプランの通常のAPI価格で利用できます。 パワーコーダーはClaudeを使い続けます。https://...
Maxwell! 🌃 🌻 🐇 ☃: あまりにも claude code が人気すぎて,料金と負荷が見合っていないとのことで,8月から少し利用上限の制限を強くするみたい みんな楽するのが好きだから仕方ないね ☀️
mizchi: claude code この3日ぐらいアホになってる
中国発オープンソースLLMが躍進、Alibabaは新手法も発表
- 中国発のオープンソースLLMの存在感が増しており、7月だけでもGLM-4.5、Wan-2.2、Kimi K2など多数の高性能モデルがリリースされています。
- 中でもAlibabaの「Qwen3 Coder」は、コーディング支援ツールClineでの評価でClaude Sonnet 4に匹敵する性能を示したことが新たにわかりました。
- またAlibabaは、LLMの学習を安定させる新手法「GSPO (Group Sequence Policy Optimization)」に関する論文も発表。Hugging Faceで月間人気3位になるなど、技術的な貢献も評価されています。
clem 🤗: (翻訳) @Alibaba_QwenによるGSPOの論文は、7月の@huggingfaceで既に3番目に人気のある論文になっています。 これはこの分野に大きな影響を与えると私は推測しています! https://t.co/jSFZGgBdoE また、この分野への大規模な貢献として研究論文を祝うことに戻りませんか? https://t.co/NluYkD7i6S
Cline: (翻訳) Qwen3 Coderは、実世界のデータに基づくと、Clineでの差分編集失敗率が5.32%です。 差分編集の実行において、Claude Sonnet 4やKimi K2と並んで優れたモデルです。 入出力トークン100万あたり0.30ドル/1.20ドルのオープンソースモデルとしては悪くありません 👀 https://t.co/65ELh5tpUv
Yuchen Jin: (翻訳) 中国は7月にこれらのオープンソースモデルをリリースしました: - GLM-4.5 - GLM-4.5-Air - Wan-2.2 - Qwen3 Coder - Qwen3-235B-A22B-Thinking-2507 - Qwen3-235B-A22B-2507 - Kimi K2 一方: - OpenAIはまだオープンソースモデルをリリースしていません - Anthropicは...
AIエージェント開発活発化、NVIDIAはSLM活用を提唱
- AIエージェント開発を巡る動きが活発化しています。NVIDIA Researchは、応答性やコスト効率の観点から小規模言語モデル(SLM)の活用を提唱する論文を発表しました。
- Google Cloudがエージェント開発のR&Dラボ「Tzafon」との提携を発表したほか、AIエージェント用のインフラを提供する「E2B」が2100万ドルの資金調達を完了するなど、開発環境の整備も進んでいます。
- 開発者コミュニティでは、タスクを並列化しトークン消費を抑える「SubAgent」のような、より実践的な手法も議論されています。
elvis: (翻訳) 数ヶ月前、AIエージェントはまだ非常に脆弱で、私にとってはあまり役に立ちませんでした。 新しい推論モデルとUIのおかげで、状況は好転しています。 毎週、私は複雑なワークフロー全体を置き換えるエージェントを少なくとも2つ作成しています。 AIエージェントを試すのにこれほど良い時期はありません。
Shinichi Takaŷanagi: NVIDIA Researchより「AIエージェントでは小規模言語モデル(SLM)が主役」との主張。ケーススタディではLLM呼び出しの40~70%を置換可能と示し、移行手順(6章)も提案。SLMでの自己蒸留ループで性能改善のアイディアも。 Small Language Models are the Future of Agentic AI https://t.co/fwEAInQAc8
mizchi: SubAgentでトークン消費を減らしつつ並列化するための SubAgentできてきた https://t.co/FAjBpC4MHa
NVIDIA、中国向けH20チップが品薄か 30万基追加発注報道
- 米国の輸出規制に対応し開発されたNVIDIAの中国向けAIチップ「H20」の続報です。
- NVIDIAがTSMCに対し、同チップを30万基緊急発注したと報じられました。
- 中国国内の旺盛なAI開発需要を背景に、供給が追いついていない状況が浮き彫りになった形です。
- この動きは半導体製造装置メーカーにも影響を与えており、アドバンテストは生成AI向けテスターの受注増を背景に好決算を発表しました。
- 一方で、生成AI関連以外の半導体市場は依然として厳しく、市場の二極化が鮮明になっています。
Rohan Paul: (翻訳) NVIDIAは60万〜90万基のH20 GPUを保有しているのに対し、中国は180万基を求めており、大きなギャップが生じています。 NVIDIAのCUDAソフトウェアと緊密なマルチGPUスケーリングには、実質的に代替手段がありません。 Huaweiの910Cや他のローカルオプションを上回るため、入荷するパレットはすべてすぐに空になります。 ジェフリーズ・リサーチ(米国)https...
パウロ: きたああああああ これは緊急注文になるはず Nvidia 30万基のH20チップをTSMCに発注 https://t.co/kxSvRZFYvh
パウロ: アドバンテスト SoCテスター、爆裂っ こりゃ生成AIは激烈に強い メモリテスタの前四半期から減ったけど高水準 https://t.co/CK0XYOhW4q
Grokの動画生成機能、ベータ版の提供を開始【続報】
- xAIのAIチャットボTット「Grok」に関する続報です。
- 以前より開発中と報じられていた動画生成機能が、ベータ版として一部ユーザーに提供され始めました。
- この機能は「Imagine」という名称で、Grokアプリからオプトインすることで利用できます。
- あわせて、AIコンパニオン機能「Valentine」も順次展開されています。
TestingCatalog News 🗞: (翻訳) 速報🚨: GrokアプリでImagineオプトインとValentineコンパニオンが順次展開中! https://t.co/gDpkzze2pH
Rohan Paul: (翻訳) xAIがGrok内でビデオ生成のベータ版をリリース Valentine/Ani https://t.co/gMI7qR8QT4
Chubby♨️: (翻訳) grokアプリで動画生成が可能に
NotebookLM、資料から動画を自動生成する新機能が正式リリース【続報】
- 以前からリーク情報などで報じられていた、GoogleのAIノートアプリ「NotebookLM」の動画自動生成機能「Video Overviews」が正式にリリースされました。
- アップロードした資料をもとに、AIがスライドとナレーションを自動で作成し、解説動画を生成します。
- 情報の要約やプレゼンテーション作成の効率化が期待され、教育やコンテンツ制作での活用が見込まれます。
NotebookLM: (翻訳) 今年の夏の大作が、もうすぐあなたのコンピュータースクリーンにやってくる… 👀 👀 👀 https://t.co/UGqcOdX8LF
まつにぃ: NotebookLMから「夏に大きなものを発表するかも?」告知がありますが、これは「Video Overviews」の近日解禁告知でしょう。 AIが自動でスライド動画を作成し音声で解説するスタイルのもので、これ一個で特に教育とかそのあたりに深く刺さるものになりそうですね。
Kol Tregaskes: (翻訳) 本日、NotebookLMにビデオ概要機能が追加されます! https://t.co/6F56YWnuq7
Robinhood CEOのAIもIMO金メダル級、競争激化
- 先日お伝えしたOpenAI、Googleに続き、新たなAIが国際数学オリンピック(IMO)で金メダル級の成績を達成しました。
- 米国株取引アプリRobinhoodのCEO、Vlad Tenev氏が共同設立したAIスタートアップ「Harmonic」が、数学特化モデル「Aristotle」を発表したものです。
- モデルの性能を試せるチャットアプリのベータ版もiOSとAndroid向けに公開されており、専門分野でのAI開発競争がさらに激化しています。
TechCrunch: (翻訳) ロビンフッドCEOのAI数学スタートアップ、ハーモニックがAIチャットボットアプリをローンチ | TechCrunch https://t.co/LoH6isiRWo
Tetsuro Miyatake: Robinhood創業者CEOのVlad Tenevが立ち上げたAIスタートアップHarmonicベータ版のiOSアプリをリリースした。 Harmonicはハルシネーションを大幅に削減した数学のAIモデル「Aristotle」を作っている。 https://t.co/5TlA47XC61
Rohan Paul: (翻訳) Harmonic MathのAIモデルAristotleが、IMO(国際数学オリンピック)で再び金メダルを獲得。 RobinhoodのCEOであるVlad Tenevが共同設立したAIスタートアップHarmonicは、ユーザーがそのAIモデルにアクセスできるiOSおよびAndroidチャットボットアプリのベータ版のローンチを発表しました。https://t.co/4hjmCcwp0w