09 8月 2025

2025年08月09日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5ロールアウト開始と長期コンテキスト技術の進展

AI業界では新たな動きが加速しています。OpenAIがGPT-5の段階的ロールアウトを開始しましたが、一部ユーザーからは期待外れの声が上がる一方、長期コンテキスト推論では高評価を獲得しました。

同社はGPT-4o問題への対応策も発表し、Plusユーザー向けレート制限の引き上げやGPT-4o選択機能の復活を約束しています。

一方、AlibabaのQwen3モデルも100万トークン対応を実現するなど、超長期コンテキスト処理技術の競争が激化しています。

それでは各トピックの詳細についてご覧いただきましょう。

【続報】GPT-5ロールアウト開始、性能に期待外れの声も
OpenAI、GPT-4o問題などを受けAMAで改善策を発表【続報】
GPT-5、長期コンテキスト推論のベンチマークで高評価
Alibaba、Qwen3汎用モデルも100万トークン対応【続報】
KaggleのDeepMindコンペ続報、正式名称は抽象推論チャレンジ
Claude Code v1.0.71公開、ツールの成熟度が焦点に
Meta、次世代Llama 4.5/4.X開発の新ラボ設立
OpenAIのStargate計画続報、SoftBankが工場買収
xAIのGrok、広告導入計画や米アプリ2位など動向活発化
Google、FinanceのAI強化やGartner評価など新展開

【続報】GPT-5ロールアウト開始、性能に期待外れの声も

先日からお伝えしているOpenAIの次期モデルGPT-5の段階的なロールアウトが開始されました。
しかし、モデルが自動で切り替わるルーター機能の不調や、性能がGPT-4oに劣るといった指摘が相次いでおり、一部ユーザーからは期待外れの声が上がっています。
特に、以前のモデルが持っていた「個性」を惜しむ声や、GPT-4oの復活を望む意見も多く見られます。

Tibor Blaho: (翻訳) GPT-5の発売がこれまでのところ、長い待ち時間と高い期待の後だけに、少し悲しいです。 - モデル間の自動切り替え（ルーター）が部分的に壊れているか、信頼できないようです - 実際にどのモデル（標準またはミニ）と対話しているかが正確には不明です。

Yuchen Jin: (翻訳) GPT-5にはがっかりだ。まだ幻覚を見るまだemダッシュが多すぎるまだ指示に従えない 4oが恋しい 4.5が恋しい o3が恋しい大きなルーターが私を裏切り続ける長いモデルリストが好きだったことが判明友達を葬式から連れ出してくれ

Chubby♨️: (翻訳) MacBookでSafariでChatGPTを開くとGPT-5になります。WindowsコンピューターのBraveでChatGPTを開くとGPT-4oになります。自分のアカウントでログインしています。iOSアプリでは再びGPT-5です。 ??

OpenAI、GPT-4o問題などを受けAMAで改善策を発表【続報】

先週から続くGPT-4oの応答品質問題など、多くのフィードバックを受けOpenAIがRedditのAMAで対応策を発表しました。
Plusユーザー向けのレート制限を2倍に引き上げます。
要望の多かったGPT-4oを選択可能に戻します。
また、開発中の次期モデルGPT-5の改善も約束しました。

TestingCatalog News 🗞: (翻訳) 要約すると、GPT-5はより賢くなり、自動モデルスイッチャーは壊れており、ロールアウト後にレート制限が引き上げられます。優れたGPTボット🤖

Chubby♨️: (翻訳) 敬意を表すべきところは敬意を表します。サム・アルトマンとOpenAIがフィードバックを真剣に受け止めていることを本当に信じています。そして、それは非常に立派な成果です。コミュニティの提案に基づいて批判に立ち向かい、大幅な変更を加える謙虚さを持っている企業は多くありません。

morgan —: (翻訳) #keep4o ボットが勝利した

GPT-5、長期コンテキスト推論のベンチマークで高評価

GPT-5の初期評価は賛否両論だが、特定の能力では高い性能を示している。
OpenAIのGreg Brockman氏によると、複数の長文（約10万トークン）にまたがる推論能力をテストするベンチマーク「AA-LCR」で1位と2位を独占したという。
複雑で長い文脈を理解する能力については、確かな進化を遂げているようだ。

Greg Brockman: (翻訳) 長文コンテキスト推論のためのgpt-5:

Haider.: (翻訳) 去年は私が間違っていた。 GPT-5は、人間レベルのAIへの最大のボトルネックが「記憶」や「幻覚」ではないことを証明した。それはロングコンテキストウィンドウだ。 GPT-4.5/5は幻覚を大幅に減らし、記憶も手の届く範囲になった。しかし、ロングコンテキストウィンドウを解読した者が勝利を宣言できる。

Kol Tregaskes: (翻訳) OpenAIモデルはIF（指示追従）ベンチマークを支配しており、20ポイントほどの明確なリードを持っています。o3からのわずかなジャンプですが、GPT-5（高）がチャートのトップに立っています。

Alibaba、Qwen3汎用モデルも100万トークン対応【続報】

Alibaba Cloudが、オープンソースLLM「Qwen3」の汎用モデル（30B, 235B）も最大100万トークンの超長期コンテキストに対応したと発表しました。【続報】
先日発表されたコーディングモデルに続くアップデートとなります。
Dual Chunk Attention (DCA) という技術により、長いシーケンスを効率的に処理しつつ、全体の一貫性を保つことを可能にしています。

Qwen: (翻訳) 🚀 Qwen3-30B-A3B-2507およびQwen3-235B-A22B-2507は、最大100万トークンまでの超長コンテキストをサポートするようになりました！ 🔧搭載機能： • デュアルチャンクアテンション（DCA）–長いシーケンスを管理可能なチャンクに分割し、グローバルな一貫性を維持する長さの外挿法。 •

Junyang Lin: (翻訳) はい、これは私たちの1m APIで行ったことと似ています。ossモデルでそれを使用できるようになりました。

Wolfram Ravenwolf: (翻訳) 今週のLLM関連AIニュースで一番だと思う！

KaggleのDeepMindコンペ続報、正式名称は抽象推論チャレンジ

先日お伝えしたKaggle上で開催されるGoogle DeepMind主催コンペの続報です。
正式名称が「NeurIPS 2025 - Abstract Reasoning Challenge」と発表されました。
ARC-AGIベンチマークの抽象的な推論タスクを解くPythonプログラムを作成することが目標で、賞金総額は10万ドルです。
AGIに向けた研究開発を促進する試みとして注目されます。

Kaggle: (翻訳) 📣 コンペティション開始アラート！ @GoogleDeepMind 主催の NeurIPS 2025 🎯 ARC-AGI ベンチマークから抽象的推論タスクを解決する Python プログラムを作成する 💰 賞金総額 100,000 ドル ⏰ 応募締切：2025年10月23日 https://t.co/Tc8AI0a3XP

Claude Code v1.0.71公開、ツールの成熟度が焦点に

AIコーディングアシスタントの競争に関する続報です。
Claude Codeがv1.0.71をリリースし、バックグラウンドでのコマンド実行など、より実践的な機能が追加されました。
モデル自体の性能競争に加え、CLIの使いやすさや開発体験全体の向上といった「ツールの成熟度」が、成功の鍵を握るという議論が活発化しています。

mizchi: ClaudeCodeというかCline出てきた時点でわかったのはAIももともと適切に情報を与えていればそこそこコード書けたんだけど、権限が足りなかったし人間も情報を与えるのをサボっていたということで、適切にコンテキスト情報を与える仕組みを作ると実は不満を解決するという実感こそが大事

erukiti: まだ使い始めて間もないんだけど、Codex CLI + GPT-5を使った感想 GPT-5はコーディング、エージェント能力良い。自走力高まってる。コーディングエージェントで普通に使える。良いでもCodex CLIが伸びしろしかない Codex CLIさえちゃんと進化すれば普通にClaude Codeをリプレイスできる予感

Ian Nuttall: (翻訳) Claude Code 1.0.71 がリリースされました 🔥 - Ctrl+b でバックグラウンドで bash コマンドを実行 - /statusline コマンドを使用したカスタムステータスライン

Meta、次世代Llama 4.5/4.X開発の新ラボ設立

MetaがAI分野への投資を加速させている。
スーパーインテリジェンスを目指す部門傘下に、次期モデル「Llama 4.5/4.X」を開発する「TBD Lab」を設立した。

Rohan Paul: (翻訳) 🏗️ Metaは、Meta Superintelligence Labsの下で、次のLlamaを推進し、超知能に向けて前進するためにTBD Labを結成しました。チームは、推論とエージェントのスキルをアップグレードしながら、Llama 4.5/4.Xというニックネームの短期的なリリースを目標としています。 TBD Lab（「未定」の意）は、その先駆けです。

The Information: (翻訳) Metaは、音声中の感情を理解し模倣できる人工知能を専門とするスタートアップ、WaveForms AIを買収しました。この動きは、AI能力を強化するというMetaの広範な戦略を反映しています。記事を読む：https://t.co/hnIfxQ3XJu #aitechnology

TechCrunch: (翻訳) MetaがAIオーディオスタートアップのWaveFormsを買収 | TechCrunch

OpenAIのStargate計画続報、SoftBankが工場買収

OpenAIとSoftBankが進める巨大AIインフラ計画「Stargate」の続報です。
本計画の一環として、SoftBankがFoxconnのオハイオ工場を買収したと報じられました。
この動きは、AIの膨大な計算需要を支えるためのインフラ整備が本格化していることを示しています。

Bloomberg: (翻訳) ソフトバンクは、オハイオ州にあるフォックスコンのEV工場の所有権を取得する買い手であり、OpenAIおよびオラクルとの5,000億ドル規模のスターゲートデータセンタープロジェクトを始動させることを目的とした動きです。

TechCrunch: (翻訳) ソフトバンク、スターゲートAIプロジェクトのためにフォックスコンのオハイオ工場を買収と報じられる | TechCrunch

xAIのGrok、広告導入計画や米アプリ2位など動向活発化

Grokの応答に広告を導入する計画が報じられ、ユーザーからは懸念の声も上がっている。
iOSアプリは米国の生産性カテゴリでランキング2位になるなど好調を維持している。
Rampの調査では、xAIが最も急成長しているソフトウェアベンダーと評価された。

Chubby♨️: (翻訳) 先行者：xAIはGrokの応答に広告を導入する予定です。正直なところ、時間の問題でした。気に入っているか？まったく。広告よりもサブスクリプションの方が好きです。そして、信頼を損ないます。開発の種類によっては、AIへの信頼を失うことにつながる可能性があります。なぜなら、あなたは常に

Tech Dev Notes: (翻訳) Grok iOSアプリが米国生産性ランキングで2位になりました🇺🇸

Tech Dev Notes: (翻訳) xAIは今月、Rampの新規顧客成長率で1位になりました。最も急成長しているソフトウェアベンダーです。

Google、FinanceのAI強化やGartner評価など新展開

Google Financeにて、AIによる機能強化やライブニュースフィードのテストが開始されました。
Gartner社のクラウドプラットフォーム部門でリーダーに選出され、AIインフラでの強みが示されました。
既報の学生向けGemini Proプラン（1年間無料）についても改めて発表されています。

Google Gemini App: (翻訳) ポップクイズ！学生にGeminiの無料Proプランを1年間提供するブロブを何と呼びますか？私たちもわかりません。返信でブロブの名前を付けるのを手伝って、https://t.co/7CWpJPE9iNでサインアップしてください。規約が適用されます。

Google Cloud: (翻訳) 🎉 Googleは、@Gartner_incの戦略的クラウドプラットフォームサービス向けMagic Quadrant™でリーダーに選ばれ、ビジョンの完全性で最高ランクに位置付けられました！これは、当社のAI、IaaS、PaaSポートフォリオの深さと幅広さの証です。詳細を読み、レポートを入手してください→ https://t.co/SBOOQcerzc

TechCrunch: (翻訳) Google、AIアップグレードとライブニュースフィードで刷新されたGoogle Financeをテスト | TechCrunch