2025年08月11日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

次世代AI開発の岐路:GPT-5評価と人材動向に注目

先端AIモデルの実力評価が業界の焦点となっています。GPT-5が特定指示なしではGPT-4oより性能が低いとの指摘が相次ぎ、「スケーリング則の終わり」を示唆する声も。一方でxAIはGrok 4を無料開放し、新マルチモーダルモデルV7も発表。

AIチップ市場では米政府がNVIDIA・AMDに対し、売上15%納付を条件に中国向け輸出を許可する異例の合意が報じられました。また、AppleからMetaへのAI人材流出が続いているとの報道も。

それでは各トピックの詳細を見ていきましょう。

目次

  1. 【続報】GPT-5の思考能力に疑問の声、特定指示なしではGPT-4o以下か
  2. 米政府、NVIDIA・AMDに売上15%納付を条件に中国向けチップ輸出許可か【続報】
  3. xAI、Grok 4を無料開放、新マルチモーダルモデルV7も発表【続報】
  4. (続報) OpenAI、GPT-5の反響受け利用制限緩和とUI改善
  5. LLMに人格は必要か? #keep4o運動を機に議論が活発化
  6. AppleからMetaへ5人目のAI人材流出か【続報】
  7. 【続報】Intelの苦境、次世代18Aプロセスも量産延期か
  8. LLM長文処理を効率化、Attention Sinksが再注目
  9. ChatGPTに音楽制作ツールbeatbot登場、Azure AIも新ツール発表

【続報】GPT-5の思考能力に疑問の声、特定指示なしではGPT-4o以下か

  • GPT-5の性能をめぐる賛否両論についての続報です。
  • 多くのユーザーから、特定の指示(例:「Think longer/harder」)を与えない場合、GPT-4oよりも性能が低いとの指摘が上がっています。
  • 基本的な推論タスクでの間違いも報告されており、一部では「スケーリング則の終わりではないか」との声も出ています。
  • OpenAIのGreg Brockman氏は科学研究での応用例をアピールしていますが、実用シーンでの安定性を含めた総合的な評価が求められています。
Greg Brockman: (翻訳) 科学的協力者としてのGPT-5:

Bindu Reddy: (翻訳) 思考しないGPT-5は良いモデルではない\n\n思考しないGPT-5はLiveBenchでGPT-4oの亜種よりもスコアが低く、ある種の退化です\n\n正直なところ、これはGPT-5がコストを削減するために大きなモデルから蒸留された小さなモデルのように思えます。\n\nただ良いモデルを提供して、それに対して課金してください🤷

Yuchen Jin: (翻訳) GPT-5は2度失敗した。スケーリング則は終わりを迎えようとしている。オープンソースAIは天命を受けるだろう。

米政府、NVIDIA・AMDに売上15%納付を条件に中国向けチップ輸出許可か【続報】

  • NVIDIAとAMDの中国向けAIチップ輸出再開に関する続報です。
  • Financial Timesは、米政府が両社に対し、売上の15%を政府に支払うことを条件に輸出ライセンスを付与することで合意したと報じました。
  • この異例の取引は、停滞していた中国市場へのアクセスを再開させ、世界の半導体市場やAI開発競争に大きな影響を与える可能性があります。
Financial Times: (翻訳) NvidiaとAMD、中国向けチップ売上収益の15%を米国政府に支払う

Rohan Paul: (翻訳) 🚨速報:\n\nNVIDIAとAMDは、H20およびMI308の輸出ライセンスを確保するため、中国でのチップ収益の15%を米国と共有します。\n\nこれは前例のないライセンス料支払い契約であり、両社にとって停滞していた市場を再開させるものです。\n\nこの15%は、中国でのH20およびMI308 GPUの売上にのみ適用されます。

パウロ: こりゃNvidiaとBroadcomに祭りが来ますな

xAI、Grok 4を無料開放、新マルチモーダルモデルV7も発表【続報】

  • xAIのGrokに関する続報です。これまで有料プラン限定だった「Grok 4」モデルが全ユーザーに無料開放されました。
  • さらに、動画や音声を直接理解できるネイティブマルチモーダルな新基盤モデル「V7」の事前学習が完了したことも発表されています。
  • 将来的には、生成したゲームを自らプレイし改善するような、より高度なエージェント機能の搭載も予告されています。
Tech Dev Notes: (翻訳) Grok 4モデルが全ユーザーに無料で利用可能になりました

Tech Dev Notes: (翻訳) Grokネイティブマルチモーダルは先週、事前学習を完了しました🔥\n\nビデオ、オーディオをネイティブに入力し、音声のニュアンスや感情を自然に理解できます

Tech Dev Notes: (翻訳) 次回のアップデートで、Grokは自身でゲームを操作し、プレイするようになります。\n\nそして、結果が合格点に達するまで、それに応じてコードを調整します。

(続報) OpenAI、GPT-5の反響受け利用制限緩和とUI改善

  • OpenAIは、GPT-5リリース後のユーザーからのフィードバックを受け、利用制限の大幅緩和とUIの改善を発表しました。
  • Plusユーザー向けの思考モデル(Reasoning)の利用回数は、週3000回を試行するなど、GPT-5リリース前よりも高い水準に設定される予定です。
  • UIも改善され、回答生成後に再生成ボタンにカーソルを合わせると使用されたモデル名が表示されるようになり、どのモデルを使っているかが明確になりました。
  • この迅速な対応は、ユーザーコミュニティとの対話を重視するOpenAIの姿勢の表れとして好意的に受け止められています。
Kol Tregaskes: (翻訳) 本日、ChatGPT Plusユーザー向けの推論のレート制限を大幅に引き上げます。また、すべてのモデルクラスの制限は、まもなくGPT-5以前よりも高くなります。\n\nまた、どのモデルが動作しているかを示すUIの変更もまもなく行います。

Chubby♨️: (翻訳) プラスティアは週に3000回の推論クエリ。\n\nこれは予想外だった。なんてこった。\n\nありがとう、サム、感謝します。

限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: ChatGPTのアプデで不評だったモデル勝手に選ばれて何のモデル使ったか分からない問題、再生成のボタンにホバリングするとどのモデル使ったかわかるようになりましたね\n\nminiとnanoはまだ見た事ないのですがそれも表示されるのでしょうか🤔

LLMに人格は必要か? #keep4o運動を機に議論が活発化

  • 「#keep4o」運動をきっかけに、LLMの「人格」や「共感性」のあり方について、開発者やパワーユーザーの間で議論が活発化しています。
  • 一部のユーザーがAIとの感情的な繋がりを求める一方で、プログラミングなどの専門的なタスクでは、共感的な応答よりも事実を正確に指摘する能力を重視する声も多く上がっています。
  • こうした状況を受け、LLM本体とは別に、応答のトーンや性格を調整する「人格レイヤー」を設けるべきではないか、という意見も出ており、今後のモデル設計における重要な論点となりそうです。
erukiti: LLMには人格レイヤーが必要なんだと思う|erukiti @erukiti

mizchi: 今のAIの共感性、プログラマとしてはかなり邪魔になりつつあり、共感よりも事実の指摘にリソース振ってほしいし、温度みたいにパラメーターで調節できるようにしといてほしい

erukiti: うーん、o3由来のサイコパスみが高すぎる人格もgpt-4oの人格も嫌いだし、「人格層」みたいなレイヤーが必要なんではないかなー\n\n人間のコミュニケーション能力だって別に直感だけで構築されてるわけじゃないでしょ\n\n「エージェント」の問題と同じだと思うんだよな

AppleからMetaへ5人目のAI人材流出か【続報】

  • 先日から続く、AppleからMetaへのAI人材流出に関する続報です。
  • Bloombergの報道によると、この1ヶ月強で5人目のAIエンジニアがAppleの基盤モデルチームからMetaのSuperintelligence部門へ移籍したと報じられました。
  • 一方で、Appleは次期SiriでAIによるハンズフリーでの完全なiPhone操作を目指しているとも報じられており、今後の巻き返しが注目されます。
Mark Gurman: (翻訳) Power Onより — またかと思うかもしれませんが、Appleはまた別のAIエンジニアをMetaに奪われました。これで、AppleのFoundation ModelsからMeta Superintelligenceへの流出は、この1ヶ月あまりで5人目となります。

Mark Gurman: (翻訳) Power On:Appleの次期AI音声コントロール機能は、新しいSiriの一部として、iPhoneを完全にハンズフリーで操作できるもので、もしうまく機能すれば、あまり知られていないゲームチェンジャーになる可能性があります。

【続報】Intelの苦境、次世代18Aプロセスも量産延期か

  • Intelの経営不振に関する続報です。韓国メディアが、同社の次世代プロセス「18A」の歩留まりが低く、量産開始が2026年にずれ込む見込みだと報じました。
  • 相次ぐ赤字報道や大規模レイオフに加え、先端プロセス開発の遅れは、AIチップ市場でのTSMCなど競合との差をさらに広げる可能性があります。
Jukan: (翻訳) 韓国メディアは、Intelの18Aプロセスの歩留まりが低いため、量産開始時期が2026年に延期されたと報じた。 $INTC

パウロ: 韓国メディアによるとIntel 18Aプロセスは低い歩留まりにより量産スケジュールは来年へ\n\nありゃりゃ\nまぁそうなるよね

LLM長文処理を効率化、Attention Sinksが再注目

  • 長文コンテキストを持つLLMの処理を効率化する「Attention Sinks」という研究が、再び注目を集めています。
  • この手法は、入力の最初にある数トークン(アテンションシンク)が多くの注意を保持しているため、そこを維持すれば古いトークンを削除しても性能が安定するというものです。
  • OpenAIのオープンソースモデル「gpt-oss」にこの技術が実装されたことや、Llama.cppに実装したところ推論速度が約3倍に向上したとの報告もあり、話題となっています。
  • この技術は、特にリソースが限られるローカル環境でのLLM活用を促進する可能性があり、今後の発展が期待されます。
webbigdata: Attention Sinks(注意の溝)\n\nモデルは最初の1~4トークンに大量の注意を集中(アテンションシンク)させているので、そこだけ保持すれば古いトークンを削除しても長コンテキスト処理が安定するという研究\n\ngpt-ossが実装しており再注目を浴び、Llama.cppが早速実装した事で3倍近いPP速度アップの報告も

ChatGPTに音楽制作ツールbeatbot登場、Azure AIも新ツール発表

  • ChatGPTに「beatbot」という新しいツールが追加された模様です。プロンプトに応じて、インタラクティブなDAW(音楽制作ソフト)のようなウィジェットを表示する機能とみられています。
  • また、MicrosoftのAzure AI Foundryからは、信頼性の高いブラウザ自動化ツールが発表されました。
  • このほか、OpenAIがコーディングAIツール「Codex CLI」のアップデートを近々行うことを示唆しており、各社で多様な開発が進んでいます。
Kol Tregaskes: (翻訳) GPT-5がChatGPT Codexに搭載されるようです。

Tibor Blaho: (翻訳) GPT-5のローンチ前に、新しい「ecosystem_demo.daw_drums」ツールがChatGPTに追加されました。\n\nGPT-5に「beatbot」を使用するように指示すると、インタラクティブで最小限のDAWウィジェット(ドラムトラック付きのループグリッド(ステップシーケンサー))が表示されます。

daka | Microsoft | AI: ブラウザー自動化ツール 発表 — Azure AI Foundry Agent Service|daka | Microsoft | AI \n\n今までのCUAと異なる信頼性の高い自動化\n・このツールは 「ダウンパース」 と呼ばれる手法を利用して、Web ページの構造(DOM=Document Object Model

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください