2025年12月13日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
GPT-5.2の評価分かれる、法人市場でAnthropic首位に
OpenAIの最新モデルGPT-5.2がリリースされ、ベンチマークによって評価が分かれる結果となりました。一方で法人向けLLM市場ではAnthropicがシェア40%で首位に立ち、OpenAIを逆転しています。
インフラ面では、NVIDIAがH200の増産を検討し、OracleのDC遅延報道を巡る動きも注目されました。またNVIDIAのジェンスン・フアンCEOがFTの「今年の人」に選出されています。
それでは、本日の主要トピックを順に見ていきましょう。
目次
- 【続報】GPT-5.2、新たなベンチマーク評価で賛否両論
- OpenAI幹部、2026年のエンタープライズAI注力を明言
- 【続報】NVIDIA、H200増産を検討か 中国からの需要急増で
- Oracle、OpenAI向けDCの遅延報道を否定【続報】
- Google Gemini音声機能続報、翻訳アプリやVertex AIで新展開
- 法人LLM市場、Anthropicがシェア40%で首位に
- NVIDIAのジェンスン・フアンCEOがFTの「今年の人」に
- コーディングLLM使い分け、日常はClaude・難題はGPT-5.2か
- GPT-5.2 Proで長考や応答不能の不具合報告
【続報】GPT-5.2、新たなベンチマーク評価で賛否両論
- GPT-5シリーズの性能評価に関する続報です。OpenAIの最新モデル「GPT-5.2」がリリースされました。
- 経済的価値を測るベンチマーク「GDPval」ではClaude 4.5 Opusを上回る一方、「SimpleBench」では旧モデルに劣るなど、評価が分かれています。
- 長文コンテキスト処理能力は高いとされていますが、特定のタスクでは期待外れとの声も上がっています。
Lisan al Gaib: (翻訳) GPT-5.2はGDPvalで実際にClaude 4.5 Opusを打ち負かしました https://t.co/qukKZ07R4x
Lisan al Gaib: (翻訳) SimpleBenchの結果はGPT-5.2にとって非常に残念なものでした。\n\nGPT-5.2は、ほぼ1年前のモデルであるSonnet 3.7を下回るスコアです。\n\nGPT-5.2 Proもそれほど良くはなく、かろうじてGPT-5を上回る程度です。 https://t.co/2KjDz9iiOb
Lisan al Gaib: (翻訳) GPT-5.2はVendingBench-2でGPT-5.1から大きな改善を見せましたが、Sonnet 4.5にはかろうじて勝利し、Gemini 3 ProとClaude 4.5 Opusには敗北しました。https://t.co/d1Wnb0Ohbn
OpenAI幹部、2026年のエンタープライズAI注力を明言
- OpenAIの共同創業者であるGreg Brockman氏が、2026年はエンタープライズAIが非常に重要なテーマになると発言しました。
- これはCEOのSam Altman氏が以前語った内容を裏付けるもので、OpenAIが法人向けビジネスを本格化させる姿勢を明確に示しています。
Greg Brockman: (翻訳) エンタープライズAIは2026年の巨大なテーマになるでしょう
【続報】NVIDIA、H200増産を検討か 中国からの需要急増で
- NVIDIAのAIチップ「H200」の対中輸出を巡る続報です。
- 米国の輸出許可を受け、中国の大手テック企業などから想定を上回る需要が寄せられていることを背景に、NVIDIAがH200の増産を検討していると報じられました。
- この動きは、中国市場におけるAIインフラ投資の力強さを示唆しています。
パウロ: Nvidia 中国の顧客からの需要からH200の増産検討へ きたーーー https://t.co/6oCEUh69lZ
パウロ: H200許可ならばこれだけで来年20Bは追加だろうなぁ
Jukan: (翻訳) ジェンスン・フアンは文字通り砂を金に変えている(笑)。モルガン・スタンレーの試算によると、H200のコストはHBMを除いてわずか1,300ドルだ。 https://t.co/m5UuMKCZb9
Oracle、OpenAI向けDCの遅延報道を否定【続報】
- 以前から建設の遅延リスクが報じられていた、OracleのOpenAI向けデータセンターに関する続報です。
- 一部の完成が2027年から2028年に延期されたと報じられましたが、Oracleは「契約上のコミットメントを満たすためのサイトに遅延はない」と公式に否定しました。
- この一連の報道は、AI開発を支えるインフラ整備の動向が市場に大きな影響を与えることを示しています。
Bloomberg: (翻訳) オラクルは、AIモデル開発者OpenAIのために開発している一部のデータセンターの完成日を2027年から2028年に延期しました https://t.co/fbudZWq6no
Evan: (翻訳) オラクル$ORCLは、AIデータセンターの遅延に関する話はフェイクニュースだと述べた
Rihard Jarc: (翻訳) もしこのOpenAIのデータセンター遅延のニュースが本当なら、これは重要です。数週間前、私はまさにこのトピックについてここで書きました。主要なAI投資家2社の設備投資の軌道を延長することは、多くの企業にとって悪いニュースです。https://t.co/RScfDIsj3M
Google Gemini音声機能続報、翻訳アプリやVertex AIで新展開
- GoogleのGemini音声機能に関する続報です。
- Google翻訳アプリにおいて、リアルタイムの音声翻訳機能がベータ版として提供開始されました。
- また、開発者向けにはVertex AI上のGemini Live APIが一般提供を開始し、より自然で感情を認識する会話モデルの構築が可能になります。
Google AI: (翻訳) お知らせです 🔊 Gemini Audioモデルと機能にいくつかのアップデートを行いました: — Geminiのライブ音声翻訳機能がGoogle翻訳アプリでベータ版として展開され、人間のニュアンスを捉えたリアルタイムの音声翻訳を提供します https://t.co/0ssdUS51XE
Google Cloud Tech: (翻訳) Vertex AI の Gemini Live API が一般提供開始になりました! このリリースは、厳格な多段階の音声システムから、単一でリアルタイムかつ感情を認識する会話モデルへの根本的な移行を示すものです → https://t.co/AhQ9rssG9p https://t.co/rJMctIy9hQ
TestingCatalog News 🗞: (翻訳) GoogleはGemini 2.5 Flash Native Audioモデルを更新し、全体的な会話品質で以前のバージョンより21%改善しました。Gemini Liveはもうすぐどこでも使えるようになるのでしょうか?👀 https://t.co/0B0MQzYiw6
法人LLM市場、Anthropicがシェア40%で首位に
- Menlo Venturesのレポートで、法人向けLLM市場のシェアでAnthropicがOpenAIを上回り、首位に立ったと報告されました。
- Anthropicのシェアは昨年の24%から40%に増加、OpenAIは50%から27%に減少しており、以前から指摘されていた法人市場での評価がシェアの逆転という形で現れました。
Rohan Paul: (翻訳) LLM市場シェア:Anthropicがエンタープライズでリードを拡大。\n- Anthropicは現在、エンタープライズLLM支出の40%を獲得しており、昨年の24%、2023年の12%から増加しています。\n- 同じ期間に、OpenAIはエンタープライズシェアのほぼ半分を失い、2023年の50%から27%に減少しました。\n- Googleも https://t.co/S0GVbyI...
NVIDIAのジェンスン・フアンCEOがFTの「今年の人」に
- 英紙フィナンシャル・タイムズが、NVIDIAのCEOであるジェンスン・フアン氏を「今年の人(Person of the Year)」に選出しました。
- AI革命における同氏とNVIDIAの役割を高く評価したもので、AIブームを象徴する出来事として注目されています。
Evan: (翻訳) Nvidia $NVDA のCEO、ジェンスン・フアンがフィナンシャル・タイムズの「今年の人」に選ばれました https://t.co/verYUOhaeE
Rohan Paul: (翻訳) フィナンシャル・タイムズは、ジェンスン・フアン氏をAIで果たした役割を評価し、今年の人に選びました。https://t.co/gOgsO10ZgD
コーディングLLM使い分け、日常はClaude・難題はGPT-5.2か
- コーディング用途での最適なLLMを巡る開発者の議論に関する続報です。
- 日常的な作業では依然としてAnthropicのClaude 4.5 Opusを好む声が多い一方、バグ修正や特に困難な問題にはGPT-5.2が適しているとの意見が見られます。
- タスクの性質に応じてモデルを使い分ける動きが、より具体化しているようです。
Ian Nuttall: (翻訳) 最高のコーディングモデル 要約\n\n- 普段使い: opus 4.5\n- 計画、監査、バグ修正: gpt 5.2 high\n- 最も難しい問題: リポジトリプロンプト経由の gpt 5.2 pro
leo 🐾: (翻訳) 私はまだ95%のコーディングタスクでgpt-5.2よりもopus 4.5を好みます
Bindu Reddy: (翻訳) 最高のモデルを組み合わせてパフォーマンスを最大化しましょう。\n- プレゼンテーションではNano Banana Proを使用\n- 問題のデバッグにはOpus 4.5を入手\n- ライティングにはGemini 3.0\n- コーディングにはSonnet 4.5\n- ランダムなチャットにはGPT 5.2\n- 安価に解決できる簡単な問題にはDeepseek v3.5
GPT-5.2 Proで長考や応答不能の不具合報告
- OpenAIのGPT-5.2 Proについて、一部のユーザーから不具合が報告されています。
- 長時間思考した末に応答を返さなかったり、「Updateボタン」を押すよう指示されるものの該当ボタンが存在しないといった問題が指摘されています。
- OpenAIのMiles Brundage氏も問題を認識していることを示唆しており、今後の改善が待たれます。
Miles Brundage: (翻訳) ええ、GPT-5.2 Proのアップデートで何かが壊れました
ぱぷりか炒め: GPT5.2ProでUpdateボタンを押してって出るけどそんなボタンない。追加予定の機能? というかProのExtended thinkingめちゃくちゃ長考してくれて良い https://t.co/KsdsGa5FUw
ぱぷりか炒め: GPT5.2Proで200件の調査タスクは30分くらいかけてやってくれたから500件に増やしてみたらだめだった Web参照の回数上限あるっぽい https://t.co/5LGWz6WbO5