2025年11月27日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Claude Opus 4.5がWeb開発で首位、新画像生成モデルの兆候も
AnthropicのClaude Opus 4.5がWeb開発ベンチマークで競合を上回り首位を獲得。実際のSaaSプロジェクトで高い実用性を発揮しています。
一方、OpenAIは新画像生成モデル「ImageGenV2」の準備を進めている可能性が浮上。より高速で一貫性のある編集機能が期待されます。
また、Claudeには長い会話を自動で圧縮する新機能が追加され、ユーザー体験の向上が図られています。
では、本日の各トピックを詳しくご紹介します。
目次
- 【続報】Claude Opus 4.5、Web開発ベンチマークでも首位に
- Google TPUのコスト優位性に異論、製造委託費が論点に
- Gemini 3、高評価とケアレスミスの両側面が判明【続報】
- Claude、会話が長くなると自動で文脈を圧縮する機能を追加
- OpenAI、新画像生成モデルImageGenV2の存在が浮上
- 【続報】中国、ByteDanceにNvidia製チップの使用禁止を指示か
- Kaggle三井物産コンペ、運要素が強く難航との声
【続報】Claude Opus 4.5、Web開発ベンチマークでも首位に
- Anthropicの最新モデルClaude Opus 4.5に関する続報です。Web開発ベンチマークでGemini 3 ProやGPT-5.1を上回り首位を獲得したと報告されています。
- ある開発者からは「煩雑だったSaaSプロジェクトのコードを2時間足らずでクリーンなビルドに書き換えた」との声も上がっており、その実用性の高さが伺えます。
- また、UIデザインを生成するプラグインも公開され、応用範囲の広がりを見せています。
Lisan al Gaib: (翻訳) Claude 4.5 OpusはコーディングにおいてOpenAIモデルを完全に凌駕しています。作りが全く違います。 Claude 4.5 Opus - 1493 Elo、GPT-5.1 - 1395 Elo https://t.co/LFmEwZOxph
Ian Nuttall: (翻訳) 個人的な意見ですが、堅牢でしっかりしたバックエンドには依然としてcodex maxが最適なモデルです。しかし、たった今、@FactoryAIでopus 4.5を使って、ぐちゃぐちゃなReactアプリだったSaaSプロジェクト全体を、きれいなLaravelビルドに完全に書き直させたら…2時間もかかりませんでした!🤯
cat: (翻訳) 美しいグリーンフィールドアプリを作成するために、フロントエンドデザインスキルを試してみてください!claude codeを開き、次の2つのコマンドを実行してください:/plugin marketplace add anthropics/claude-code /plugin install frontend-design@claude-code-plugins あなたが何を構築するか楽...
Google TPUのコスト優位性に異論、製造委託費が論点に
- これまで報じられてきたGoogle TPUのコスト優位性に対し、Broadcomへの製造委託費用が考慮されていないとの反論が相次いでいます。
- この点を踏まえると、単純な製造コストでの比較は不正確であり、Nvidia製GPUとどちらが安価かは自明ではないという議論が活発化しています。
- NvidiaがTSMCなどから安価に部品を調達している可能性も指摘されており、AIチップのコスト構造の複雑さが改めて浮き彫りになりました。
パウロ: この図は高収益企業であるBroadcomにGoogleが支払うNREと高いマージンが入っていない、正しくない比較です Google単独ではTPUを作ることは出来ません
パウロ: 半導体の真実 競合より倍の量を買うと何割引きになるんですかね N3 die + CoWoS TSMC -> Nvidia TSMC-> Broadcom-> Google HBM3E SK Hynix -> Nvidia SK Hynix -> Broadcom Nvidia安く仕入れてるやろうなぁ
Rihard Jarc: (翻訳) $GOOGLのTPUが$NVDAに影響を与えないと言う人もいれば、影響を与えると言う人もいます。現実には、どちらの意見も正しいのです。違いはタイムラインにあります。短期的には、$NVDAの需要は現在も非常に高いため、影響はないでしょう。
Gemini 3、高評価とケアレスミスの両側面が判明【続報】
- Googleの最新モデル「Gemini 3」に関する続報です。複雑なコンパイラのバグ修正やリファクタリングといった高難易度のタスクでGPT-5 Proを凌駕する性能を持つと高く評価されています。
- 一方で、HTML生成時にscriptタグを閉じ忘れるなどのケアレスミスも報告されており、今後の改善が期待されます。
- サブスクリプションユーザーは、Gemini CLI経由で本モデルを利用可能になっています。
Kol Tregaskes: (翻訳) Victorによると、Gemini 3は最も難しい問題において、GPT-5 Pro、Gemini 2.5 Deep Think、その他すべてをはるかに上回る性能を示しています。 - 複雑なコンパイラのバグのデバッグ、論理的な間違いのないファイルのリファクタリング、難しいλ計算問題の解決、アスキーアートなどで新たな最高水準を達成しています。
ML_Bear: Gemini 3 Pro にHTML書かせてるとたまにscriptタグを閉じ忘れることがあって困ってる。なんで?お前そんなにアホちゃうやろ?って思って自分のPromptに間違いないか探したけど間違いはない。そんなに頭いいのになんでケアレスミスするんだ…🤔
Iaiso: サブスクでもGeminiCli+Gemini3使えるようになったらしい
Claude、会話が長くなると自動で文脈を圧縮する機能を追加
- Anthropicは、Claudeの会話がコンテキスト上限に近づくと、自動的に古い文脈を圧縮して会話を継続できるようになったと発表しました。
- これにより、長文の対話や複雑なタスクの途中で会話が途切れてしまうという、ユーザーが頻繁に直面していた問題が解消されます。
- このインテリジェントなコンテキスト管理機能は、ユーザー体験を大幅に向上させるものとして、多くのユーザーから歓迎されています。
Alex Albert: (翻訳) 見逃した方のために、今週初めに https://t.co/8aEVBp4ZOc で最もよくある不満の1つを修正しました。それは、会話の途中でコンテキストの上限に達してしまうことです。Claudeは上限に近づくと、自動的に以前のコンテキストをインテリジェントに圧縮し、チャットを継続できるようになりました。
OpenAI、新画像生成モデルImageGenV2の存在が浮上
- ChatGPTのWebサイト上で「ImageGenV2Banner」という隠された要素が発見され、OpenAIが新しい画像生成モデルを準備している可能性が浮上しています。
- バナーには「友達を登場させ、より速い画像生成、より一貫性のある編集」といった文言が含まれており、DALL-E 3の後継モデルの登場が期待されています。
- モバイルアプリでも画像生成時に「スタイル」を選択するUIが展開され始めており、機能強化が進んでいることが伺えます。
TestingCatalog News 🗞: (翻訳) 提案されたプロンプトとスタイルを備えた更新された画像タブが、ウェブおよびモバイルのChatGPTユーザーに展開されています。gpt-image-2はもうすぐ?👀
Kol Tregaskes: (翻訳) OpenAIからついにChatGPTにImage v2が来るのか?これは長らく待たれていた。新しい音声モデルとよく似ている。ウェブサイトで「ImageGenV2Banner」が(隠された状態で)発見された。
まつにぃ: OpenAIも画像モデル来るか。 文字とかはもうほぼいけてそうだから、スライド対決みたいな高度な戦いになりそう。 ただ期待してるのは3Dへの派生なのでそこまで行って欲しいなぁ。 宇迦を現世に顕現させたい。
【続報】中国、ByteDanceにNvidia製チップの使用禁止を指示か
- 中国のNVIDIA製AIチップ規制に関する続報です。The Informationによると、中国当局がByteDanceに対し、購入済みのNvidia製チップを新しいデータセンターで使用することを禁止したと報じられています。
- 米国からの輸出規制を懸念しNvidia製チップを大量に確保していたByteDanceにとって、大きな打撃となります。
- 背景には、中国政府による国産チップの採用を推進する動きがあると見られており、AI開発における米中間の技術覇権争いがさらに激化しています。
The Information: (翻訳) 独占記事:ByteDanceは2025年に他のどの中国企業よりも多くのNvidiaチップを購入したが、その使用を禁止されている。詳細は@QianerLiuの記事で。
Evan: (翻訳) 中国🇨🇳の規制当局が、ByteDanceが新しいデータセンターでNVIDIA $NVDA のチップを使用することをブロックしたと報じられています - The Information
The Information: (翻訳) ByteDanceは米国の供給停止を恐れてNvidiaのチップを買いだめしたが、中国の規制当局が供給不足を引き起こし、新しいデータセンターでの使用を妨げた。これは北京の国産チップ採用推進の一環である。記事を読む: https://t.co/0dhUvTpUrE
Kaggle三井物産コンペ、運要素が強く難航との声
- 現在開催中のKaggle「三井物産デジタル・アセットマネジメント株価予測」コンペについて、参加者から「運の要素が強い」との声が上がっています。
- 日次の株価予測というタスクの性質上、安定した予測モデルを構築することが非常に難しく、多くの参加者がスコアの不安定さに苦戦している模様です。
- 高頻度取引のような特殊なケースを除き、機械学習による株価予測の難しさを改めて示す結果となっています。
Senkin: Kaggleの三井コンペの一次結果を見ていると、ほとんど運ゲーに近く、日次レベルの予測はやはり難しいですね。機械学習でできるのは、結局のところ高頻度取引くらいなのかもしれません。
rt4kaido: 三井コンペ2サブともエラー吐いてて泣いちゃった evaluation APIを許せません