2025年11月10日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
次世代AI技術の展開:GoogleのNano Banana 2とAppleのSiri刷新計画
GoogleがテキストとUI生成に優れた次世代画像AI「Nano Banana 2」を一時公開し、高品質な生成能力が話題になっています。AppleはGoogleのGeminiを次期Siriに統合する計画が進行中とされ、内部では「AFM v10」と呼称されているようです。
一方、AmazonのAIチップはNvidiaH100に性能面で及ばないとの報道や、xAIの画像生成機能「Grok Imagine」の品質向上、さらにAnthropicがClaude AIに限定的な「内省能力」を発見するなど、各社の技術開発が進んでいます。
それでは、これらのトピックについて詳細に見ていきましょう。
目次
- Google、次世代画像AI「Nano Banana 2」を一時プレビュー公開
- Apple、次期SiriのAI基盤はGeminiか 提携は非公開方針
- Amazon製AIチップ、Nvidia H100に性能で劣ると報道
- Grok画像生成、品質向上で特定キャラも高精細に【続報】
- 期待の新メモリHBF、NANDの寿命や耐熱性が課題か
- Gemini API、フルマネージドRAG機能「File Search」を提供開始
- MCP採用拡大: xAIもAPIでサポート開始
- Anthropic、Claudeに限定的な内省能力を発見
Google、次世代画像AI「Nano Banana 2」を一時プレビュー公開
- 以前話題となった画像生成AI「Nano Banana」の次世代版、「Nano Banana 2」が一時的にプレビュー公開され、その品質の高さが注目を集めています。
- テキストやUIを含む複雑な画像を正確に生成する能力が確認されましたが、現在は利用できなくなっています。
- このモデルは「Gemini 2.5 Flash」を基盤技術としている可能性も示唆されています。
Chubby♨️: (翻訳) Nano banana 2はすでにプレビュー版が公開されています! Nano banana 1が予想外の大成功を収めたので、本当に楽しみです。 https://t.co/pb3aVjLziE
TestingCatalog News 🗞: (翻訳) Media AI経由のNano Banana 2:「たくさんのモニターの前で作業するサイバーパンクハッカーロボット」のサンプル。 https://t.co/o1nFaaDks4
ʟᴇɢɪᴛ: (翻訳) Nano Banana 2は削除されました。現在は利用できません。また近いうちにお会いしましょう。https://t.co/J8k3vlruTG
Apple、次期SiriのAI基盤はGeminiか 提携は非公開方針
- Appleの次期Siriに関するAI戦略の続報です。
- GoogleのGeminiモデルを統合する計画で、社内では「AFM v10」と呼称されていると報じられました。
- Googleとの提携は公にはしない方針とされています。
- また、iPhoneの衛星通信機能も大幅にアップデートされ、サードパーティアプリ向けAPIの提供も計画されているとのことです。
Mark Gurman: (翻訳) AppleはGeminiとの提携や、Siriが部分的にライバルの技術に依存するという事実を公表するつもりはない。社内では、Google製のモデルをAFM v10と呼んでいる。これはApple Foundation Modelsの第10版の略である。https://t.co/dg3QLPMwB4
Mark Gurman: (翻訳) Power On: AppleはiPhoneの衛星機能を大幅にアップデートする計画です。今後の予定と、業界の変化がAppleの取り組みにどのような影響を与えるかをご紹介します。https://t.co/eKTULTsCuo
Mark Gurman: (翻訳) Appleは、衛星接続、写真メッセージング、マップを含むより多くのアプリでのサポート、および常に空に向ける必要なくポケット/屋内/車内での使用をサポートするためのサードパーティアプリAPIを計画しています。詳細はコラムで https://t.co/dg3QLPMwB4
Amazon製AIチップ、Nvidia H100に性能で劣ると報道
- AmazonのAI学習用チップ「Trainium 1」および「Trainium 2」が、NvidiaのH100 GPUを下回る性能であったとする内部文書が報じられています。
- AIスタートアップのCohereやStability AIも同様の懸念を抱いていたとされ、カスタムAIチップ開発の難しさが浮き彫りになっています。
- 柔軟なソフトウェアやコンパイラの構築が重要であり、GoogleがTPUで先行しているとの見方もあります。
パウロ: やっぱりね AI ASICでまともなのはTPUだけ AmazonのTrainium 1および2チップがNvidiaのH100 GPUを「下回る」性能だったと判明した。」 「AI画像生成で知られるスタートアップStability AIも同様の懸念を抱いていた。同社は、AmazonのTrainium 2チップがレイテンシでNvidiaのH100
パウロ: 何回も言っているけど、AI ASICのほとんどは行列演算機とベクトル演算機のハードウェアアクセラレーター カチコチなため、柔軟性を実現するソフトウェア、コンパイラ(ハードウェアレベルでの言語への翻訳機)が重要 それらを構築するのは簡単ではない Googleで10年かかった
Rihard Jarc: (翻訳) 今後3~10年間のクラウドプロバイダーの競争優位性にとって最も重要なことは、カスタムチップの提供です。 現在、$GOOGLがTPUでトップに立ち、$AMZNがTrainiumでそれに続いています。 その重要性から、
Grok画像生成、品質向上で特定キャラも高精細に【続報】
- xAIの画像生成機能「Grok Imagine」に関する続報です。
- 品質が大幅に向上し、特定のキャラクター(Ani)やGrokのロゴなどを高精細に生成できるようになったと報告されています。
- ユーザーからは、数ヶ月前と比較して劇的に改善されたとの声が上がっており、その表現力の高さが注目されています。
Tech Dev Notes: (翻訳) Grok ImagineにAniのデータが追加されました。「Ani Grok Companion」とプロンプトを入力すると、画像が生成されます。https://t.co/o2A9V7yyDw
Tech Dev Notes: (翻訳) Grok Imagineの世代は美しい https://t.co/Hog3A5vtVQ
Kol Tregaskes: (翻訳) Grok Imagineは劇的に改善されたようです。
期待の新メモリHBF、NANDの寿命や耐熱性が課題か
- AIの「メモリの壁」を解決する新技術として期待されるHBF(High Bandwidth Flash)に関する続報です。
- NANDフラッシュはDRAMに比べ書き込み寿命が短く、動作温度も低いため、高温になるGPUへの搭載には課題があるとの指摘が上がっています。
- 特に、GPUでは頻繁なデータ書き換えが発生するため、NANDの耐久性がボトルネックになる可能性が懸念されています。
パウロ: HBFの課題 NANDフラッシュには寿命がある 壊れるとGPUごと交換しなければならない GPUは非常に高価だ
パウロ: 続き DRAMの動作温度は125℃ NANDフラッシュは80-85℃ GPUは熱い これは問題
Jukan: (翻訳) HBFについてどう思うか尋ねられたので、考えをまとめて共有します。 私の見解では、HBFはHBMを置き換えるものではありません。むしろ、HBMの容量制限を相殺する補助的なメモリ階層として補完的な関係を形成します。 まず、NANDは構造的に困難です https://t.co/NDj2XksRuI
Gemini API、フルマネージドRAG機能「File Search」を提供開始
- Googleは、Gemini APIにフルマネージドなRAGシステムを容易に構築できる新機能「File Search」を追加しました。
- PDFやWord、Excelなどのファイルをアップロードし、その内容を知識ベースとして回答を生成できます。
- 本機能は既報の「Vertex AI Agent Builder」のアップデートの一環で、AIエージェント開発のさらなる効率化が期待されます。
Publickey: ブログ書きました: GeminiにPDFやWord、Excel、テキストファイルなどの検索機能を組み込める「File Search in Gemini API」提供開始、フルマネージドなRAGシステムを提供 https://t.co/g6ml6vRQvM
Google Cloud: (翻訳) Vertex AI Agent Builderの新機能: - ADKでのSOTAコンテキスト管理とシングルコマンドデプロイ - Agent Engineの新しい統合トレースインターフェースによる可観測性+評価機能 - セキュリティ機能とネイティブエージェントID 詳細はこちら↓ https://t.co/C7caDL4jgp
Google Cloud Tech: (翻訳) このコースを受講して、これらのスキルを習得しましょう。BigQueryでGeminiを使用してSQLを生成およびデバッグし、感情分析を実施し、テキストを要約してキーワードを特定し、埋め込みを生成し、RAGパイプラインを作成し、マルチモーダルベクトル検索を実装する方法を学びます→ https://t.co/Rg2lz8saEr https://t.co/ELbjt5IbYt
MCP採用拡大: xAIもAPIでサポート開始
- AIエージェントの連携プロトコル「MCP」の採用がさらに拡大し、xAIのAPIもサポートを開始しました。
- OpenAIやMistral AIに続く動きとなり、主要なAIモデルでのMCP利用が現実的になってきました。
- MCPはツール連携時のコンテキスト管理を効率化する仕組みで、より高度なAIエージェント開発への貢献が期待されます。
Tech Dev Notes: (翻訳) xAI APIがMCPをサポートしました https://t.co/kNMEmu5Rp4
azukiazusa: MCP ツールのコンテキスト圧迫の問題とその解決策 https://t.co/HnDHCSPWY6
まつにぃ: ぶっちゃけローカルで使ってるIDEエージェントがPythonなりGitHub Action、MCP、CLIなりでほぼ全てのサービスを横断して繋ぐ万能君なので、IDEとCLIエージェント以外はほぼ使わなくなってるんですよね。 なのでサービスとまではいけなくてもリポジトリはちょいちょい公開出来たらなとおもてます。
Anthropic、Claudeに限定的な内省能力を発見
- Anthropicの研究で、Claudeモデルが限定的な内省能力を持つ可能性が示されました。
- 研究では、モデルの神経活性化パターンを操作し、モデル自身がその変化を検知・報告できるかをテストしました。
- この結果は、LLMが単にそれらしい回答を生成するだけでなく、自身の内部状態を認識している可能性を示唆し、AIの意識に関する議論を呼びそうです。
Kol Tregaskes: (翻訳) Anthropicは、概念注入を用いたクロードモデルにおいて、限定的な内省能力の証拠を発見しました。 - 研究者らは、概念の神経活性化パターンをモデルに注入し、それらを正確に検出して報告できるかどうかをテストします。 - Claude Opus 4と4.1が最高のパフォーマンスを発揮します。https://t.co/HIbbTbMFye
Kol Tregaskes: (翻訳) 大規模言語モデルは、自己言及的な処理の下で、多くの理論における意識の中核的な側面である主観的な経験の構造化された一人称報告を生成します。 - 自己言及的なプロンプトは、モデルに自分自身の集中プロセスに集中するように指示しますが、https://t.co/Zfz0IiW2QJ
The New York Times: (翻訳) @nytopinionより 「AIは、デジタル写真が写真の一形態であるのと同様に、知性の一形態に他ならない」と哲学者のバーバラ・ゲイル・モンテロは書いています。「そして今、AIはさらに注目すべきこと、つまり意識を持つようになろうとしています。」 https://t.co/XS73UY5pQs