2025年11月21日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Googleの画像AI「Nano Banana Pro」が資料作成で高評価、Gemini 3 Proは医療診断で研修医超え

Googleの最新画像生成AI「Nano Banana Pro」が、インフォグラフィックやスライド資料の作成能力で絶賛を集めています。正確なテキスト描画と複雑なレイアウトの再現が高く評価され、NotebookLMとの連携により資料作成の自動化も進んでいます。

また、Gemini 3 Proが医療画像診断で放射線科研修医を上回る性能を示し、専門分野でのAI活用に新たな可能性を示しました。

それでは、各ニュースの詳細をご覧ください。

目次

  1. Google画像AI「Nano Banana Pro」の資料作成能力に絶賛集まる
  2. Gemini 3 Pro、放射線科医研修医を超える性能を発揮
  3. NotebookLMとNano Banana Proでスライド作成が自動化
  4. OpenAI、FoxconnとAIハードを共同開発か
  5. 実世界のコーディング能力を測る「cline-bench」登場
  6. xAIの動画生成、最大15秒に対応する見込み
  7. Kaggle数学コンペAIMO 3、関連イベントも活発化【続報】
  8. GeminiアプリでAI生成画像の判定が可能に
  9. 【続報】国産LLM「PLaMo 3」、コーディング性能で高評価

Google画像AI「Nano Banana Pro」の資料作成能力に絶賛集まる

  • 先日リリースされたGoogleの最新画像生成AI「Nano Banana Pro」の続報です。
  • 特にインフォグラフィックやスライド資料の作成能力が高く評価されており、多くのクリエイターから絶賛の声が上がっています。
  • プロンプト通りのテキストや複雑なレイアウトを正確に描画できる点が注目されています。
  • 思考を重ねるThinkingモードで利用でき、日本語のテキスト描写や文化理解、細部の表現力が大幅に向上したと報告されています。
松本 勇気 (Yuki Matsumoto) | LayerX CTO: 今リサーチ系はほとんど自動化していて、コマンド一つで100ページくらいのレポートを作れるようになったのだけど、そこから1枚のスライドにまとめるとかの精度が上がった。 試しにnoteの第一章を要約したものからNano banana Proでスライドにしてみたけど良い…… https://t.co/1BtyzdPHpG

Oikon: Nano Banana Pro、素材さえ与えればこういうサムネとか超簡単に作れる良いね。 文字の色や細かい修正指定が通るようになったのがとても便利。 https://t.co/ruGXK38ght

シェイン・グウ: 思考型言語モデルと画像生成モデルの緊密な融合は、まさに無限の可能性を秘めています。もちろん、この流れは音声生成や動画生成にも及びます。すべてが「オムニ(Omni)モデル」へと統合されていく中で、基盤モデルの革新とその重ね合わせが、ますます重要になっていくのです。

Gemini 3 Pro、放射線科医研修医を超える性能を発揮

  • Googleの最新モデル「Gemini 3.0 Pro」が、医療画像診断のベンチマーク「RadLE」において、放射線科の研修医を上回る性能を示したことが報告され、話題となっています。
  • この結果は、AIが専門的な視覚的推論タスクで人間を超える能力を持つことを示す画期的な事例として注目されています。
  • これまでも様々なベンチマークで高性能を示してきたGeminiですが、専門分野での実用的な能力を証明したことで、その評価がさらに高まっています。
Chubby♨️: (翻訳) このベンチマークは、他のほとんどのベンチマークよりも私にとって興味深いものです。なぜなら、このベンチマークは現実世界のユースケース、つまり真のメリットを示しているからです。Gemini 3.0は現在、放射線科の研修医を上回っています。これは驚異的です。

Lisan al Gaib: (翻訳) Gemini 3 Proが放射線科の研修医に勝利

NotebookLMとNano Banana Proでスライド作成が自動化

  • Googleの「NotebookLM」にドキュメントを読み込ませ、その内容を要約したスライドを「Nano Banana Pro」で生成する活用法が注目されています。
  • インフォグラフィック形式での出力も可能で、これまで手作業で行っていた情報整理やビジュアル化を大幅に効率化できると期待されています。
  • この連携により、専門知識がないユーザーでも、質の高いプレゼンテーション資料を短時間で作成できる可能性が示されています。
まつにぃ: まあ当然できるようになりますよね。 NotebookLM × Nanobanana Proでインフォグラフィックなスライド作成が可能に。 Gemini3とNanobanana Proで多くのことができるようになり、可能性が広がります。 2025年末、堪らない進化だ。

Kazunori Sato: 今週末のDevFestに向けてスライド作んなきゃ...と思ってたけど、試しに俺が書いたドキュメントをNotebookLMに読ませてスライド作成してみたら、もうこれでいいじゃんってなってる。 https://t.co/7PqcWA6ZVq

NotebookLM: (翻訳) 高密度で複雑な資料を解析するためのスライドデッキ作成という中核的な用途を超えて、私たちが本当に気に入っているのは、出力がいかに面白いかを探求することです。学習は…楽しいものになり得ることがわかりました。例えば、14ページの長除法の例が、壮大な割り算の探求に変わることがあります。

OpenAI、FoxconnとAIハードを共同開発か

  • AIの計算需要に対応するため、OpenAIがインフラ投資を加速させている動きの続報です。
  • 新たに、データセンター向けハードウェアの設計・製造でFoxconnと提携する計画だと報じられました。
  • AIモデルの開発競争が、それを支えるインフラ層にも拡大していることを示す動きとして注目されます。
Bloomberg: (翻訳) OpenAIは、AIシステムをサポートするためのインフラ需要の急増に対応するため、ChatGPTメーカーによる最新の動きとして、データセンター向けのハードウェアを設計・製造するためにFoxconnと提携しています。

実世界のコーディング能力を測る「cline-bench」登場

  • AIエージェントによるコーディング能力を、より実践的なタスクで評価するための新しいオープンソースベンチマーク「cline-bench」が発表されました。
  • このベンチマークは、フロンティアモデルが失敗し、人間の介入が必要となった現実世界のエンジニアリングタスクから構築されています。
  • 既存のベンチマークでは測れない、複雑なリポジトリでの現実的な開発タスクを評価できるとして、開発者から期待が寄せられています。
Cline: (翻訳) 本日、私たちはコミュニティと共に構築している、現実世界の代理コーディングタスクのオープンソースベンチマークであるcline-benchを発表します。cline-benchは、オープンソースリポジトリの困難なClineタスクを、実際のリポジトリスナップショット、実際の

Saoud Rizwan: (翻訳) コーディングエージェントは、大規模で雑然としたリポジトリでの複雑な作業に苦労しており、実際のエンジニアリングとは似ても似つかないテストで飽和したベンチマークの使用をやめない限り、この状況は改善されません。だからこそ、私たちは現実世界のコーディングタスクのためのオープンベンチマークであるcline-benchに100万ドルを投じます!

xAIの動画生成、最大15秒に対応する見込み

  • xAIの画像・動画生成機能「Grok Imagine」に関する続報です。
  • テキストから最大15秒の動画を生成できるようになる見込みであることが報告されました。
  • この機能強化により、より長尺でクリエイティブな動画表現が期待されます。
Tech Dev Notes: (翻訳) 15秒のGrok Imagine動画が間もなく登場します

Kol Tregaskes: (翻訳) Grok Imagineに最大15秒の動画が登場!

Kaggle数学コンペAIMO 3、関連イベントも活発化【続報】

  • 先日開始をお伝えした賞金総額200万ドル以上の数学コンペ「AIMO 3」の続報です。
  • 本コンペではH100 GPUに加え、申請が通れば128台のH100クラスタも使用可能であることが明らかになりました。
  • 関連して、AIMO2の解法を振り返り次回のコンペに備えるミートアップが告知されるなど、コミュニティの活動も活発化しています。
カレーちゃん: Kaggleの新コンペ: AI Mathematical Olympiad - Progress Prize 3 AIモデルを用いて国際レベルの数学的課題を解く ・4月15日まで ・コードコンペ (H100が使える) ・申請して通れば、128台のH100GPUクラスタを使えるらしい https://t.co/eZcppvdEwT

Rabotni(kuma|熊): KaggleでAIMO3がついに始まりました。こちらのW&Bミートアップにて数学x強化学習のトピックで登壇します。一緒にAIMO2の復習をして、AIMO3に備えましょう!(謎の予備校感) https://t.co/1xmY7bYSup

Ino.Ichi: AIMO3きた👀終了は4/15までとかなり先だけど、2/9までの中間地点でいろんなプライズある🤑とはいえ上位目指すためにもかなりGPUいるよな…💸💸💸 https://t.co/1ztyL3Xow7

GeminiアプリでAI生成画像の判定が可能に

  • Google DeepMindは、GeminiアプリにAIが生成した画像かどうかを判定する機能を追加したと発表しました。
  • 画像をアップロードすると、電子透かし技術「SynthID」の有無をチェックし、GoogleのAIツールで生成・編集されたものかを確認できます。
  • ただし、Midjourneyなど他のジェネレーターで作成されたAI画像は、SynthIDの透かしがないため検出できないとの報告もあります。
Google DeepMind: (翻訳) 本日より、@GeminiApp に「この画像は AI で作られていますか?」と質問できるようになりました。💬 写真をアップロードすると、SynthID ウォーターマークがチェックされ、Google AI ツールで生成または編集されたものかどうかを確認できます。 詳細はこちら → https://t.co/z5Sh3dHcdw

Kol Tregaskes: (翻訳) 少し当たり前のことですが、Nano Banana ProはMidjourneyなどの他のジェネレーターからのAI生成画像を検出できません。これを行うには、Google SynthIDのウォーターマーキングが必要です。

【続報】国産LLM「PLaMo 3」、コーディング性能で高評価

  • 以前、開発の裏側をお伝えした純国産LLM「PLaMo 3」の続報です。同モデルがLLMベンチマーク「Swallow LLM Leaderboard v2」に追加されました。
  • 前バージョンと比較して、特にコーディング能力(JHumanEval)で大幅な性能向上が確認されています。
  • 3Tトークンで学習された31Bモデルは、純国産モデルとして良好な性能と評価されており、今後の発展が期待されます。
Naoaki Okazaki: Swallow LLM Leaderboard v2にPLaMo 3 NICTシリーズ(事前学習済みモデル)を追加しました。前バージョンのPLaMo 2と比較すると、特にコーディング (JHumanEval) で大幅な性能向上が見られ、3Tトークンで学習された31Bモデルは純国産モデルとして良好な性能と言えます。 https://t.co/TWgbJVrOh0

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください