2025年12月17日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAI新画像生成モデル発表、Google Gemini 3 Flash期待高まる

本日はOpenAIの新画像生成モデル「ChatGPT Images」の発表が大きな注目を集めています。従来比4倍の高速化を実現し、全ユーザーに展開されます。

一方、GoogleはGemini 3 Flashのリリースを示唆し、開発者コミュニティでは今週中の発表に期待が集まっています。また、XiaomiがオープンソースのMoEモデルを公開するなど、大手企業の動きが活発です。

では、本日の各トピックを詳しくお届けします。

目次

  1. OpenAI、新画像生成モデル「ChatGPT Images」を発表
  2. Google、Gemini 3 Flashのリリースを示唆 期待再燃
  3. Xiaomi、オープンソースのMoEモデル「MiMo-V2-Flash」を公開
  4. OpenAI、科学ベンチマーク「FrontierScience」公開
  5. Databricks、評価額1340億ドルで40億ドル超を調達【続報】
  6. Meta、音源分離モデル「SAM Audio」を発表
  7. Gemini 2.5 Flash音声モデル更新、指示追従性向上【続報】
  8. Google、Gmail向けAIアシスタント「CC」のテストを開始
  9. AI向け半導体のDRAM不足、2026年以降も続く見通し【続報】
  10. 新Kaggleコンペ「Deep Past Challenge」が開始

OpenAI、新画像生成モデル「ChatGPT Images」を発表

  • OpenAIが新しい画像生成モデル「GPT Image 1.5」を搭載した「ChatGPT Images」を発表しました。
  • 指示追従性の向上、精密な編集、詳細の維持、そして従来比4倍の高速化が特徴とされています。
  • ChatGPTの全ユーザーに展開され、APIとしても利用可能になりますが、一部では品質がNano Banana Proに及ばないとの声も上がっています。
Kevin Weil 🇺🇸: (翻訳) 💥 新しいChatGPTの画像生成機能が登場しました! さらに、ChatGPTアプリにはとても楽しい画像セクションもあります。組み込みのプロンプトで素晴らしい画像を簡単に生成できます。 試してみて、作成したものを以下で共有してください! https://t.co/o9ha2IVC0w

Haider.: (翻訳) openAIがgpt-image-1.5をリリースし、すでにリーダーボードのトップに立っています lmarena: テキストから画像への変換で1位 — 1277(gemini 3 pro image / nano banana pro: 1235) 何が優れているか: - dall-e 3 / gpt-image-1より4倍高速 - 「追加/削除/結合」によるクリーンな編集

Greg Brockman: (翻訳) ChatGPT Images、画像生成のための新しいモデルと製品体験: https://t.co/Ox9zCreQNJ

Google、Gemini 3 Flashのリリースを示唆 期待再燃

  • GoogleがGemini 3 Flashのリリースを示唆する投稿を行い、開発者の間で再び期待が高まっています。
  • 多くのユーザーが今週中の発表を予測しており、現在高コストなProモデルを利用する開発者からは、より安価なFlashモデルへの切り替えを望む声が上がっています。
Haider.: (翻訳) gemini 3 flashは今週基本的に確定のようです googleは通常水曜日にこれらの発表を行いますが、正直なところ今日にも発表される可能性があります いずれにせよ、過去6ヶ月間の彼らの出荷ペースは驚異的です

Chubby♨️: (翻訳) Flash確定

ML_Bear: いまGemini 3 Proのthinking_level=lowでやってるタスクが結構あって、まぁまぁ費用かかってるのでGemini 3 Flashがきたらそいつらを切り替えて試したい。早めに頼むぅ〜🙏

Xiaomi、オープンソースのMoEモデル「MiMo-V2-Flash」を公開

  • 中国のテクノロジー企業Xiaomiが、新たなオープンソースのMoE(Mixture of Experts)モデル「MiMo-V2-Flash」をリリースしました。
  • 総パラメータ数309B、アクティブパラメータ数15Bという大規模なモデルで、その性能に多くの開発者が注目しています。
  • 大手テック企業によるオープンソースモデルのリリースが続いています。
パウロ: Wow, Xiomi developed own LLM!

Chubby♨️: (翻訳) Xiaomiでさえ、独自のオープンソースモデルをリリースしています。 309b、15bアクティブで、全体的に悪くありません https://t.co/vcmnOekR0Q

Lisan al Gaib: (翻訳) Xiaomiによる309B@15Bモデル https://t.co/SCwEIbL2oa

OpenAI、科学ベンチマーク「FrontierScience」公開

  • OpenAIは、博士レベルの科学的推論能力を測定するための新しいベンチマーク「FrontierScience」をリリースしました。
  • 物理学、化学、生物学などの分野における難解な問題を含んでおり、GPT-5.2がこのベンチマークで高い性能を示したことも報告されています。
  • AIによる科学の加速が期待されます。
Greg Brockman: (翻訳) 2026年はAIによる科学加速の年になるでしょう。AIの専門家レベルの科学的推論能力を測定するためのベンチマークをリリースしました:

Kevin Weil 🇺🇸: (翻訳) 科学 🤝 GPT-5。 私たちの新しいFrontierScienceベンチマークは、難しい化学、生物学、物理学などにおけるAIモデルのパフォーマンスを測定する貴重な方法となります。 さらに、ウェットラボ環境で動作するGPT-5は、分子クローニングプロトコルの効率を高める実験を提案しました。

Chubby♨️: (翻訳) エキサイティングなベンチマークであり、私が頻繁に読む内容と一致しています。特にChatGPT-5.2 Proは優れたモデルであり、とりわけ、すでに新しい科学的仮説を立て、解決策を見つけるのに役立っています。 最も困難な分野において、ChatGPTは https://t.co/9PWoaCruqI

Databricks、評価額1340億ドルで40億ドル超を調達【続報】

  • 先日お伝えしたDatabricksの資金調達交渉に関する続報です。
  • 同社は評価額1340億ドルで、40億ドル以上の資金調達を完了したと報じられました。
  • AI市場の期待を背景に、企業価値がさらに高まった形です。
Bloomberg: (翻訳) ウォールストリートジャーナルが同社CEOへのインタビューを引用して報じたところによると、Databricksは新たな資金調達ラウンドで40億ドル以上を調達し、この非公開ソフトウェア会社の評価額は1340億ドルになるという。https://t.co/F9xcxdFv9d

Evan: (翻訳) DATABRICKSが1340億ドルの評価額で40億ドル以上の資金を調達 - WSJ https://t.co/wZg2MuzWbh

TechCrunch: (翻訳) Databricks、AIビジネスの活況に伴い1340億ドルの評価額で40億ドルを調達 https://t.co/hggpwtXNbk

Meta、音源分離モデル「SAM Audio」を発表

  • Metaが、テキストや視覚的なプロンプトを用いて、複雑な音声の中から特定の音を分離できる統一モデル「SAM Audio」を発表しました。
  • このモデルはコミュニティに公開され、関連する研究論文やベンチマークと共に、音声認識・編集分野での新たな応用が期待されています。
Evan: (翻訳) マーク・ザッカーバーグとMeta AI $METAが本日これを投稿しました 「SAM Audioの紹介。テキスト、ビジュアル、またはスパンプロンプトを使用して、複雑な音声混合物からあらゆる音を分離する初の統一モデルです。」 https://t.co/Ot2nnDfSBq

パウロ: おおっ Metaから音楽生成AI SAM Audioがっ これは良いのでは インスタに統合できるね

Gemini 2.5 Flash音声モデル更新、指示追従性向上【続報】

  • Googleのライブ音声エージェント向けモデル「Gemini 2.5 Flash Native Audio」の続報です。
  • 今回の更新により、指示追従性が向上し、より自然な会話が可能になったとされています。
  • 音声AIアシスタントの品質向上に繋がるアップデートとなります。
Google DeepMind: (翻訳) ライブ音声エージェント向けの更新されたGemini 2.5 Flash Native Audioモデルをリリースしました。💬 指示に従い、より自然な会話を保持する能力がさらに向上しました。詳細はこちら→ https://t.co/IbL9fyVxKT https://t.co/JFQRxqDSme

Google、Gmail向けAIアシスタント「CC」のテストを開始

  • Google Labsが、Gmail内で動作する実験的なAI生産性エージェント「CC」を発表しました。
  • 毎朝「Your Day Ahead」として一日の概要をメールで受け取ったり、いつでもCCにメールでタスクを依頼したりできる機能です。
  • 米国とカナダで早期アクセスの登録が開始されています。
Google Labs: (翻訳) 🚨 新しいLabsの実験 🚨 Gmailの実験的なAI生産性エージェント、CCを紹介します。毎朝受信トレイで「Your Day Ahead」ブリーフィングを受け取り、いつでもCCにメールで助けを求めることができます。 米国とカナダで早期アクセスにサインアップしてください。Google AI Ultraと有料プランから開始します。https://t.co/xN3IjlBGaK

TechCrunch: (翻訳) Google、メールベースの生産性アシスタントをテスト https://t.co/oGxm211low

AI向け半導体のDRAM不足、2026年以降も続く見通し【続報】

  • AI向け半導体のHBM(広帯域メモリ)への生産集中による、汎用DRAMの供給不足に関する続報です。
  • DRAMのスポット価格は高騰を続けており、この供給不足は2026年以降も続くとの新たな見方が示されました。
パウロ: DRAM枯渇を今だけ、2026年後半になったら収まると言っている人たちはベースの生産量、HBMの生産量を認識していない。2026年、増産はしますよ。ただしHBMだけね。 ウヒョヒョヒョヒョ。

パウロ: ひどいスポット価格プレミアム 史上最大のプレミアムと史上最低の各所の在庫水準 そして2027年後半はRubin Ultra HBM4E 3倍以上の容量

パウロ: Samsung DDR5契約価格を100%引き上げと報じられる うひゃー

新Kaggleコンペ「Deep Past Challenge」が開始

  • 新たなKaggleコンペティション「Deep Past Challenge - Translate Akkadian to English」が開始されました。
  • 古代メソポタミアで使われていたアッカド語を英語に翻訳するという、自然言語処理がテーマのコンペティションです。
Kagoole: (翻訳) 新しい#kaggleコンペティション「Deep Past Challenge - アッカド語を英語に翻訳」が開始されました。 メダル:あり カーネルのみ:あり 締め切り:2026-03-23 23:59:00+00:00 https://t.co/mzpP3LgJZS

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください