2025年05月17日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAIの新コーディングAgent「Codex」登場とAI業界の最新動向

AI開発ツールの進化が加速しています。OpenAIの新クラウドベースコーディングAgent「Codex」が登場し、開発者の生産性向上に期待が集まっています。xAIのGrokはアスペクト比指定付き画像生成や動画生成機能の開発を進め、GoogleもAI Studioに最新のImagen 3を搭載しました。

裏側では、AIインフラ投資が活発化し、OpenAIのPC操作自動化AI「CUA」開発の噂やAnthropicの25億ドル信用枠確保など、業界の勢いが止まりません。

では、各トピックの詳細を見ていきましょう。

目次

  1. OpenAI、新AIコーディングAgent「Codex」発表 CLIも更新
  2. Grok、画像生成でアスペクト比指定対応 動画生成も開発中
  3. Google、AI StudioにImagen 3搭載 Gemini活用事例も拡大
  4. Broadcom、MSのAI ASIC参画噂 NVIDIAはCoreWeave出資
  5. OpenAI、PC操作自動化AI「CUA」開発の噂 AIエージェント新展開か
  6. LLM学術研究: 脆弱性対策、意思決定向上など多数発表
  7. MS、Python開発者3名解雇 TypeScriptへの影響も【続報】
  8. Anthropic、25億ドル信用枠確保 文脈適応AIもアピール
  9. AI社会実装の進展と課題: 広告、教育、開発現場での変化
  10. AI動向:人型ロボット、動画生成、Llama4開発陣退職噂、Grok

OpenAI、新AIコーディングAgent「Codex」発表 CLIも更新

  • OpenAIが新たなクラウドベースのAIコーディングエージェント「Codex」を発表しました。
  • この「Codex」はChatGPT o3の派生モデル「codex-1」を搭載し、複数タスクの並列処理やGitHub連携によるプルリクエスト作成・テスト実行が可能です。
  • ChatGPTのPro、Enterprise、Teamユーザー向けに提供が開始されています。
  • あわせて、既存のOSSローカルコーディングエージェント「Codex CLI」もアップデートされ、新たに「codex-mini」モデルが追加されました。【Codex CLI続報】
  • これらの発表は開発者の生産性向上に貢献すると期待されていますが、その実用性については様々な意見も出ています。
Chubby♨️: (翻訳) OpenAIのSWE-Agentが、また「Operator」の二の舞にならないことを願います。クールなプレビューでしたが、実用的ではありませんでした。

Chubby♨️: (翻訳) 「Codex」- OpenAIのコーディングエージェントが確認されました https://t.co/pJWWByTc8b

OpenAI Developers: (翻訳) CodexチームとのAMA。午前11時(PT)。 https://t.co/crIah67MWL

Grok、画像生成でアスペクト比指定対応 動画生成も開発中

  • xAIのチャットボット「Grok」の機能強化に関する続報です。
  • 新たにアスペクト比を指定した画像生成に対応しました。
  • 音声モードのUIも改善されました。
  • 既報のGrok 3.5に加え、動画生成機能の開発も進行中です。
  • xAIはタスク管理機能など複数の新機能にも取り組んでいる模様です。
Yuta Kashino: GitHub - xai-org/grok-prompts: Prompts for our Grok chat assistant and @grok bot on X. https://t.co/ctdCdcZfNR おお、Grokの南アの白人絶滅発言を受けてxAIがシステムプロンプトを公開しましたね…

TestingCatalog News 🗞: (翻訳) 近日公開予定のGrok音声モードUIにテキスト入力が復活し、選択したパーソナリティラベルも表示されるようになりました。 https://t.co/D1Q8N3eFOv

Tech Dev Notes: (翻訳) Grokが様々な比率で画像を描けるようになりました! https://t.co/hZOVlvOmkg

Google、AI StudioにImagen 3搭載 Gemini活用事例も拡大

  • Google AI Studioに最新の画像生成モデルImagen 3が搭載され、「Generate Media」セクションから利用可能になりました
  • ファミリーマートがVertex AI SearchやGoogle Kubernetes Engine (GKE)を活用し、顧客体験向上を図る事例が紹介されました
  • YouTubeではGeminiを利用し、動画の感情的なピーク直後に関連性の高い広告を挿入する新機能が導入されました
  • 【続報】米国大学生向けのGemini Advanced無料提供期間が2026年の期末までに更新されました
TestingCatalog News 🗞: (翻訳) ImagenがAI Studioに新しい「Generate Media」セクションと共に追加されています。現在、そこではImagen 3モデルが利用可能ですが、これは何か大きなことへの準備のように思えます。Google I/Oの直後にAI StudioでImagen 4とVeo 3が利用可能になったら、すごいことになるでしょう! https://t.co/jcmnvdk5sY

Google Cloud: (翻訳) コンビニエンスストアのショッピング体験がアップグレードしました!BigQuery、Vertex AI Search、GKEのおかげで、ファミリーマートはパーソナライズされたおすすめ商品やリアルタイムの洞察により、顧客体験を向上させています。 https://t.co/VvYwdJJwjt

Google Gemini App: (翻訳) 噂では?米国の大学生は2026年の期末までGemini Advancedを無料で利用できます。こちらから申請してください:https://t.co/LVVB6PeG5w 規約が適用されます

Broadcom、MSのAI ASIC参画噂 NVIDIAはCoreWeave出資

  • BroadcomがMicrosoftの次世代AI ASIC「MAIA2」プロジェクトにMarvellと共に参画するとの噂が浮上し、動向が注目されています。
  • NVIDIAによるクラウドプロバイダーCoreWeaveへの出資が明らかになり、CoreWeaveの株価急騰やNVIDIA株の回復が見られます。
  • また、米国とUAE間の大規模AIデータセンター建設計画やTSMCの生産能力増強も報じられ、AIインフラ投資が世界的に活発化しています。
パウロ: 噂 Broadcom MicrosoftのAI ASIC プロジェクトMAIA2に参入、Marvellと競争へ 普通に考えてBroadcomが勝つ AI ASIC 総取りへ

Bloomberg: (翻訳) CoreWeaveは金曜日、Nvidia Corp.がクラウドコンピューティングプロバイダーへの予想を上回る出資比率を報告した後、最大26%急騰し過去最高値を記録しました。 https://t.co/PPZpDwCfnR

Sam Altman: (翻訳) これは皆さんが行った非常に賢明なことであり、世間知らずな人々が皆さんに苦言を呈していることを残念に思います。

OpenAI、PC操作自動化AI「CUA」開発の噂 AIエージェント新展開か

  • OpenAIがPC操作を自動化する「Computer Use Agent (CUA)」を開発中との噂が浮上しています。これが実現すれば、AIエージェントによるタスク自動化が新たな段階に入る可能性があります。
  • 自律的にタスクを実行するAIエージェントへの期待は世界的に高まっており、2025年は「エージェントの年」になるとの予測も出ています。
  • 常時稼働するバックグラウンドコーディングツールなど、具体的な応用例も議論されており、今後のAIエージェント技術の進化から目が離せません。
The Information: (翻訳) 「常時オン」のバックグラウンドコーディングツールの出現は、エンジニアがジュニアエンジニアに委任するのと同様に、より多くのタスクをAIにオフロードするようになる未来を示しています。詳細はこちら:https://t.co/sVuASgg1L4 #FutureOfCoding

Chubby♨️: (翻訳) 2025年はエージェントの年になるでしょう。もう明らかになっているはずです。

Harrison Chase: (翻訳) 私たちの最近の会議で議論された多くの重要なポイントの素晴らしい要約です!

LLM学術研究: 脆弱性対策、意思決定向上など多数発表

  • LLMの能力向上や課題解決に向けた学術的な研究が多数発表されています。
  • LLMの安全ガードレールを悪用する攻撃手法「MutedRAG」や、差分プライバシーを考慮した事前学習アルゴリズム「NoisyHead」などが報告されました。
  • また、LLMに自己の問題解決戦略を監視・評価・適応させるメタ認知能力を持たせる「Metacognitive AI」の提案や、LLMの内部動作解明を目指す「Information Gravity」といった概念も登場しています。
  • その他、大規模言語モデルの知識を効率的に注入する「SDFT」、LLMによる判断の質を向上させる「Meta-judgeシステム」、外部知識を最新に保つ「LLM-ENHANCER」など、多岐にわたる研究成果が共有されています。
Rohan Paul: (翻訳) この論文は、知識ベースに最小限のジェイルブレイクテキストを注入することでLLMの安全ガードレールを悪用し、効率的にサービス拒否を引き起こす攻撃であるMutedRAGを提案しています。この論文で検討された方法🔧:→ MutedRAGはジェイルブレイクプロンプトを含む接尾辞を作成します。これ https://t.co/hbg0oC4yMN

Rohan Paul: (翻訳) 正式なプライバシー制約下でのインコンテキスト学習の実現可能性は、ほとんど未踏のままです。この論文は、線形アテンションヘッドのための差分プライベート事前学習アルゴリズムであるNoisyHeadを提案しています。プライバシーと精度のトレードオフに関する初の理論的分析を提示しています。 https://t.co/jt751jxBIt

Rohan Paul: (翻訳) 思考について考える。この論文は、メタ認知能力を植え付けることによって「賢いAI」を開発することを提案しています。そのようなAIは、自身の問題解決戦略を監視、評価、適応することを学習します。このアプローチは人間の知恵を反映しており、堅牢で説明可能、協調的なものを目指しています。 https://t.co/6jNCTCVZuR

MS、Python開発者3名解雇 TypeScriptへの影響も【続報】

  • MicrosoftのAI投資強化と人員削減に関する続報です。
  • 既報のPython言語高速化プロジェクト「Faster CPython」チームの主要開発者について、新たに3名が解雇されたとの報道が続いています。
  • また、TypeScriptの高速化に貢献した開発者もレイオフの対象となった可能性がSNS上で指摘されており、AI戦略推進に伴う組織再編の影響が広範囲に及んでいる可能性が懸念されます。
Yuta Kashino: "There were layoffs at MS yesterday and 3 #Python core devs from the Faster CPython team were caught in them" https://t.co/nCc7PT7FIT MSがFaster CPythonの開発者を解雇.これもMSのコスト削減の一環ですね….というか,Faster Cpythonの開発...

Yuta Kashino: Microsoft Layoffs Hit Coders Hardest With AI Costs on the Rise https://t.co/UT80RF8trU MSがAIのインフラ投資をするために,プログラマをレイオフするそう.AIコードエージェントの利用が促進されてきて,プログラマはただのコストになってるそうで…

Charly Wargnier: (翻訳) TypeScriptを10倍速くすれば、雇用の安定が得られると思うでしょう。どうやらそうではないようです! https://t.co/fRaSVNb4xW

Anthropic、25億ドル信用枠確保 文脈適応AIもアピール

  • AIスタートアップAnthropicが、JP Morganが主導するシンジケート団から25億ドルの5年間のリボルビングクレジットファシリティを確保したと報じられました。
  • 同社の年間収益は2025年第1四半期に20億ドルに達し、前期の10億ドルから倍増したとされています。この急成長が大型の資金調達を後押ししたと考えられます。
  • また、Anthropicは地域の人口統計などのローカルデータに基づいてAIの応答を調整するなど、より文脈に応じたソリューションを提供する新しいモデルについてもアピールしています。
Rohan Paul: (翻訳) AI市場における激しい資金調達。Anthropicはつい先ほど、25億ドルのクレジットライン(5年間のリボルビングクレジットファシリティ)を確保しました。年間収益は第1四半期に20億ドルに達し、前期の10億ドルから倍増しました。コンソーシアム https://t.co/IXRDcTpTGJ

The Information: (翻訳) 特定の文脈に合わせてソリューションを調整するAIを想像してみてください。Anthropicの新しいモデルは、地域の人口統計などのデータに基づいて結果を洗練するために推論を使用します。分析を読む:https://t.co/cfaYFCqNX7 #ContextualAI

Tibor Blaho: (翻訳) 新しいClaudeウェブアプリの実験「Claude AI 編集済みモデル名公開」では、「🤫」絵文字で始まるモデル名を確認します https://t.co/e18PKMk2RK

AI社会実装の進展と課題: 広告、教育、開発現場での変化

  • YouTubeではGeminiを活用し、動画内の感情的なピーク直後に広告を挿入する試みが報じられました。
  • AI家庭教師による不適切情報提供問題の続報です。子供にフェンタニルのレシピといった情報を与えた事例が報告され、AIの安全性確保と監視の重要性が改めて指摘されています。
  • AIによるコード生成の普及は、プログラマーのスキルセットやキャリアパスに大きな変化をもたらす可能性があり、AI時代における開発者の役割について様々な意見が交わされています。
Chubby♨️: (翻訳) AIが「より良い広告挿入」のような愚かな目的に使われるのは時間の問題でした。

Forbes: (翻訳) 視聴:これらのAI家庭教師は子供たちにフェンタニルのレシピを与えました–フォーブスの調査で判明したこと https://t.co/7IC2DBvT9h

mizchi: こうなるのを割と確信してるので、自分はコード生成じゃなくてコード生成パイプラインにスキルの軸足移してますね

AI動向:人型ロボット、動画生成、Llama4開発陣退職噂、Grok

  • 中国のUnitree社の人型ロボットがMMA(総合格闘技)形式で戦うイベントが計画されるなど、ロボティクス分野でのAI活用が新たな段階に進んでいます。
  • AIによる動画生成技術も注目されており、スタートアップのMoonvalleyが5300万ドルの資金調達を行ったとの報道がありました。
  • Metaの次世代大規模言語モデルLlama4については続報です。開発チームの約80%が退職したとの噂が流れ、AI人材の流動性の高さも浮き彫りになっています。
  • また、xAIのGrokについてはオープンソース化を求める声も上がっています。
Chubby♨️: (翻訳) 工場における第一世代の人型労働者。彼らは急速に上達するでしょう。これは中国の深圳からです。AIとロボットは私たちの生活を変革するでしょう。 via r/economic https://t.co/48Xq730bWC

TechCrunch: (翻訳) AI動画スタートアップMoonvalleyが申請によると5300万ドルを調達 | TechCrunch https://t.co/QOrtAEl0ZD

clem 🤗: (翻訳) 透明性のためにGrokをオープンソースにする必要があります!

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください