2026年05月12日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
GPT-5.5による新規オプティマイザ設計とAIエージェントの実用化動向
GPT-5.5が既存の手法を上回るオプティマイザを自律的に設計し、AI自身が高度なアルゴリズムを創出する事例として驚きをもって受け止められています。
一方、カプコンはAIエージェントを活用して月間3万時間のプレイテストを自動化するなど、実業務への導入を加速させています。
注目の集まる最新のトピックを順番にご紹介します。
目次
- Thinking Machines対話デモ公開に絶賛の声【続報】
- Claude CodeにAgent Viewと/goal追加【続報】
- GitLabとGMがAI投資強化で人員削減【続報】
- Hermes AgentにMacのデスクトップ操作機能が追加
- Unitreeが搭乗可能な変形ロボットGD01を発表
- Grok Web版にSkills機能が正式リリース【続報】
- OpenAI Codexがnpmマルウェア被害者を支援【続報】
- GPT-5.5がAdamWを凌駕する新規オプティマイザを設計
- Amazon従業員が評価向上のため社内AIツールを空回し
- カプコンがGoogle Cloudと連携しAIプレイテスト環境を構築
- Sam Altman氏、新モデルとパーソナライズの融合を絶賛
- Andrej Karpathy氏のAIエージェント解説動画が話題に
Thinking Machines対話デモ公開に絶賛の声【続報】
- 既報のThinking Machines「Interaction Models」に関する続報です。
- 実際のデモ動画が公開され、ユーザーとAIが同時に話しリアルタイムでコラボレーションする様子が確認されました。
- 「真に新しい体験」として多くの開発者から絶賛されており、OpenAIのSam Altman氏も反応を示すなど大きな注目を集めています。
Soumith Chintala: (翻訳) Thinkyの秘密の計画:1: 人間とAIの帯域幅を増やす 2: 人間+AIの知能の上限を引き上げる 3: 人間が新しい世界で主人公であり続けられるよう支援する。私たちはステップ1にいます。Interaction Modelsは人間にとって素晴らしいリアルタイムのコラボレーションツールです。プレビューはこちら:
Nathan Lambert: (翻訳) これは本当に違うと感じるデモです -- モデルとユーザーが同時に話している!素晴らしい。リリースおめでとうございます @thinkymachines
elvis: (翻訳) まだ初期段階ですが、最も印象的なのは、これらのオムニモデルとのインタラクションがいかに自然になりつつあるかということです。リアルタイムで低遅延のインタラクティブなAIモデルは、今日では想像もつかないようなアプリケーションを解き放ちます。心の準備を!
Claude CodeにAgent Viewと/goal追加【続報】
- Anthropicのコーディング支援AI「Claude Code」に関する続報です。
- CLI上で実行中の複数のエージェントを一覧管理・操作できる「Agent View」機能が追加されました。
- また、完了条件を設定して自律的にタスクを進めさせる「/goal」コマンドも導入されています。
- ターミナル上でのマルチエージェント管理が容易になり、開発体験が大きく向上したと評価されています。
Awni Hannun: (翻訳) Claude Codeのagent viewは、私が多くの作業を開始し管理する場所です。これは非常に便利な新機能です - 10/10
Boris Cherny: (翻訳) 1つのエージェントから複数のエージェントへレベルアップする最良の方法。ターミナルのタブを切り替える必要はもうありません。
Oikon: Claude Code に /goal コマンドきたー! https://t.co/rgD6bbYAWB
GitLabとGMがAI投資強化で人員削減【続報】
- AI投資強化を目的とした企業の人員削減に関する続報です。
- GitLabが、AIエージェント市場への投資資金を捻出するために人員削減を実施すると発表しました。
- また、General Motors (GM) もIT部門の従業員を数百人規模で削減し、より高度なAIスキルを持つ人材の採用に切り替える計画を明らかにしました。
- 企業が既存のITリソースをAI分野へ急速にシフトさせる動向が続いています。
Bloomberg: (翻訳) 開発者のコーディングプロジェクトを支援するソフトウェアを提供するGitLabは、AIエージェントの市場機会に投資する資金を捻出するため、人員削減を行うと発表した。
Evan: (翻訳) General Motors $GM は本日、コスト削減と他のテクノロジー分野のスキルを持つスタッフの採用のため、IT部門の給与所得者を数百人削減する計画を発表した - Bloomberg
TechCrunch: (翻訳) GMは、より強力なAIスキルを持つ人材を雇うために、数百人のITワーカーを解雇したばかりです。
Hermes AgentにMacのデスクトップ操作機能が追加
- ローカルで動作するHermes Agentに、新機能「Computer Use」が追加され、Macのデスクトップ操作が可能になりました。
- ユーザーのカーソルを奪わずにバックグラウンドで操作を実行でき、危険なコマンドのブロックなど安全性にも配慮されています。
- Hugging Faceのローカルアプリにも統合されるなど、ローカルエージェントの進化が急速に進んでいます。
カレーちゃん: Hermes Agentに新機能「Computer Use」が来た。(macOS限定) AIエージェントがMacのデスクトップをバックグラウンドで操作可能。 ユーザーのカーソルは移動させない 便利そうだけれど、やや怖い気もする。承認制になっていて、危険なコマンドもブロックされていて、安全性にも配慮されているが
🚨 AI News | TestingCatalog: (翻訳) SigmaブラウザのプライベートモードでHermes Agentがサポートされました!Hermes Agentは利用可能なローカルモデルの上で動作し、ブラウザのタスクを実行できます。ユーザーは設定メニューからOpenClawとHermesのオプションを選択できます。Hermes派ですか、それともOpenClaw派ですか?👀
Itomaru 📿: (翻訳) 素晴らしい 🤗🤝👱🏻♀️
Unitreeが搭乗可能な変形ロボットGD01を発表
- ロボット開発企業のUnitreeが、世界初となる量産型の搭乗可能な変形メカ「GD01」を発表しました。
- 価格は約390万元(約65万ドル)からで、重量約500kgの民用交通手段として位置づけられています。
- SF映画のような機体の実写動画が公開され、開発者やロボティクス界隈で大きな話題を呼んでいます。
Compute King: (翻訳) 宇樹科技が搭乗可能な変形メカを発表、390万元から。5月12日、宇樹科技は世界初となる量産版の搭乗可能な変形メカを正式に発表しました。開始価格は390万元です。公式の紹介によると、このメカは変形可能で、民間の交通手段として位置づけられており、運転手を含めた総重量は約500kgです。笑、本物のメカ戦士ですね〜〜 島のカエルたちはどうするんでしょう? Youtubeの動画はとてもクールです...
Miles Brundage: (翻訳) (URLのみのため翻訳なし)
Chubby♨️: (翻訳) 現時点では、Unitreeの実際の計画が何なのか恐ろしくて聞けません。彼らはこれを建設業界で使うんですよね?そうですよね?
Grok Web版にSkills機能が正式リリース【続報】
- xAIのGrokに関する続報です。
- Webブラウザ版において「Skills」機能の提供が正式に開始されました。
- チャットの入力欄で「/」をタイプすることで、様々な外部ツールやスキルを呼び出して利用可能になります。
- AIモデルが外部機能と連携するトレンドにxAIも追従し、ユーザーの利便性向上を図っています。
Tech Dev Notes: (翻訳) xAIがGrok WebにSkillsをリリースしました
Tech Dev Notes: (翻訳) Grok WebのSkillsは / を入力することで使用できます
OpenAI Codexがnpmマルウェア被害者を支援【続報】
- 以前お伝えしたnpmパッケージのマルウェア攻撃に関する続報です。
- 広範囲なマルウェア攻撃で影響を受けたOSSプロジェクトに対し、OpenAIのCodexチームが支援を申し出ました。
- 影響を受けたOSS開発チームへ、プランやクレジットの無償提供を行います。
- AI開発ツールがOSSコミュニティのセキュリティインシデント復旧を直接的にサポートする動きとして注目されています。
jason: (翻訳) OSSのためのCodexがお手伝いします。もしあなたのチームがこれらの問題に対処しているなら、チームのニーズに基づいてプランとクレジットを喜んで提供します。
jason: (翻訳) codexは影響を受けたすべての人にまもなく連絡します!
GPT-5.5がAdamWを凌駕する新規オプティマイザを設計
- ProximalHQが提供するFrontierSWEベンチマークにおいて、GPT-5.5が自律的に新しいオプティマイザを設計したことが報告されました。
- この新規オプティマイザは、広く使われているAdamWと比較して3.2倍の効率を達成したとされています。
- AIが既存のアルゴリズムを上回る高度な最適化手法を自ら創出できる可能性を示す事例として驚きをもって受け止められています。
Tanishq Mathew Abraham, Ph.D.: (翻訳) @ProximalHQ のFrontierSWEベンチマークの一環として、GPT-5.5がAdamWの3.2倍の効率を達成する斬新なオプティマイザを設計したというのは、私の理解で合っていますか?この新しく設計されたオプティマイザがどのように機能するのか、もっと詳しく知りたいです!
Robert Lange: (翻訳) 「エージェントによるテキスト変異の勾配を通じたコード内のヒューリスティック学習」の実行が続いています 🧬 10クラスのImageNetバリアントで86%。コード生成にニューラルネット/LLMを使用する大きな利点の1つは、人間が読めるコード成果物から得られる暗黙の解釈可能性です 🔭
Amazon従業員が評価向上のため社内AIツールを空回し
- Amazonの従業員が、マネージャーに対してAI技術を積極的に活用しているように見せかけるため、社内のAIツールを不正利用していることが報じられました。
- 業務に不要なタスクを自動化ツールに実行させることで、AIの使用頻度などの評価指標を意図的に水増ししているとのことです。
- 企業におけるAI導入のKPI設定や評価方法が形骸化し、本末転倒な事態を引き起こしている実態が浮き彫りになりました。
Financial Times: (翻訳) FT独占:Amazonの従業員は、マネージャーにテクノロジーをより頻繁に使用していることを示すために、社内のAIツールを使用して重要でないタスクを自動化しています。
カプコンがGoogle Cloudと連携しAIプレイテスト環境を構築
- カプコンがGoogle Cloudと提携し、ゲーム開発におけるプレイテストなどの定型業務を自動化するAIプラットフォームを構築しました。
- 新作タイトル『モンスターハンターストーリーズ3』の開発において、月間30,000時間にも及ぶプレイテストをAIエージェントが代行しています。
- ゲーム業界におけるAgentic AIの実用化と、大幅な開発効率の向上を示す好例として注目を集めています。
Google Cloud Japan: カプコンと Google Cloud、プレイテストなどの定型業務を自動化する AI プラットフォームを構築 → https://t.co/SliJvqhEWp 『モンスターハンターストーリーズ3 ~運命の双竜~』においてプレイテストを行うエージェントでは、月間 30,000 https://t.co/rcjUvlF8zQ
Sam Altman氏、新モデルとパーソナライズの融合を絶賛
- OpenAIのSam Altman氏が、新しいChatGPTモデルとパーソナライゼーションの組み合わせについて言及しました。
- これらの要素が組み合わさることで、これまでとは「全く新しいもの」に感じられると高く評価しています。
- また、先日アップデートが確認されたCodexについても、開発者にとっての「スーパーアプリ」になりつつあると自信を覗かせています。
Sam Altman: (翻訳) これをスーパーアプリと呼びますか?
Sam Altman: (翻訳) 私にとって閾値を超えたものといえば、新しいChatGPTモデル、パーソナリティ、そしてパーソナライゼーションの組み合わせは、新しいもののように感じられます。
Andrej Karpathy氏のAIエージェント解説動画が話題に
- 元OpenAIのAndrej Karpathy氏が公開した、AIエージェントに関する17分間の解説動画が開発者の間で広く共有されています。
- GPT-2の開発者でもある同氏が、AIエージェントの構築に必要な知識を簡潔かつ本質的に解説しており、必見のコンテンツと評価されています。
- また、AnthropicのエンジニアによるClaude Skillsの構築に関する解説動画も併せて注目を集めています。
CyrilXBT: (翻訳) GPT-2を構築し、OpenAIを共同設立した人物が、AIエージェントについて知る必要があるすべてを17分間で教えてくれました。コースクリエイターではありません。チュートリアルチャンネルでもありません。Andrej Karpathyです。現在生きている中で最も尊敬されているAI教育者です。17分間。無料です。この特定の動画がなぜ重要なのか、その理由は...
CyrilXBT: (翻訳) Claude Skillsを構築した2人のAnthropicエンジニアによるこの16分間のトークは、ほとんどの開発者が数ヶ月かけて自力で理解するよりも多くのことを、正しく構築する方法について教えてくれます。何があってもこれをブックマークして見てください。