2026年04月14日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Anthropic次期モデルの自律性評価とAIインフラ需要の拡大
Anthropicの次期モデルと噂される「Claude Mythos」が、サイバーセキュリティ評価で高い自律性を示し注目を集めています。
また、AI需要の急増に伴うSamsungのメモリ増産やOracleの電力契約など、インフラ整備の動きも活発化しています。
Google DeepMindによる哲学者の雇用といった興味深い話題も含め、本日の主要な動向を順に追っていきましょう。
目次
- AnthropicのClaude Mythos、サイバー評価で高評価【続報】
- OpenAIのBrockman氏、AIによるソフトウェア開発の変革を語る
- Samsung、AI需要急増を受けNAND増産投資を決定
- AIデータセンターの電力需要急増、Oracleが大規模契約
- Google DeepMind、機械意識を研究する哲学者を雇用
- Anthropic、チャット中にモデル切替が可能に
- Anthropic、Claude CodeのUI/UX改善や新機能を追加
- Microsoft、Copilot向け常時稼働AIエージェントを検討
- 日本語視覚言語モデル「LLM-jp-4-VL 9B beta」が公開
- AI学習のための専門家需要が急増、新たな労働市場が形成
AnthropicのClaude Mythos、サイバー評価で高評価【続報】
- Anthropicの次期モデルと噂される「Claude Mythos」が、英国のAI安全研究所(AISI)によるサイバーセキュリティ評価で高い能力を示したことが報告されています。
- 脆弱性のあるコードベースから機密情報を盗み出すといったタスクを自律的に完了できた初のモデルとされ、その性能に注目が集まっています。
- この結果を受け、Mythosのような高度なAIがもたらすサイバーセキュリティ上のリスクについての議論も活発化しています。
Chubby♨️: (翻訳) なんてことだ、Anthropicは誇張していなかった。Claude Mythosは作りが違う。 https://t.co/G9kT6IbkqI
Oikon: Claude Mythos Previewのハッキング能力のテストを、イギリスのAI安全研究所(AISI)が実施。 CTF(Capture The Flag)というハッキング問題や、The Last Ones https://t.co/zNVRSbRvgz
Financial Times: (翻訳) Mythosとすべての国家が直面するサイバーセキュリティリスク https://t.co/KKgQ2SCu6R | オピニオン
OpenAIのBrockman氏、AIによるソフトウェア開発の変革を語る
- OpenAIの共同創業者であるGreg Brockman氏が、世界はコンピュート主導の経済に移行しており、AIがソフトウェアエンジニアリングの分野でルネサンスを引き起こしていると述べました。
- 過去半年で開発速度が劇的に向上したとし、この変革が今後あらゆる分野に及ぶとの見解を示しています。
- この発言は、AI技術がアイデアと実現の間の障壁を減らし、多くの人々が自己実現できる可能性を秘めていることを示唆しています。
Greg Brockman: (翻訳) 世界はコンピュート主導の経済に移行しています。ソフトウェアエンジニアリングの分野は現在ルネサンスを迎えており、AIは過去半年だけでもソフトウェアエンジニアリングを劇的に加速させました。AIは今、この同じ変革をもたらす軌道に乗っています。
Romain Huet: (翻訳) 「初めて、アイデアと現実の間の障壁が少なくなり、はるかに多くの人々がなりたい自分になれるようになりました。」 このテクノロジーが何を可能にするか、そして私たちが使命を遂行する上での進歩について、@gdb からの深遠な表現です。
Samsung、AI需要急増を受けNAND増産投資を決定
- AIエージェントが複数のLLMを利用することで大量のデータを保存する必要性が高まり、NANDフラッシュメモリの需要が爆発的に増加しています。
- この状況を受け、Samsungが平沢第5工場(P5)へのNAND増設投資を決定したと報じられました。
- メモリがAI時代の真のボトルネックであるとの指摘も出ており、キオクシアとの競争激化が予想されます。
パウロ: あ、NAND投資を抑えていたSamsungがNANDの増設投資きたー ついにキオクシアと頂上決戦だ
パウロ: NANDは本当に足りないですね Agent AIがLLM複数使うのでたくさん保存しないとっ
パウロ: Samsung P5にNANDは本気だ10万枚/月クラスでしょこれ
AIデータセンターの電力需要急増、Oracleが大規模契約
- AIの普及に伴い、データセンターの電力需要が世界的に急増しています。
- この需要に対応するため、OracleがBloom Energyから最大2.8ギガワットの燃料電池電力を購入する契約を結んだことが報じられました。
- AIインフラを支えるエネルギー確保の動きが活発化しており、データセンターへの設備投資だけではAIの幻覚は解決しないとの指摘も出ています。
Bloomberg: (翻訳) オラクルは、人工知能作業用のデータセンターに供給するため、Bloomから最大2.8ギガワットの燃料電池電力を購入することに合意した https://t.co/MmLK6ztTLw
Evan: (翻訳) オラクル($ORCL)は、AI作業用のデータセンターに供給するため、Bloom Energy Corp.から最大2.8ギガワットの燃料電池電力を購入することに合意した - Bloomberg https://t.co/TM0WTF4vA9
Bloomberg: (翻訳) 「より大きなデータセンターに資金を注ぎ込み続けていることが信じられない」AhrenのJanusz Marecki氏が@MerrynSWに、データセンターへの設備投資だけではAIの幻覚は解決しない理由を語る。詳細はMerryn Talks Moneyで:https://t.co/7xao6IbKch https://t.co/ob8UUwoxon
Google DeepMind、機械意識を研究する哲学者を雇用
- Google DeepMindが、機械の意識を研究テーマとして扱うために哲学者を雇用したことが話題となっています。
- これは、高度なAI開発の課題が、タスク遂行能力だけでなく、モデルの内的状態や目標、自己認識といった哲学的な領域に移りつつあることを示唆していると見られています。
- AIの進化が技術的な問題だけでなく、意識とは何かという根源的な問いを人類に突きつける段階に来ているのかもしれません。
Haider.: (翻訳) たいしたことじゃない、ただGoogle DeepMindが「機械意識」の哲学者を雇っただけだ https://t.co/T1t1vnt1oF
Rohan Paul: (翻訳) Google DeepMindは、機械の意識を現実の研究問題として扱うために、哲学者としてHenry Shevlinを雇いました。つまり、DeepMindは、高度なAIの最も困難な部分は、もはやモデルにタスクを実行させることだけではなく、どのような種類の内的状態、目標、そして https://t.co/69i15hZdJ7
Anthropic、チャット中にモデル切替が可能に
- Anthropicが提供するClaudeのチャットインターフェースで、会話の途中で使用するモデルを切り替える機能が展開されていることが報告されました。
- これにより、ユーザーはタスクに応じて、より高速なモデルや高性能なモデルを柔軟に選択できるようになります。
- 大手AIチャットサービス間でのユーザー体験向上の競争が続いています。
Chubby♨️: (翻訳) Anthropicがチャット中のモデル切り替え機能を展開中。そろそろ時間だ。https://t.co/3dDnRjlTYu
Anthropic、Claude CodeのUI/UX改善や新機能を追加
- Anthropicが、開発者向けツール「Claude Code」のアップデート情報をまとめたページを新たに公開しました。
- 画面のちらつきを抑える「NO_FLICKER」モードや、コンパクションを制御するフックのサポートなど、ユーザー体験を向上させるための改善が継続的に行われています。
- 開発者からは、Claude Code利用時の高揚感を語る声も上がっており、コーディングツールとしての評価が高まっています。
Oikon: このところNO_FLICKERモードでClaude Codeを動かしていますが、個人的に結構気に入ってます。最近追加されたFocusモードだとほぼ画面のチラつきが無くなるので、認知負荷が減らせている気がします。 CLAUDE_CODE_NO_FLICKER=1 claude
Oikon: Claude Code 公式ドキュメントにいつの間にかWeekly Updateのページが出来てた👀 - Ultraplan - Monitor tool - /autofix-pr - /team-onboarding https://t.co/VOavJnsOQ9 https://t.co/J97n2AKMkv
mizchi: おっ魂震えてるな
Microsoft、Copilot向け常時稼働AIエージェントを検討
- Microsoftが、CopilotにプロンプトなしでOfficeアプリを横断してタスクを自律的に実行する「常時稼働AIエージェント」の導入を検討していると報じられています。
- これは、顧客がCopilotの価値に疑問を呈している中で、その価値を高めるための動きと見られています。
- ユーザーからは、Excelをタスク管理表として活用し、タスクの収集から実行までを自動化する「Copilot Cowork」のスキルなども共有されており、エージェント機能への期待が高まっています。
The Information: (翻訳) マイクロソフトは、口コミで広がったOpenClawプロジェクトに触発され、プロンプトなしでOfficeアプリを横断して操作できるCopilot用の常時稼働AIエージェントを検討しています。この動きは、Anthropicがその中核分野に進出し、顧客がCopilotの価値に疑問を呈している中で行われました。続きを読む:
まつにぃ: Copilot CoworkでExcelをタスク管理表にして、バシバシ進めていくというのをやってみてます。 SKillで収集と実行の二つを作り、それぞれを一つのExcelを起点にタスクを管理しています。 実行完了したらセルの値を変えるなどもできるため、個人でもチームでも運用できそうです。 これは気持ち良い。 https://t.co/LJGFaB6tYv
まつにぃ: またCopilot Coworkでこのタスク収集SKillをタスクスケジュール機能で定期実行すると、何もしてなくても勝手にExcelが更新されていきます。 こんな感じで、SKillに業務を集約し、SKillを定期実行させるのがすごくいいですね。 出張後の処理や経費精算、日報などを定期実行でやると超省力化される。 https://t.co/iVbgoqM04i
日本語視覚言語モデル「LLM-jp-4-VL 9B beta」が公開
- 日本語LLM開発プロジェクト「LLM-jp」から、新たな視覚言語モデル「LLM-jp-4-VL 9B beta」が公開されました。
- このモデルは、80億パラメータの言語モデル「llm-jp-4-8b-instruct」をベースに、日英のマルチモーダル事後学習を行ったものです。
- 日本語タスクにおいて、既存のオープンな視覚言語モデルと同程度の性能を達成していると報告されています。
Odashi: こちら内部での議論が間に合わなかったので奇妙なライセンスになっているのですが、今後緩くなる可能性があるので、少々お待ち願います。
Odashi: ところでLLM-jp-4-8bのreasoningなしモデルを同時にリリースしました。 https://t.co/lsfW9MHar7
AI学習のための専門家需要が急増、新たな労働市場が形成
- 高度なAIモデルの開発が進むにつれて、モデルを訓練・評価するための人間の専門家の価値が逆に高まっています。
- AIトレーニングサービスを提供するHandshake社の収益は、1年前の年換算500万~1000万ドルから、現在では10億ドル近くまで急増していると報じられています。
- ドメイン知識を持つ専門家や評価者、アノテーターなどの需要が急増しており、AIが新たな労働市場を生み出していると指摘されています。
Rohan Paul: (翻訳) AIは、従来のソフトウェアとはあまり似ておらず、むしろ大規模な人間のオペレーションによく似た新しい労働市場を創出しています。フロンティアモデルの能力が向上するにつれて、専門家による人間のフィードバックの価値は下がるのではなく、上がります。研究室には、ドメインの専門家、評価者、注釈者が必要です。https://t.co/RIe07y8cYl