2025年05月13日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
OpenAI新ベンチマーク公開、Altmanが語る2025年AIロードマップ
今週のAI業界は大型ニュースが目白押しです。OpenAIがヘルスケア分野向け評価ベンチマーク「HealthBench」を公開し、医療AIの評価基準が進化しました。
Sam Altman氏は2025年を「AIエージェントの年」と位置づけ、コーディング分野での実用化を予測。その一方でAnthropicでは既に社内コードの9割がAIによって生成されているという驚きの報告も。
GoogleやサウジアラビアがAI支援プログラムや国営企業を立ち上げるなど、世界各国のAI戦略も活発化しています。それでは各トピックの詳細を見ていきましょう。
目次
- OpenAI、ヘルスケア向け評価ベンチマークHealthBench公開
- S. Altman氏 AIロードマップ予測「2025年はエージェントの年」
- 【続報】ChatGPT Deep Research、PDF出力とMS連携に対応
- Google、AIスタートアップ支援「AI Futures Fund」設立
- Anthropic、社内コードの約9割をClaudeが記述と報告
- サウジアラビア、国営AI企業「Humain」設立を発表
- Alibaba、Qwen3量子化版を正式リリース【続報】
- Meta、トークナイザ不要の新モデル「BLT」発表
- Kaggle、GenAI Intensiveでギネス世界記録を達成
OpenAI、ヘルスケア向け評価ベンチマークHealthBench公開
- OpenAIが、AIシステムのヘルスケア分野での性能を測定するための新しい評価ベンチマーク「HealthBench」を公開しました。
- このベンチマークは、60カ国262人の医師の協力を得て開発され、5,000件の現実的な健康関連対話シナリオを含んでいます。
- 各対話はカスタムルーブリックを用いて評価され、AIの応答品質を多角的に測定します。GitHubリポジトリで利用可能です。
Greg Brockman: (翻訳) ヘルスケア向けAIシステムの新しい評価指標であるHealthBenchをリリースしました。60カ国で診療経験のある262人の医師と共に開発されました。
Chubby♨️: (翻訳) ヘルスケアベンチマーク:AIヘルスは未来です(HealthBench) OpenAIは、60カ国262人の医師と共に開発されたベンチマークHealthBenchを発表しました。これには5,000件の現実的な健康に関する会話が含まれています。各インタラクションは、AIの応答を評価するためのカスタムルーブリックを使用して評価されます。
Kevin Weil 🇺🇸: (翻訳) 人間の健康を改善することは、AGIの決定的な影響の1つとなるでしょう。AIシステムが健康関連シナリオで人々や臨床医をサポートする能力を測定するために設計された新しい評価指標、HealthBenchを紹介します。
S. Altman氏 AIロードマップ予測「2025年はエージェントの年」
- OpenAIのSam Altman氏が、AIの進化に関する具体的なロードマップ予測を示しました。
- 2025年はAIエージェントが実用的なタスク、特にコーディング分野で活用される年になると予測しています。
- さらに2026年にはAIが主要な科学的発見を支援し、2027年にはロボティクスを通じて物理世界への応用が進むとの見解を示しました。
Chubby♨️: (翻訳) サム・アルトマン:2025年はAIエージェントの年、2026年は科学研究とブレークスルーの年、2027年はAIとロボティクスが実際に物理世界に関与する年 LFG
Tibor Blaho: (翻訳) サム・アルトマン @ AI Ascent 2025 (2025年5月2日) - 「私たちは人々のコアなAIサブスクリプションのような存在となり、それを使う方法を提供したいと考えています。その一部はChatGPT内で行うようなことになるでしょう。そのサブスクリプションには、他にもいくつかの非常に重要な要素がありますが、ほとんどの場合、私たちは...」
Stephanie Palazzolo: (翻訳) もしあなたが、私たちの多くのように「超知能」が何を意味するのかまだ混乱しているなら、サム・アルトマンがOpenAIの研究者たちに個人的にそれをどのように説明し、その意味合いを語っているかをご紹介します。@amirより:
【続報】ChatGPT Deep Research、PDF出力とMS連携に対応
- ChatGPTのDeep Research機能に関する続報です。
- 調査レポートをPDF形式でダウンロードできるようになりました。
- 表、画像、引用リンク、出典情報を含む整形済みPDFとして出力可能です。
- Microsoft OneDriveおよびSharePointとの連携機能が追加されました(一部地域を除く)。
- これらの新機能はPlus、Team、Proユーザー向けに展開されています。
TestingCatalog News 🗞: (翻訳) Deep Researchの出力をPDFとしてダウンロードする機能が、すべてのChatGPT Plus、Team、Proユーザーに展開されました。
TestingCatalog News 🗞: (翻訳) EU以外のChatGPTユーザーは、OneDriveおよびSharePointサービスをDeep Researchに接続できるようになります。Microsoft連携が先行 👀
Kevin Weil 🇺🇸: (翻訳) Deep ResearchレポートをPDFにエクスポートできるようになりました!小さなことですが、最も要望の多かった機能の1つです。ぜひ試してみて、どのように機能するか教えてください。
Google、AIスタートアップ支援「AI Futures Fund」設立
- Googleが、AI技術の未来を築くスタートアップを支援する新プログラム「AI Futures Fund」を発表しました。
- このプログラムでは、Google DeepMindモデルへの早期アクセスやGoogle Cloudクレジット提供などを通じて、スタートアップの成長を支援します。
- AI分野におけるイノベーション促進とエコシステム構築を目指す取り組みとして注目されます。
Google Labs: (翻訳) AI Futures Fundを発表します。これは、スタートアップが私たちと協力してAI技術の未来を築くための新しいプログラムです。@GoogleDeepMindモデルへの早期アクセスからCloudクレジットまで、スタートアップを次のレベルに引き上げるお手伝いをします。詳細を確認して応募してください ⬇️
Google AI: (翻訳) AI Futures Fundをチェックしてください。これは、スタートアップや創業者が私たちと協力して次世代のAI技術を構築する新しいイニシアチブです。詳細を確認して応募してください →
TechCrunch: (翻訳) Google、AIを構築するスタートアップを支援する新しいイニシアチブを開始 | TechCrunch
Anthropic、社内コードの約9割をClaudeが記述と報告
- Anthropicのリードエンジニアが、社内で使用されるコードの約80〜90%がAIモデルClaudeによって書かれていると明らかにしました。
- 複雑なリファクタリングや特定の要求が強いタスクなど、一部は依然として手書きのコードが必要としながらも、AIによる開発効率の大幅な向上が示唆されています。
- Google (25%) やMicrosoft (30%) の報告と比較しても高い割合であり、AIコーディング支援の進化を示しています。
Chubby♨️: (翻訳) Google:コードの25%はAIによって書かれています Microsoft:コードの30%はAIによって書かれています! Anthropic:私のMacBookを持ってて - 90%はAIによって書かれています
サウジアラビア、国営AI企業「Humain」設立を発表
- サウジアラビアが、AIバリューチェーン全体への投資を目的とした新しい国営企業「Humain」の設立を発表しました。
- この動きは、同国で開催されるAI関連カンファレンスにトランプ大統領や大手テック企業CEOらが集結するタイミングと重なり、国家的なAI戦略強化を示すものと見られています。
- Aramco DigitalのCEOがHumainのトップに就任すると報じられています。
Bloomberg: (翻訳) サウジアラビアは、人工知能バリューチェーン全体に投資する新会社を設立しました。これは、ドナルド・トランプ米大統領の訪問に先立ち、訪問中の議題でAI技術が大きく取り上げられると予想されています。
Financial Times: (翻訳) サウジアラビア、トランプ訪問前にAIベンチャーHumainを設立
Forbes: (翻訳) サウジの新国営AI企業Humain、Aramco Digital CEOがトップに就任
Alibaba、Qwen3量子化版を正式リリース【続報】
- 先日一部サイズが公開されたQwen3シリーズの量子化モデルについて、0.6Bから72Bまでの全サイズが正式にリリースされました。【続報】
- GGUF、AWQ、GPTQなど複数の量子化フォーマットに対応しており、Hugging Faceなどで公開されています。
- Ollama、LM Studio、SGLang、vLLMなどのツールを通じて、ローカル環境へのデプロイが容易になっています。
Qwen: (翻訳) 本日、Qwen3の量子化モデルを正式にリリースします! Ollama、LM Studio、SGLang、vLLM経由でQwen3をデプロイできるようになりました — GGUF、AWQ、GPTQなどの複数のフォーマットから選択して、簡単にローカルデプロイできます。 Hugging FaceのQwen3コレクションですべてのモデルを見つけてください。
Junyang Lin: (翻訳) よし、これで全ての量子化モデルが出揃った。
Rohan Paul: (翻訳) この論文で、Qwen3モデル(0.6B-72B)における1-8ビット幅の5つの学習後量子化技術を探求します。📌 Qwen3の洗練された事前学習は冗長性を減らし、超低ビット量子化への感度を高めている可能性があります。📌 Qwen3は競争力のあるパフォーマンスを達成しています。
Meta、トークナイザ不要の新モデル「BLT」発表
- Meta AIが、従来のトークナイゼーション手法に代わる新しいアプローチ「Dynamic Byte Latent Transformer (BLT)」を発表しました。
- このモデルはテキストをバイトレベルで直接処理するため、トークナイザが不要となり、言語モデルの効率性と信頼性を向上させる可能性があるとされています。
- 8Bパラメータモデルの重みが公開されており、今後の発展が注目されます。
Rohan Paul: (翻訳) MetaのこのLLMはトークナイザをスキップし、コンピュータのようにテキストを(バイト単位で!)読み取ることでパフォーマンスを向上させます。BLTのトレーニングおよび推論コードはGitHubで公開されています。@AIatMetaは、8BパラメータのDynamic Byte Latent Transformer(BLT)のモデルウェイトをリリースしました。これは...
パウロ: Meta Dynamic Byte Latent Transformerという新しいモデル圧縮の手法を発表 おっこれは良さそう
Kaggle、GenAI Intensiveでギネス世界記録を達成
- Kaggleが開催したオンラインカンファレンス「Kaggle GenAI Intensive with Google」が、「1週間での仮想AIカンファレンス最多参加者数」としてギネス世界記録™に認定されました。
- Kaggleはこの成果を参加者への感謝と共に発表しました。
- イベントのコンテンツはオンデマンドで視聴可能です。
Kaggle: (翻訳) 🎉 私たちは正式に「1週間での仮想AIカンファレンス最多参加者数」のギネス世界記録™を更新しました!Kaggle GenAI Intensive with Googleに参加してくださった皆様、本当にありがとうございました!見逃した方は、オンデマンドでコンテンツをご覧ください! #GuinnessWorldRecords @GWR