2025年10月10日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
GPT-5 APIツール対応とGemini 2.5の数学記録達成
OpenAIがGPT-5 APIでツール機能の対応を開始しました。「gpt-5-chat-latest」モデルで関数呼び出しやWeb検索などが可能になり、常に最新状態で利用できます。
一方、GoogleのGemini 2.5 Deep Thinkは数学ベンチマーク「FrontierMath」で新記録を達成。350人の専門家が検証した高度な数学問題での優れた推論能力が示されました。
AIエージェント開発分野ではReflection AIが評価額80億ドルで20億ドルを調達、Mastraも1300万ドルの資金を確保しています。
それでは各トピックの詳細を見ていきましょう。
目次
- 【続報】OpenAI、GPT-5 APIでツール利用が可能に
- Gemini 2.5 Deep Think、新たな数学ベンチマークで新記録
- 【続報】中国、NVIDIA製AIチップの密輸取り締まりを強化
- 【続報】Claude Sonnet 4.5、コーディング性能はGPT-5に及ばずとの評価
- 【続報】UBS、NVIDIA・Broadcom向けCoWoS需要予測を上方修正
- Sora 2に著名人登場機能、再生10億回の動画も【続報】
- LLM、少数の悪意ある文書で汚染される脆弱性が判明
- Reflection AI、20億ドル調達を正式発表【続報】
- AIエージェント開発のMastra、1300万ドルを調達
- PLaMo翻訳、サブスクリプションサービスを開始
【続報】OpenAI、GPT-5 APIでツール利用が可能に
- 先日発表されたGPT-5の続報です。OpenAIはAPIを更新し、「gpt-5-chat-latest」モデルで関数呼び出しやWeb検索などのツールが利用可能になったと発表しました。
- このモデルはChatGPTと継続的に同期されるため、常に最新の状態で利用できるのが特徴です。
- API経由でのツール利用が可能になったことで、より高度なAIアプリケーション開発への活用が期待されます。
OpenAI Developers: (翻訳) APIでgpt-5-chat-latestの関数呼び出しやWeb検索などのツールを選択して使用できるようになりました。 このモデルはChatGPTに合わせて継続的に更新されるため、常にAPIでの使用に最適化されているわけではありませんが、チャットのユースケースにはうまく機能します。 https://t.co/Du3394uJDr
Gemini 2.5 Deep Think、新たな数学ベンチマークで新記録
- GoogleのGemini 2.5 Deep Thinkが、新たな数学ベンチマーク「FrontierMath」で新記録を達成しました。
- これまでも国際数学オリンピック(IMO)などでその高い数学的能力が示されてきましたが、今回はGoogleの依頼でEpochが実施した評価によるものです。
- APIが公開されていないため手動で行われ、350人の専門家によって検証された問題で、特に高度な数学的推論能力の高さが示されました。
Quoc Le: (翻訳) Deep ThinkはFrontierMathでSoTAのパフォーマンスを達成しました:
Yi Tay: (翻訳) Gemini 2.5 Deep ThinkはFrontierMathでSoTAです! 🔥🫡
Kol Tregaskes: (翻訳) Gemini 2.5 Deep ThinkはFrontierMathのTier 1-3で29%、Tier 4で10%のスコアを記録し、350の専門家が検証した問題において高度な数学的推論で新記録を樹立しました。 Epochの編集管理のもとGoogleから委託された、Geminiアプリを介した手動評価では、その強みが浮き彫りになりました。
【続報】中国、NVIDIA製AIチップの密輸取り締まりを強化
- NVIDIA製AIチップの中国への密輸問題に関する続報です。
- Financial Timesによると、中国当局が密輸品に対する税関での取り締まりを強化しているとのことです。
- これは、米国製品への依存度を減らし、自国の半導体産業を育成する広範な取り組みの一環と見られています。
Financial Times: (翻訳) 中国、NvidiaのAIチップに対する税関の取り締まりを開始 https://t.co/C1dKX1ehok
Jukan: (翻訳) 中国、NvidiaのAIチップに対する税関の取り締まりを開始 - FT https://t.co/vvuZSKu8RO
パウロ: 中国、密輸されているNvidiaの厳格な税関検査を実施へ 目処がたったんですかね
【続報】Claude Sonnet 4.5、コーディング性能はGPT-5に及ばずとの評価
- 先日、コーディング性能でSOTA(最高水準)を更新したと発表されたClaude Sonnet 4.5に関する続報です。
- 第三者機関METRの評価によると、ソフトウェアエンジニアリングタスクにおける性能は、現在最高性能とされるGPT-5には及ばない結果となりました。
- この結果は、普段コーディングで両モデルを使用している開発者の体感とも一致するとの声が上がっています。
Shion Honda: 50%-time-horizonだとGPT-5が依然首位とのこと。普段コーディングで使っている感覚とも一致しています。 次回のOpus 4.5かGPT-5.1に期待(?)
Miles Brundage: (翻訳) これが出たので、GPT-5 ProとGPT-5-codex-highについてMETRに嫌がらせができます (冗談です、彼らは非常に熱心に働いており、できるだけ早く物事を終わらせます!!! METR万歳) https://t.co/Vp1fu5vJjw
Chubby♨️: (翻訳) どういうわけか、Sonnet 4.5はGPT-5と比較すると物足りなく感じます。 OpenAIは今やほとんどの分野で真に主導権を握っているようです。 Gemini 3が何をもたらすか、待ってみましょう。
【続報】UBS、NVIDIA・Broadcom向けCoWoS需要予測を上方修正
- 以前報じられたTSMCの生産能力増強に続き、需要側からも市場の拡大を裏付ける予測が発表されました。
- UBSはNVIDIAとBroadcom向けのCoWoS需要予測を上方修正し、NVIDIAの次世代チップ「Rubin」やBroadcomのTPU、OpenAIのASICなどが需要を牽引すると見ています。
- サプライチェーン関係者からは、この予測ですら保守的であり、NVIDIAにはまだ大きな成長の余地があるとの見方も出ています。
Jukan: (翻訳) UBS、NVIDIAとBroadcomのCoWoS需要予測を上方修正、RubinとCPXが主要な成長ドライバーに UBS(T. Arcuri、2025年10月8日) UBSは最新のレポートで、NVIDIAとBroadcomのCoWoS需要予測を上方修正しました。同社は以前、TSMCのCoWoS生産能力を修正していました https://t.co/hpDhkezpdG
パウロ: UBS TSMC CoWoSアップデート 100kpmから110kpmへ Nvidia Rubin, Rubin CPXとBroadcom TPU v7pとOpenAI ASICの増量のため
Jukan: (翻訳) UBSの678,000ウェーハという見積もりは、サプライチェーンから聞いた話に比べるとまだ控えめに見える… NVIDIAにはまだかなりの上値余地があると言えるだろう。 https://t.co/ry47yjaqXf
Sora 2に著名人登場機能、再生10億回の動画も【続報】
- OpenAIの動画生成AI「Sora 2」に、著名人がカメオ出演する機能が追加されました。
- 実業家のMark Cuban氏や人気YouTuberのJake Paul氏などが自身のカメオ動画を共有しています。
- OpenAIのGreg Brockman氏によると、Jake Paul氏の動画は1週間で10億回再生されたと報告されています。
Greg Brockman: (翻訳) あなたのマーク・キューバン・カメオを作ろう:
Greg Brockman: (翻訳) 過去1週間のジェイク・ポールのカメオ出演の再生回数は10億回:
LLM、少数の悪意ある文書で汚染される脆弱性が判明
- 英国のAI安全研究所(AISecurityInst)とチューリング研究所の新たな研究により、LLMはモデルや訓練データのサイズに関わらず、わずか数個の悪意ある文書によって脆弱性が生じる可能性があることが判明しました。
- この「データ汚染」攻撃は、これまで考えられていたよりも実用的である可能性が示唆されています。
- この種の攻撃は「Basilisk Venom」とも呼ばれており、AIの安全性確保に向けた新たな課題を提起しています。
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: (翻訳) 大手ラボが1年前の研究を検証してくれるのは、いつでも嬉しいものです😘😘 ちなみに、この種の攻撃は「バジリスク・ヴェノム」と呼ばれています。正しく理解してください!🧪🐉
Reflection AI、20億ドル調達を正式発表【続報】
- 以前、10億ドル超の資金調達を交渉中と報じられたReflection AIの続報です。
- 今回、評価額80億ドルで20億ドルを調達したことが正式に報じられました。
- 同社は自律型コーディングエージェント開発に注力しており、オープンソースモデルでOpenAIやAnthropicなどに対抗することを目指しています。
TechCrunch: (翻訳) かつて自律型コーディングエージェントに注力していたReflectionは、OpenAIやAnthropicのようなクローズドなフロンティアラボのオープンソース代替と、DeepSeekのような中国のAI企業に相当する欧米企業の双方に拡大するため、評価額80億ドルで20億ドルを調達しました。 https://t.co/BwsSCQkYJ0
AIエージェント開発のMastra、1300万ドルを調達
- AIエージェント開発のためのTypeScriptフレームワーク「Mastra」が、シードラウンドで1300万ドルを調達したことを発表しました。
- 120以上のシリコンバレーのトップ投資家から資金を調達し、JavaScriptフレームワーク史上3番目の速さで成長していると報告されています。
- 日本でもユーザーが増加しており、今後の展開が注目されます。
Taro Fukuyama: 投資先のAIエージェント開発フレームワーク Mastra (@mastra_ai) が、$13Mの資金調達を発表しました。 昨年末に投資した時点ではまだアイデア段階でしたが、いまではJavaScriptフレームワーク史上3番目のスピードで成長しているそうです。 日本でもユーザーが引き続き増えています。
PLaMo翻訳、サブスクリプションサービスを開始
- 高精度な翻訳サービスとして知られるPLaMo翻訳が、サブスクリプションサービスを開始しました。
- これまでのブラウザ翻訳・テキスト翻訳に加え、WordやPowerPointなどのファイル翻訳機能が追加されています(PDFは品質の問題で延期)。
- 月額980円(税抜)のLiteプランなどが提供され、研究者や開発者からの支持を集めています。
いもす: PLaMo翻訳のサブスクリプション開始しました🎉 ブラウザ翻訳・テキスト翻訳に加え、ファイルの翻訳が追加されています。PDFは品質の問題で延期となりましたが、WordやPowerPointのファイルの翻訳もできるようになっています。是非使って応援してください🙏
Yuya Unno: 好評いただいているPLaMo翻訳のサブスクリプションサービスを開始しました
Takuya Akiba: PLaMo翻訳サブスクリプションサービスの開始おめでとうございます。Liteプラン課金してみました。応援してます! https://t.co/MQLAwBHvq9