2025年05月22日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Claudeの新モデル発表へ期待高まる、国産LLMの躍進
本日はAnthropicがClaude新モデルの発表を予告し、業界の注目を集めています。7時間の自律作業や高度な推論機能を備える可能性が示唆されています。
一方、国内ではPFNが「PLaMo 2.0 Prime」を公開。性能向上と同時にAPI利用料を1/4以下に抑え、日本語処理で海外モデルを上回る成果を上げました。
NVIDIAは動画用電子透かし「Cosmos」や分散推論強化「Dynamo」を発表。その他MCPエコシステムの拡大やGrokの機能強化など多くの進展がありました。
それでは各トピックの詳細についてご覧いただきましょう。
目次
- Anthropic、Claude新モデル発表へ ライブストリーム予告【続報】
- 【続報】PFN、国産LLM「PLaMo 2.0 Prime」公開 高性能かつ低コスト実現
- NVIDIA、電子透かしCosmos発表 Dynamoは分散推論強化【続報】
- MCP続報: HF・DeepWikiサーバ提供、OpenAIはFC代替推奨
- Grok続報: Live Search活用例とiOS新機能
- Devstral、SWE-Bench高評価 HFでも公開【続報】
- OpenAI Responses API続報: DALL-E・Code Interpreter追加
- LM Arena1億ドル調達、AI幻滅期やMeta倫理問題も議論
Anthropic、Claude新モデル発表へ ライブストリーム予告【続報】
- Anthropicが本日、複数のライブストリームを予定しており、Claudeの新モデル発表への期待が高まっています(続報)。
- 新モデルはClaude 4やOpus 4とも噂され、7時間の自律作業能力や高度な推論機能を持つ可能性が示唆されています。
- 発表を前に、ClaudeのWebアプリケーションで新しいビルドが多数デプロイされる動きも観測されています。
Chubby♨️: (翻訳) Claude 4はおそらく7時間の自律作業が可能になるでしょう。よく考えてみてください。 (引用ツイート: 明日らしく、7時間の自律作業(opus)が可能で、sonnetがコーディングエージェントになるようです。もし本当ならとんでもないことですが、聞いたことには自信があります。)
Chubby♨️: (翻訳) これはおそらくClaude 4のライブストリームでしょう。Anthropicは今日2つのストリームを用意しています (引用ツイート: Anthropicは今日のために2つのライブストリームを準備しており、これ以上エキサイティングなことはありません https://t.co/j0eTDNTbFz)
Tibor Blaho: (翻訳) Claudeのイベントを前に良い兆候です(ここ数時間でかなりの数の新しいClaudeウェブアプリのビルドがデプロイされました)
【続報】PFN、国産LLM「PLaMo 2.0 Prime」公開 高性能かつ低コスト実現
- Preferred Networks (PFN) が、国産大規模言語モデルの最新版「PLaMo 2.0 Prime」を公開しました。これは以前報じた同社のLLM開発の続報となります。
- 従来モデルから性能を大幅に向上させつつ、API利用料金を1/4以下に低減したと発表されています。
- 日本語ベンチマークでは海外の有力モデルを上回るスコアを達成したとのことです。
- tokenizerも効率化され、文字あたりのコスト削減にも貢献しています。
Daisuke Okanohara / 岡野原 大輔: 本日、今回PLaMo 2.0 Primeを公開しリリースしましたhttps://t.co/nPSx68Zqds これについてブログ記事を書きました。 https://t.co/X0NaDP5yQs 性能を大きく改善する一方で(pfgenではフロンティアモデルに匹敵)、推論コストを抑え価格を1/4に設定しています。ぜひ、試してみてください! (引用ツイート: 【発表】国産LLM PLaMo™の最新...
ざぶろう: PFN の LLM が強く安くなりました! API の token あたりの料金が1/4以下になったのに加えて、tokenizer も効率的になっているので、文字あたりのコストはかなり下がっています! Chat UI で無料でお試しできるのでぜひご活用ください! (引用ツイート: 【発表】国産LLM PLaMo™の最新版PLaMo 2.0 Primeを公開、従来の1/4以下の価格で提供します。 ...
NVIDIA、電子透かしCosmos発表 Dynamoは分散推論強化【続報】
- NVIDIAがAI関連の新技術を複数発表しました。【続報】
- SynthID技術を活用し動画コンテンツに電子透かしを付与する「NVIDIA Cosmos」が新たに公開されました。
- また、既報のAI基盤「NVIDIA Dynamo」については、オープンソースAIエコシステムのllm-dコミュニティと協力し、大規模分散推論を加速する技術として強化されたことが発表されました。
- 同社CEOはAIファクトリー市場が将来的に年間10兆ドル規模に成長するとの予測も示しています。
NVIDIA AI Developer: (翻訳) #NVIDIACosmos がどのように動画にウォーターマークを付けて、SynthIDが埋め込まれたコンテンツをウェブ全体に拡大しているかをご覧ください。👇 (引用ツイート: SynthID – 当社の画期的なデジタルウォーターマーキング技術 – はすでに100億回使用されています。🌍 本日、デジタルコンテンツの一部がGoogleのAIツールによって生成されたかどうかを迅速に特定するた...
NVIDIA AI Developer: (翻訳) この発表に関する最新のブログをお読みください - NVIDIA Dynamoがllm-dコミュニティの大規模分散推論推進イニシアチブを加速 ➡️ https://t.co/F15zQjN9V4 (引用ツイート: llm-dプロジェクトは#opensource AIエコシステムにとって大きな前進であり、ジェネレーティブAIにおけるイノベーションの触媒としてのコラボレーションへのコミットメ...
パウロ: 革ジャン、AIファクトリーは年間10兆ドル市場に成長 うひょー 以下、引用 AIファクトリー産業はまだ始まったばかりだと語った。約10年後には、AIインフラやAIファクトリーの市場規模は数千億ドルから10兆ドル以上に拡大すると予測されています。 https://t.co/tFNKpWc3Fz https://t.co/bOFQZZ2i70
MCP続報: HF・DeepWikiサーバ提供、OpenAIはFC代替推奨
- Model Context Protocol (MCP) のエコシステム拡大に関する続報です。
- OpenAI Cookbookに新たに追加されたチュートリアルでは、Responses API経由でのMCP利用方法に加え、従来のFunction callingの問題点を指摘しMCPへの移行を促す内容が盛り込まれました。
- また、Hugging FaceとDeepWikiもMCPサーバの提供を開始し、エコシステムのさらなる普及が期待されます。
ぬこぬこ: OpenAI Cookbook に Responses API 経由で MCP を使うチュートリアルが追加されていた 内容がとても丁寧でわかりやすいのはさながら、Function calling の問題点をあげているので以後 MCP 移行待ったなしの印象を受けた https://t.co/ZnZbe3rYmJ https://t.co/AI0eEL3Vjg
Itomaru | いとまる: Hugging Face MCP server 🤗 https://t.co/urMV5Y89nC https://t.co/0Cv98ZORmB
ぬこぬこ: DeepWiki のリモート MCP サーバきた! https://t.co/7r1aWG1YsQ https://t.co/ZYFBNgRI3f
Grok続報: Live Search活用例とiOS新機能
- xAIのAIモデル「Grok」に関する続報です。
- 既報のGrok APIリアルタイム検索「Live Search」について、Google I/Oの情報をまとめるなどの具体的な活用例が開発者から報告されています。
- GrokのiOSアプリでは、新たなVoice UI設定やチャート生成機能が追加され、機能強化が進んでいます。
まつにぃ: xAI Live Search API β版が登場。 GrokがX・Web・ニュースをリアルタイムに検索し回答します。 search_parameters.mode で検索のON/OFFが可能で、max_search_results で絞込出来ます。 6月5日まで無料なのでいっぱい試しましょう。 (引用ツイート: Attention devs: the xAI API just got A ...
石川陽太 Yota Ishikawa: xAIの新しいLive Search APIを使って、Google I/Oの内容をまとめてもらったら、かなりいい感じだった👀時間は20秒程度 https://t.co/o6RCvbFw1Q (引用ツイート: Attention devs: the xAI API just got A LOT smarter. With Live Search, Grok can now search throu...
Tech Dev Notes: (翻訳) Grok iOSアプリでチャートが生成できるようになりました! https://t.co/hwTsQte1xE
Devstral、SWE-Bench高評価 HFでも公開【続報】
- Mistral AIのコーディング特化モデル「Devstral」の続報です。
- SWE-Bench Verifiedで46.8%のスコアを記録し、GPT-4.1-miniなどを上回る性能が報告されました。
- Apache 2.0ライセンスで公開され、Hugging Faceのモデルハブから4bit量子化版なども利用可能です。
まつにぃ: 新たなモデルDevstralはMistral×AllHandsAIの24BパラメータLLMです。 SWE-Bench Verified46.8%でGPT-4.1-miniを20pt超えで、DeepSeekやR1も超えています。 Apache2.0で公開されています。 API価格はSmall3.1と同じ。 (引用ツイート: Meet Devstral, our SOTA open model d...
Awni Hannun: (翻訳) MistralのDevstral 4ビットDWQモデルがHugging Faceにアップロードされました。mlx-community/Devstral-Small-2505-4bit-DWQ M2 Ultraで快適に動作します: https://t.co/mqd5zUSUOy
jian: (翻訳) devstral aider 6.7% (全体), 5.8% (差分) (引用ツイート: コーディングエージェント専用に設計されたSOTAオープンモデルDevstralをご紹介します。@allhands_ai と共同開発しました https://t.co/LwDJ04zapf https://t.co/Mm4lYZobGO)
OpenAI Responses API続報: DALL-E・Code Interpreter追加
- OpenAIのResponses APIの機能強化に関する続報です。
- 既報のMCPサポートに加え、画像生成(DALL-E)やCode Interpreterなどの主要ツールが新たに統合されました。
- さらにバックグラウンドモードの追加や推論モデルでのファイル検索対応など、開発者向け機能も充実。より高度なAIアプリケーション開発が可能になります。
Kazuhiro Sera (瀬良): 🚀OpenAI の Responses API アップデート: ・ツールにリモート MCP サーバー、画像生成、Code Interpreter を追加 ・バックグラウンドモードを追加 ・リーズニングモデルでファイル検索が利用可能に こちらのデモ動画をぜひご覧ください! 他の細かい機能も含めた日本語での解説も予定しています💪 (引用ツイート: Here’s @nikunjhanda and ...
LM Arena1億ドル調達、AI幻滅期やMeta倫理問題も議論
- AIモデルの評価プラットフォームを提供するLM Arenaが、6億ドルの評価額で1億ドルの資金調達を実施したと報じられています。
- 一方で、AI技術の実際の事業インパクトが期待ほどではないとする「AI幻滅期」の声や、Metaが開発中とされるAIコンパニオンの倫理的な問題(性的会話の許容など)も議論を呼んでいます。
- その他、GoogleがWebUI自動生成ツール「Stitch」のβ版を公開したり、ChatGPTに医療機関向けのHIPAA準拠プラン「Quorum」が登場する可能性が示唆されるなど、多岐にわたる動きが見られます。
clem 🤗: (翻訳) @Gradio(そして素晴らしいチーム、トピック、分野へのインパクト)を使えば、6億ドルのスタートアップを築けます! @lmarena_ai おめでとうございます、本当に素晴らしいです。あなたが何を築くのか楽しみにしています! https://t.co/Kv3pjlzDzw
Yuta Kashino: Welcome to the AI trough of disillusionment https://t.co/eBPqu8jUCN コレな…。AIプロバイダーやビッグテックはLLMの技術革新を喧伝するが、結局未だに人間を介したチャット止まりで、多くの事業会社は自身の事業へのインパクトが小さすぎて幻滅してきたそう。
Yuta Kashino: これ,ザッカーバーグが,AIコンパニオンを利用して,またまた人のアテンションを収奪させる商売を始めてる,ということなんですよ….映画の"her/世界でひとつの彼女"のよりも,人をもっと中毒化させ依存させることで儲けるやつ… (引用ツイート: Meta’s ‘Digital Companions’ Will Talk Sex With Users—Even Children https://t.co...