2025年04月29日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Qwen 3の高性能と続々進むAI開発・活用の最新動向
今週のAI業界では、AlibabaのLLM「Qwen 3」が高性能で注目を集めています。MCP対応も強化され、オープンソースコミュニティへの貢献が評価されています。
また、xAIがGrok 3.5の早期ベータ版を来週限定公開すると発表し、専門分野での能力を強調。企業でのAI活用も加速し、マッキンゼーは独自AI「Lilli」を社内展開し7割の社員が活用中です。
AI開発ツールやスタートアップ資金調達も活発で、Scale AIの評価額$25B到達やAI研究分野の新たな発見も報告されています。それでは各トピックの詳細を見ていきましょう。
目次
- AlibabaのLLM「Qwen 3」続報、高性能で高評価
- xAI、Grok 3.5早期ベータ版を来週限定公開【続報】
- MCP続報: Qwen 3対応や開発者の関心高まる
- AI開発ツール動向: Cursor生成量報告、v0再現性、Windsurf拡充等
- Scale AI評価額$25Bへ AIスタートアップ資金調達続く
- マッキンゼー社内AI活用、ゼロクリック検索増加も
- オープンソースAI動向: Alibaba Qwen 3公開、Hugging Faceロボハッカソン告知
- Gemini Tips: Sheets連携や論文実装デモが話題に
- AI研究動向:VAD限界、LLM操作実験、経験の時代
AlibabaのLLM「Qwen 3」続報、高性能で高評価
- 先日公開されたAlibabaのLLMファミリー「Qwen 3」の続報です。
- 最大モデルQwen3-235B-A22Bは、o1やGemini 2.5 Proに匹敵する性能との報告があります。
- 新たにMCP (Model Context Protocol) のサポートも明らかになりました。
- 多くの開発者から性能や実行速度について高い評価の声が上がっており、vLLMでも利用可能になっています。
clem 🤗: (翻訳) Qwen3をご紹介! 最新の大規模言語モデルQwen3をリリースし、オープンウェイトで公開します。これには、0.6Bから235Bまでの6つのDenseモデルと2つのMoEモデルが含まれます。フラッグシップモデルのQwen3-235B-A22Bは、コーディング、数学、一般的なベンチマーク評価で競争力のある結果を達成しています。
Junyang Lin ✈️ ICLR: (翻訳) Qwen3がついに登場!安定したトレーニングでRLをスケーリングする方法、異なるドメインからのデータのバランスをとる方法、パフォーマンスを維持しながらより多くの言語のサポートを増やす方法など、派手ではないいくつかの問題を解決する方法を見つけるのに、私たちのチームは本当に時間がかかりました。
Kaggle: (翻訳) 🤖 #KaggleModelsに登場! 待望の@Alibaba_QwenのQwen 3が登場 - 119言語にわたる36Tトークンでトレーニングされたdense + MoEモデルを搭載。推論、パフォーマンス、およびロングコンテキスト(32kトークン)サポートで大きな進歩! 詳細はこちら: https://t.co/R7DVJsMXzV
xAI、Grok 3.5早期ベータ版を来週限定公開【続報】
- xAIのElon Musk氏は、Grok 3.5の早期ベータ版を来週SuperGrok購読者向けにリリースすると発表しました。【続報】
- 同氏は、このモデルがロケットエンジンや電気化学といった専門的な技術質問に正確に答えられる初のAIであり、第一原理からの推論能力を持つと強調しています。
- Grok 3.5の具体的なリリース時期と特徴が明らかになり、性能向上が期待されます。
Kol Tregaskes: (翻訳) Grok 3.5 ベータ版が来週、SuperGrokユーザー限定で登場。「ロケットエンジンや電気化学に関する技術的な質問に正確に答えることができる」。Premium+ユーザーもSuperGrokユーザーだと思いますが? https://t.co/XE9WfFLrkj
Chubby♨️: (翻訳) 1) 何だって? Grok 3.5が来週! ロケットエンジンや電気化学に関する技術的な質問に正確に答えられる初のAIだ! 加速している! https://t.co/iTUGYS4CEO
TestingCatalog News 🗞: (翻訳) 速報🚨: Grok 3.5が来週、SuperGrok購読者向けにリリースされます。 再びリードを奪うでしょうか? https://t.co/8dqLmthW2B
MCP続報: Qwen 3対応や開発者の関心高まる
- AIエージェント連携プロトコルMCPに関する議論の続報です。
- AlibabaのQwen 3がMCPサポートを強化したと発表されました。
- 開発者からはMCP入門の難しさやBigQueryでの実装、LMstudioでの対応希望など、具体的な活用や実装に関する声が上がっています。
- MCPサーバー実装リストも共有されるなど、エージェント開発における標準化への関心が続いています。
Itomaru | いとまる: Qwen3 now supports MCP、✍️
野川の側: GWでMCP入門しようと思ったけど、早々に挫折した。勉強不足すぎてわかんねーってなった
Philipp Schmid: (翻訳) これまでに使用およびテストしたトップ12のMCPサーバーは次のとおりです: - Pythonコードインタープリター:PyodideとDenoを使用してサンドボックスでPythonコードを実行し、分離します。https://t.co/pCg6e7k29F - Webフェッチャー:JavaScriptをサポートするPlaywrightヘッドレスブラウザーを使用してWebページのコンテンツ...
AI開発ツール動向: Cursor生成量報告、v0再現性、Windsurf拡充等
- AI開発ツールの動向です。AIコーディングツールCursorについて、1日10億行のコード生成・採用報告がありましたが、LOC指標の妥当性には注意が必要です。
- VercelのUI生成ツールv0が、他の類似ツールよりウェブサイトデザインの再現性に優れているとの意見が見られます。
- AI開発支援ツールWindsurfは無料プランを拡充し、OpenAIモデルの割引提供を開始しました。
- ローカル環境でLLMを実行できるLMstudioも注目されています。
TestingCatalog News 🗞: (翻訳) Windsurfは新しいロゴと無料ユーザー向けの多くのアップグレードを取得しました - より多くのプレミアムクレジット、無制限のフルエージェント、無制限の高速タブなど。OpenAIモデルには割引が適用されます。 M&Aの準備? https://t.co/PmM4DFBipg
Tech Dev Notes: (翻訳) v0、bolt、lovableを試しました。v0は他の2つよりもウェブサイトデザインの複製において 훨씬優れています。
Miles Brundage: (翻訳) 看板を叩く https://t.co/oXahLXMqyk https://t.co/PL8QnrEpYW
Scale AI評価額$25Bへ AIスタートアップ資金調達続く
- AI関連スタートアップへの投資が引き続き活発です。
- データラベリング大手Scale AIが、目標未達ながら評価額$25Bでの株式売却に近づいていると報じられました。
- 一方で、2年前に$100Mを調達したVector DBのPineconeの例から、AI分野のハイプサイクルの速さも指摘されています。
- その他、AIデバッグツールLightrun ($70M)、AIアニメ生成Cheehoo ($10M)、AIタレントエージェントDex (a16zが出資) なども資金調達を発表しました。
The Information: (翻訳) 投資家は依然として強気です!Scale AIは、目標未達にもかかわらず、株式売却で評価額250億ドルに近づいており、前年比80%増となっています。💰 投資家が依然としてScale AIに大きく賭けている理由をご覧ください:https://t.co/yHgpPjF368 #VentureCapital
久保田 雅也@Coalis: Pinecornにa16zが$100m出資したのが2年前。やがてVector DBはクラウドが標準実装し、単体スタートアップのハイプは1年で成熟した。AIコモディティ化の速さよ。
Tetsuro Miyatake: (翻訳) コードのデバッグをするプラットフォームを提供するLightrunが$70M調達を発表した。 AT&T、Microsoft、Salesforce、SAPなどが利用していて、ローンチしてから売上が4倍成長したとのこと。 https://t.co/ULZtTg5iLo
マッキンゼー社内AI活用、ゼロクリック検索増加も
- 企業におけるAI活用が具体化しています。
- マッキンゼーは社内文書10万件で学習したAI「Lilli」を構築し、社員の7割が利用していると報告されています。
- また、AI検索の普及により検索結果をクリックしない「ゼロクリック検索」が増加し、情報発見のあり方が変化しているとの分析もあります。
久保田 雅也@Coalis: マッキンゼーは100 年の業務経験と10 万の社内書類にで学習させた社内 AI (Lilli) を構築し、社員4.5万人の7割が定期的に利用している AIが考えて、コンサルタントが売る。人間に残された「翻訳」「信用」というレイヤー https://t.co/1NdrbNTRng
Tetsuro Miyatake: (翻訳) Shopifyに続きDuolingoのCEOがAIを利用する重要性についての社内メモを出した。 生産性を上げるためだけではなく、コンテンツ制作を大幅に改善することや今まで開発できなかった機能を導入することが可能になり、それに合わせて業務委託者の活用を考え直すとのこと。 https://t.co/RrpG32SQ5M https://t.co/rxrlNxO9hi
久保田 雅也@Coalis: 検索時にクリックしないゼロクリックユーザーが爆増中(Source: Bain) 8割の検索ユーザーは検索結果の4割以上をAI要約に依存している AIによってインターネット上のディスカバリー体験そのものが激変している https://t.co/SpoValcCdB
オープンソースAI動向: Alibaba Qwen 3公開、Hugging Faceロボハッカソン告知
- オープンソースAIコミュニティの活動が続いています。
- Alibabaが新たな大規模言語モデル「Qwen 3」をリリースし、オープンソースへの貢献を示しました。
- Hugging Faceは、先日公開した3Dプリントロボットアーム「LeRobot」に関連し、世界規模のロボティクスハッカソンの開催を告知しました。
Tetsuro Miyatake: (翻訳) Hugging Faceが3Dプリントされたロボットアームを$100で販売する予定。 https://t.co/wGIbBBONcY https://t.co/c5KPYr445R
ぬこぬこ: (翻訳) @OpenAI の招待制 Open Model Listening Session に参加し、いくつかコメントを寄せることができました。オンラインでしたが、OpenAI チームにお会いできて光栄でした。オープンウェイトモデル(ローカル LLM)のリリースを心待ちにしています。私は https://t.co/OtMnYijuTP
Thomas Wolf: (翻訳) おそらく2025年のロボティクスで最もエキサイティングなイベント 私たちの最初のワールドワイドハッカソン Hugging Faceの「LeRobot-worldwide-hackathon」組織に登録してください https://t.co/tfLldrjtWG
Gemini Tips: Sheets連携や論文実装デモが話題に
- GoogleのGeminiに関する便利なTipsが共有されている。表形式の出力をGoogle Sheetsに直接エクスポートできる機能が地味に便利だという声がある。
- Jeff Dean氏はGemini 2.5 Proが研究論文を読み込み、TensorFlow.jsで実装しCanvasで可視化、デバッグまで行うデモ動画を紹介し、その能力の高さを示した。
- 一方で、ユーザーの指示に対してGeminiが独自の判断で変更を拒否するケースも報告されており、その「知能」が話題になっている。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: Geminiの表のExport to Sheets機能地味に便利です 表形式の出力をGoogleシートに出力できるので表として編集したり、パワポなどに表として貼り付けできます https://t.co/u3B1MtxKLz
Jeff Dean: (翻訳) 「この論文の実装をTensorflow.jsを使って書き、Canvasでトレーニングを視覚化してください。」 ありがとう、Gemini!
na0: Gemini は拒否してくれる知能
AI研究動向:VAD限界、LLM操作実験、経験の時代
- AI関連の技術的な議論や実験報告も行われています。
- LLMを活用したセマンティックVAD (音声区間検出) は、発話の区切りを意味的に判断できますが、人間の発話の微妙な違いを捉えきれない限界も指摘されています。
- チューリッヒ大学がAIボットを用いてRedditユーザーの意見を秘密裏に操作する実験を行い、誤情報を用いた場合に高い効果が見られたとの報告が話題になりました。
- また、AIが人間データ学習の限界を超え、環境との対話から自ら経験を生成して学ぶ「経験の時代」の到来を論じるDavid Silver氏らの論文も紹介されています。
Justin Uberti: (翻訳) ええ、これは発話のLLMの理解を活用して不完全な文を検出する、別の形式のセマンティックVADです。ただし、ユーザーは有効な文の区切りで一時停止することがあるため、このアプローチは完全ではありません。最終的には、VADの評価とベンチマークが必要です。
Tech Dev Notes: (翻訳) redditで心を操るllm:
Shinichi Takaŷanagi: David Silver氏、Sutton先生による論文。AIは人間データ学習の限界を越え、環境と対話し自ら経験を生成して学ぶ「経験の時代」へ。長期ストリーム・リッチな行動/観測・環境からの報酬・世界モデルで、超人的能力と新発見が加速 Welcome to the Era of Experience https://t.co/uNvjegZPsb