2025年11月01日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Alibaba Qwen3 Max Thinkingの正式公開とAIツールの進化

今週のAI業界では、Alibabaが思考プロセスを可視化するQwen3 Max Thinkingを正式公開し、透明性向上に貢献しています。

AIエディタCursor 2.0がブラウザ機能を正式実装し、Microsoft CopilotはPC操作を自律実行するComputer Use機能を追加するなど、開発者向けツールの強化が進んでいます。

また、GPT-5 Proが希少疾患の治療法を独自提案し後の研究で裏付けられるなど、医療分野でのAI活用も進展しています。

それでは各トピックの詳細を見ていきましょう。

目次

  1. Alibaba、思考を可視化するQwen3 Max Thinkingを正式公開
  2. AIエディタCursor 2.0公開 ブラウザ内蔵など大幅強化【続報】
  3. LangChainが深層エージェント用CLIツールを発表
  4. MS Copilot、PC操作を自律実行するComputer Use機能を追加【続報】
  5. Sakana AIが専門家級AIエージェントの開発手法を公開
  6. Claude Code CLI続報、ネイティブインストーラーに移行
  7. GeminiとCanva、AIスライド生成機能を相次ぎ実装
  8. GPT-5 Proが希少疾患の治療法を独自提案、研究で裏付け
  9. 数学研究にAI活用の転換点、専門家が指摘

Alibaba、思考を可視化するQwen3 Max Thinkingを正式公開

  • 以前からお伝えしているAlibabaのQwen3シリーズの続報として、思考過程を可視化する「Max Thinking」バージョンが正式に公開されました。
  • 推論段階での詳細な思考プロセスを表示する機能により、解答の透明性向上が期待されています。
  • ユーザーからはすでに高い評価を得ており、Vectara Benchmarkへの掲載も間もなく予定されています。
Kol Tregaskes: (翻訳) Qwen3 Max Thinkingがリリースされました。

ʟᴇɢɪᴛ: (翻訳) Qwen 3 Max Thinkingがリリースされました。まもなくVBにも掲載されるはずです!

Chubby♨️: (翻訳) Qwen3 max thinkingが今日リリースされそうですね!

AIエディタCursor 2.0公開 ブラウザ内蔵など大幅強化【続報】

  • 以前ベータ版として紹介したAIコーディングエディタ「Cursor」のブラウザ機能が、バージョン2.0で正式にリリースされました。
  • エディタ内でブラウジングからテストまで一元化し、ページのスクリーンショットからデザイン改善の提案や、DOMエレメントとの対話も可能です。
  • その他、最先端のフロンティアモデルやマルチエージェントの並列実行にも対応し、開発ワークフローのさらなる効率化が期待されます。
Lee Robinson: (翻訳) Cursorに内蔵ウェブブラウザが追加されました。「アプリを起動して」と言えば、ターミナルでデベロップメントサーバーを実行し、ブラウザをlocalhost:3000に移動します。ページのスクリーンショットを撮影してデザインの反復作業ができ、DOMエレメントをプロンプト付きでエージェントに送信することもできます!

Lee Robinson: (翻訳) Cursor 2.0で可能になったこと:1. フロンティアモデルや独自エージェントモデルの使用 2. 内蔵gitワークツリーでのマルチエージェント実行 3. 1つのモデルで計画を作成し、別のモデルで実装 4. ワンクリックでレビュー+PRの作成 5. ノートPCを閉じてクラウドに引き継ぎ 次は何をすべきでしょうか?

LangChainが深層エージェント用CLIツールを発表

  • LangChainが「Deep Agents CLI」を発表、deepagentsパッケージを活用したコーディングCLIの実装例を公開
  • ユーザーの指示や指針を時間の経過とともに記憶するメモリ概念を実装し、文脈を維持した対話が可能
  • OpenAI/Anthropic以外のLLMも利用可能で、社内ファイアウォール内のツールも呼び出し可能な設計
Harrison Chase: (翻訳) 💻Deep Agents CLI deepagentsパッケージを使用して、deepagents上に構築できるコーディングアプリケーションの例として、シンプルなコーディングCLIを構築しました。時間の経過とともに指示やガイダンスを記憶するメモリの概念を追加しました。

Harrison Chase: (翻訳) 自分自身のモデルも使えます!モデルに依存しません

LangChain: (翻訳) 🚀 LangChainがAWS Generative AI Competency Partnerになりました。GenAIにおける技術的専門知識と顧客への影響力でAWSに認められた企業の小さなグループに加わります。LangSmith(エージェントエンジニアリングのプラットフォーム)がAWSマーケットプレイスで利用可能になりました。

MS Copilot、PC操作を自律実行するComputer Use機能を追加【続報】

  • 以前お伝えしたMicrosoft 365 Copilotの自律操作機能に関する続報です。
  • 「Researcher」機能に「Computer Use」が追加され、AIがセキュアな仮想マシン上でウェブ閲覧やPC操作を自律的に実行可能になりました。
  • これにより、保護されたWebサイトや非公開情報へのアクセスも実現します。
  • BrowseCompベンチマークで44%、GAIAベンチマークで6%の性能向上を達成し、より複雑なタスクに対応できるとしています。
Kol Tregaskes: (翻訳) Microsoft 365 CopilotのComputer Use機能を備えたResearcherが公開され、AIがセキュアなWindows 365仮想マシンを介してウェブコンテンツを自律的に閲覧・操作できるようになり、BrowseCompで44%、GAIAベンチマークで6%の性能向上を達成しました。

Sakana AIが専門家級AIエージェントの開発手法を公開

  • Sakana AIが専門家レベルのAIエージェント開発の基盤技術として「推論時スケーリング」と「ドメイン知識活用」の重要性を解説
  • 科学者エージェントやALE-Agent、DGMなど同社の実績あるエージェントに応用された技術的知見を共有

WandB Fully Connected Tokyo 2025での講演資料を公開し、AIエージェント開発コミュニティに貢献

Takuya Akiba: 今日の #WandB Fully Connected Tokyoの講演資料です! https://t.co/85hL3Zw9J6 AIエージェントを強力にするにはどうしますか?Sakana AIには "専門家級" のAIエージェントの開発実績があります。その実力の土台となる「推論時スケーリング」と「ドメイン知識の活用」のアプローチをまとめました。

Takuya Akiba: (翻訳) #WandB Fully Connected 2025 Tokyoで講演しました!Sakana AIの専門家レベルのエージェント(AIサイエンティスト、ALE-Agent、DGM)の背後にある主要アプローチを説明しました:推論時スケーリング + ドメイン知識。素晴らしいイベントをありがとうございました!

Robert Lange: (翻訳) 3.5時間後にDLCT @ml_collectiveで、発見のための進化的テスト時スケーリングを活用した最近の研究「ShinkaEvolve」について講演します。こんにちはと言いに来てください!P.S.:いつものように、@savvyRLさん、主催してくれてありがとう!

Claude Code CLI続報、ネイティブインストーラーに移行

  • AnthropicのAIコーディング支援ツール「Claude Code CLI」の続報です。インストール方法が従来のnpm経由からネイティブインストーラーに変更されました。
  • これによりNode.jsが不要となり、より簡単で安定した導入が可能になったとして、全ユーザーにこの新しい方法を推奨しています。
  • 最新のv2.0.31では、その他にWindows向けモード切替ショートカットの変更や、VSCode利用時のgitignore設定の追加なども含まれています。
Oikon: Claude Codeはnative installが正式なインストール方法になりました。 従来のnpm installではなくnative installが推奨されるとのこと。

Ian Nuttall: (翻訳) Claude Code v2.0.31がリリースされました 機能 - Windowsのモード切替ショートカットをShift+Tabに更新 - Vertexでのウェブ検索サポートを追加 - VSCodeのrespectGitIgnore設定を追加(デフォルトはtrue) 修正 - サブエージェント/MCPの「ツール名は一意である必要があります」エラーを修正 - /compactの失敗を...

Anthropic: (翻訳) Claude Codeのネイティブインストーラーが一般公開されました。より簡単で安定しており、Node.jsを必要としません。今後すべてのClaude Codeユーザーにデフォルトのインストール方法として推奨します。

GeminiとCanva、AIスライド生成機能を相次ぎ実装

  • GoogleのGeminiとデザインツールCanvaに、それぞれAIによるスライド生成機能が実装されました。
  • 両サービスともまだ性能向上が必要な段階ですが、プレゼンテーション作成の自動化がさらに進展しています。
  • ユーザーからは、既存のスライドを読み込ませてデザインテンプレートを自動生成する機能など、より実用的な機能の追加が期待されています。
まつにぃ: 実はGeminiもCanvaもスライド生成が出てきており、まあどこもあとはより性能の向上を待つだけなんですが、一番欲しいのは 「既存スライド→テンプレート」 何ですよね。 コードベースのテンプレートをゼロから作ると時間が足りなさすぎる。

まつにぃ: Sonnet4.5のdrawioの描写力すごく高い気がする。 めっちゃフロー図書けるからここでDifyのフローやりとりしてコードで作るのめっちゃ楽。

GPT-5 Proが希少疾患の治療法を独自提案、研究で裏付け

  • GPT-5 Proが食物アレルギー疾患FPIES(食物タンパク誘発性腸症候群)に対してデュピルマブ(IL-4Rα阻害薬)を治療法として独自に提案
  • 数週間後に査読付き研究論文で同じ知見が確認され、AIモデルが医療分野で専門家レベルの洞察を生み出せる可能性を示唆
  • 「ベンチマークでは測れない品質」をGPT-5 Proが示した実例として注目されている
Chubby♨️: (翻訳) 驚くべき話:GPT-5 Proは、食物タンパク誘発性腸症候群(FPIES)という希少で治療法のない食物アレルギーに対する潜在的治療法として、デュピルマブ(IL-4Rα阻害薬)を独自に提案しました。数週間後、査読付き研究でも同じ知見が確認されました:患者への投与で...

Haider.: (翻訳) GPT-5-ProがGPT-5と同じくらい高速で安価になるスイッチを押せると想像してみてください。AIに対する意見は一晩で変わるでしょう。Proを使っている人なら、ベンチマークがThinking版よりどれほど優れているかを捉えられないことを知っています。このモデルは品質と精度のために慎重に洗練され、回答され、反復されています。

数学研究にAI活用の転換点、専門家が指摘

  • 数学者たちが研究プロセスにLLMを活用する「転換点」に達したとの認識が広がる
  • 証明過程でLLMに命題の真偽を確認させる手法が一般化し、研究効率が大幅に向上
  • 「AIが必要とするが、AIはまだ我々を必要とする」と評され、人間の専門性とAIの組み合わせが新たな研究フェーズを形成
Kevin Weil 🇺🇸: (翻訳) @ErnestRyuに100%同意します—これは数学において、そしてより広く科学においてエキサイティングな時代です。

morgan —: (翻訳) 「私たちは、研究がAIによって大幅に加速されるが、AIがまだ私たちを必要とする、短いけれど楽しい時代に入った」

Kevin Weil 🇺🇸: (翻訳) @wtgowers、共有してもよければもっと詳細を聞きたいです!

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください