2025年05月31日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
主要AIプレイヤーの機能強化と業界の変革
Grokの画像機能・カレンダー連携開発、Claude 4 OpusのSimpleBench首位獲得、Geminiのメール要約・Canvas強化など、主要AIプレイヤーの機能拡充が進んでいます。
一方で、AnthropicのCEOやGeoffrey Hinton氏がAIによる雇用変革を警告し、対策の必要性を訴えています。中国では米国の輸出規制下でも国産チップへの移行と独自モデル開発が加速しています。
それでは各トピックの詳細を見ていきましょう。
目次
- Grok続報: 画像/カレンダー連携やワールドモデル開発に期待
- 続報:Claude 4 Opus SimpleBench首位 Code活用も進展
- Gemini新機能: メール要約、Canvas強化、Liveカメラ共有など【続報】
- 【続報】AI雇用変革論、Anthropic CEOらが警鐘
- Kaggle: 新形式Hackathons発表、LLMコンペ振り返りも
- OpenAI o3 Proテスト情報更新、GPTs戦略変更を示唆
- 中国AI 国産チップへ移行加速、独自モデル開発も 続報
- LLM-jp-3.1続報:13Bモデル評価と国内LLM研究の現在地
- AIエージェント開発ツール続報 Postman、Responses API、Jules進化
- AI動向 Meta軍事XR開発、TSMC新工場、ElevenLabs新版
Grok続報: 画像/カレンダー連携やワールドモデル開発に期待
- Grokに関する続報です。
- Web UIでは「Images Explorer」、Markdownエディタでの画像アップロード、Google Calendar連携といった新機能が開発中と報じられています。
- プロファイルアイコンの位置変更や、操作がない場合の星空表示演出も予定されています。
- さらに、Grokから年内にワールドモデルが登場するとの期待も高まっています。
Tech Dev Notes: (翻訳) Grok WebにまもなくImages Explorerが搭載されます! https://t.co/Ko8b7imFZM
Tech Dev Notes: (翻訳) Grok WebにまもなくMarkdownエディタで画像をアップロードする機能が搭載されます! https://t.co/PbIKXq8TIX
Tech Dev Notes: (翻訳) grokから今年ワールドモデルが登場するでしょう: https://t.co/qlcheO96DF
続報:Claude 4 Opus SimpleBench首位 Code活用も進展
- AnthropicのClaude 4 Opusに関する続報です。
- LLM評価ベンチマーク「SimpleBench」で、OpenAIのChatGPT o3モデルやGoogleのGeminiを上回り首位を獲得したと報じられました。
- 開発者の間では、VS CodeのCopilot Pro経由や直接のAPI利用を含め、Claude Code (Sonnet 4, Opus 4) をリファクタリングやIssueトリアージなどに活用する動きが活発化しています。
- AnthropicのAlex Albert氏もユーザーからのフィードバックを歓迎しており、さらなる改善が期待されます。
ʟᴇɢɪᴛ: (翻訳) Claude 4 OpusがSimpleBenchで1位を獲得🏆 o3-highやgeminiよりかなり高いスコアです https://t.co/uwZl7QnYcl
Kenn Ejima: AIコーティング情報多すぎてよくわからん!とか、以前試したけど使い物にならんかった!という人は今すぐVS Codeで10ドル払って(学生は無料)Github Copilot Proに入り、Claude Sonnet 4のAgentモードで適当にリファクタリングやらせてみて。驚かなかったら自分が10ドル払います。
Alex Albert: (翻訳) ここには本当に素晴らしいフィードバックがいくつかあります!指摘された多くの点に対処するため、すでに多くのワークストリームが進行中です :)
Gemini新機能: メール要約、Canvas強化、Liveカメラ共有など【続報】
- GoogleのAI「Gemini」に関する新機能の続報です。
- Gmailなどで長いメールを自動要約する機能(オプトアウト可能)が提供開始されました。
- Gemini APIとの連携も可能なCanvas機能が大幅にアップデートされました。
- Geminiモバイルアプリの「Gemini Live」では、カメラや画面共有機能が全ユーザーに提供開始されました。これは以前報じられたAndroid展開に続くものです。
- Google Drive内の動画ファイルを解析する機能も、エンタープライズ向けに展開されています。
- Google I/Oで発表されたADK (Agent Development Kit)やAgent Engineなど、開発者向けツールの強化も進んでいます。ADKは以前の公開に続き、さらなる機能強化が図られています。
TechCrunch: (翻訳) Geminiは、オプトアウトしない限り、長いメールを自動的に要約するようになります | TechCrunch https://t.co/SDx5SUaPIO
ChatGPT研究所: Geminiの『Canvas機能』が大幅アップデート! 直近のアプデによりCanvasでできることの幅が大きく広がりました。 作成したアプリにワンクリックでGemini APIを組み込んだり、内容をもとにクイズを自動生成することも可能に。 機能の詳細と活用事例を記事にまとめました👇 https://t.co/UIyCr0fh44
Google Gemini App: (翻訳) Gemini Liveでカメラと画面を共有する機能が、AndroidおよびiOSのすべてのGeminiユーザーにご利用いただけるようになりました。開始するには:1️⃣ モバイルデバイスでGeminiアプリを開きます 2️⃣ Gemini Liveアイコンをタップします 3️⃣ カメラまたは画面共有アイコンをタップして、表示されているものについて話し始めます
【続報】AI雇用変革論、Anthropic CEOらが警鐘
- AIによる雇用への影響に関する議論が続いています。
- 新たに、AnthropicのCEOであるDario Amodei氏が、今後1~5年でエントリーレベルの仕事の多くがAIに置き換わる可能性を指摘し、対策としてAI企業への課税も提案しています。
- また、AI研究の権威Geoffrey Hinton氏も、AIによる大規模な失業の可能性を示唆し、警鐘を鳴らしています。
- これらの発言は、AIが社会経済構造に与える変化への備えの重要性を改めて示しています。
Chubby♨️: (翻訳) ダリオ・アモデイ氏:1~5年後には、ほぼすべてのエントリーレベルの仕事はおそらくなくなるでしょう。AIの開発を止めることは不可能です。さもなければ千葉がアメリカを追い抜いてしまうでしょう。ジレンマです。https://t.co/5R4rAI1kvF
Geoffrey Hinton: (翻訳) これから何が起こるかについての様々な人々の見解をまとめた素晴らしい動画を見ました: https://t.co/OyvbzUqNKZ
Charly Wargnier: (翻訳) #AI はまもなく失業率を10~20%に押し上げる可能性があります。エントリーレベルのホワイトカラーの仕事の半分は5年以内に消えるかもしれません。@AnthropicAI のCEOははっきりと述べています:「AI企業に課税する必要があるかもしれません」「AIバスを止めることはできないと思います」 https://t.co/2GJP4mAsz0
Kaggle: 新形式Hackathons発表、LLMコンペ振り返りも
- Kaggleが、オープンエンドで実践的・創造的な課題に取り組む新しいコンペ形式「Kaggle Hackathons」を発表しました。アプリ開発やLLMプロジェクトなど、多様なスキルが試されます。
- また、Kaggle Drawing with LLMsコンペの振り返り記事も公開され、上位解法や評価指標のハックの歴史がまとめられています。
- 【続報】既報の「Detect Behavior with Sensor Data」コンペについて、Child Mind Instituteが主催し、賞金総額が50,000ドルであることが明らかになりました。
Kaggle: (翻訳) 📣 コンペティション開始アラート!@childmindinst主催「センサーデータによる行動検出」。ウェアラブルデバイスのデータを使用して、身体に焦点を当てた反復行動を検出するモデルをトレーニングします。💰 賞金総額50,000ドル ⏰ 応募締切:2025年8月26日 https://t.co/t2MG2XSrE7
Kaggle: (翻訳) 📢 オープンエンドで実践的かつ創造的な課題に対応する新しいコンペ形式「Kaggle Hackathons」をご紹介します。アプリ開発、メトリック設計、LLMプロジェクト、教育コンテンツなどを通じてスキルを披露しましょう! https://t.co/aKInDxX8Hc
こへっち: めちゃくちゃ良いまとめ記事! 解法だけじゃなくて評価指標のハックの歴史も分かりやすいし、1〜3位の解法もどれも美しいなぁ… (引用ツイート: お絵描きコンペの振り返り記事を書きました! Kaggle Drawing with LLMs 振り返り & 上位解法まとめ|ちくわぶ https://t.co/fzauvKTBNc #zenn)
OpenAI o3 Proテスト情報更新、GPTs戦略変更を示唆
- OpenAIの高性能モデル「o3 Pro」のテストに関する続報として、スクリーンショットを伴う情報が再び報じられました。リリース時期は依然不明です。
- OpenAI従業員とされる人物から「GPTsの世界は今後数ヶ月で変わる」「GPT-5の価格や競争力、GPTsの戦略は常に変化している」との発言が共有されました。
- CEOのSam Altman氏のツイートを引用し、同社が夏季休暇を返上して開発に取り組んでいる可能性も示唆されています。
TestingCatalog News 🗞: (翻訳) o3 Proがテストで目撃されました 👀 https://t.co/5qgrT3eZUq
morgan —: (翻訳) GPTは死んでいません:「GPTの世界は今後数ヶ月で変わるでしょう」 https://t.co/tNjbiYrqg5
Kol Tregaskes: (翻訳) OpenAIに夏休みはないようですね? https://t.co/YHleiXmImX (引用ツイート: @patience_cave 今年の夏はあまり休みがないと思う…)
中国AI 国産チップへ移行加速、独自モデル開発も 続報
- 米国の輸出規制が続く中、中国でAIチップの国産化と独自AIモデル開発が加速しているとの続報です。
- Artificial Analysisのレポートによると、中国にはDeepSeekやAlibabaなど10以上のアクティブなAI研究所があり、高性能モデルを開発。特に「DeepSeek R1」は高評価を維持しています。
- 一部企業では、NVIDIA製チップからHuawei製などの国産チップへの切り替えを3ヶ月程度で完了する事例も報告されており、国産シフトが鮮明になっています。
Chubby♨️: (翻訳) はっきり言います。中国は追いついてきています。チップの禁輸措置は機能していません。中国は独自の機能する生産ラインを持っています。将来、中国のモデルが競合他社を追い抜くのを見ても驚かないでしょう。 https://t.co/Z9LFL0yJmb
パウロ: (翻訳) 最適化なしの切り替えは簡単です。最適化ありの切り替えには1年かかると思います。 (引用ツイート: これはちょっと怖いです。中国企業がNVIDIAからHuaweiに切り替えるのに3ヶ月しかかかりません。 https://t.co/GDAY2uasBH)
Rohan Paul: (翻訳) Artificial Analysisによる2025年第2四半期 中国AI状況レポート🇨🇳。中国のエコシステムには、DeepSeek、Alibaba、ByteDance、Tencent、Moonshot、Zhipu、Stepfun、Xiaomi、Baichuan、MiniMax、01.AIなど、少なくとも10のアクティブなラボがあり、すべてが高い知能スコアを持つモデルに貢献しています ...
LLM-jp-3.1続報:13Bモデル評価と国内LLM研究の現在地
- 先日リリースが報じられた国産LLM「LLM-jp-3.1」について、詳細情報が入りました。継続事前学習の追加と事後学習の改善により、指示追従性が大幅に向上しています。
- 開発者からは、特に13Bモデルが手元で扱えるサイズでありながら有望な性能を持つと評価されています。
- また、日本のLLM基礎研究については、公開技術の再実装は比較的迅速に行えるものの、新規技術開発には更なる努力が必要との見解が示されました。
龍一郎 (f.k.a Asei Sugiyama): この取り組みは継続してさまざまな手法を試していてとても偉い、技術的な検証も重要だし、言語資源があることも、さまざまな手法を試せるデータセットが作成できることも無料で手に入るものではないから (引用ツイート: LLM-jpモデルのラインナップに「LLM-jp-3.1」シリーズが追加されました。本シリーズでは、継続事前学習の追加およびinstruct4による事後学習の改善により、指示追従性が大幅...
Odashi: llm-jp-3.1 13Bはお手元サイズのLLMではかなり有望な性能な気がします。
Odashi: 他人と会話するとよく「日本はLLMの基礎研究で2,3年ビハインドしてますが」と聞かれますが、公開技術に関してはarXivに全部出てしまう関係上、単純に再実装の準備期間くらいしかビハインドはないです。一方で純粋に新規技術を開発するという点ではもう少し努力が必要じゃないでしょうか。
AIエージェント開発ツール続報 Postman、Responses API、Jules進化
- AIエージェント開発ツールの進化に関する続報です。
- PostmanのAIエージェントビルダーにより、既存APIをMCP(Model Context Protocol)サーバーへ変換可能になりました。
- Kevin Weil氏が紹介したResponses APIのアップデートでは、リモートMCPサーバー、画像生成、Code Interpreterといった新ツールが追加されました。
- コーディング支援エージェントJules SWE Agentは、1日あたりの無料タスク上限を60に拡大し、利用しやすくなりました。
Itomaru | いとまる: PostmanのAIエージェントビルダーを使えば10万以上のAPIをわずか数秒でMCPサーバーに変えられる、と ✍️ https://t.co/r9SFIidkNt
Kevin Weil 🇺🇸: (翻訳) ⚡️ (引用ツイート: 5月は忙しい月でした!🥵 いくつかのハイライト:製品アップデート Responses APIの新しいツールと機能。3つの新しい組み込みツールを導入しました:リモートMCPサーバー、画像生成(ストリーミングとマルチターン編集あり)、コードインタプリタ(モデルがPythonを記述できるようにするため) https://t.co/G0BfQ7mrg4)
TestingCatalog News 🗞: (翻訳) 速報🚨: Jules SWE Agentが1日60タスク無料になりました!新しい制限:- 同時5タスク - 1日あたり合計60タスク - 1日あたり5コードキャスト https://t.co/8O4ZlxC2K8
AI動向 Meta軍事XR開発、TSMC新工場、ElevenLabs新版
- Meta社とVRヘッドセットOculusの創業者であるPalmer Luckey氏が再び提携し、米軍向けのXR(拡張現実)デバイスを開発すると報じられました。Luckey氏は「兵士をテクノマンサーに変える」と意気込みを語っています。
- 半導体受託製造最大手のTSMCが、アラブ首長国連邦(UAE)に先端半導体工場の建設を検討しており、トランプ政権関係者と協議したとBloombergが報じました。
- 音声合成AIのElevenLabsは、Conversational AI 2.0を発表。言語切り替えやマルチキャラクターモードなどエンタープライズ向け機能を強化し、EUデータレジデンシーにも対応しました。
TechCrunch: (翻訳) Metaとパーマー・ラッキーが再び提携。今回は米軍向けの拡張現実デバイス開発を目指す。「私の使命は長年、兵士をテクノマンサーに変えることであり、Metaと共に開発している製品はまさにそれを実現するものです」とラッキー氏は発表の投稿で述べた。 https://t.co/joHtqpOa1U
Bloomberg (@business): (翻訳) TSMCはアラブ首長国連邦に先端生産施設を建設することを評価しており、トランプ政権の当局者と可能性について協議しています https://t.co/qWTbLN7ajg
TestingCatalog News 🗞: (翻訳) ElevenLabsがConversational AI 2.0と多数のエンタープライズ向けアップデートをリリースしました。言語切り替え、マルチキャラクターモードなど!また、EUデータレジデンシーも👀 https://t.co/SHhMWbhjIo