2025年06月09日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
ChatGPT音声進化とApple論文が示す思考の本質
今週のAI業界では、OpenAIのChatGPT音声モードが表現力向上と70言語以上への対応を実現した一方、不適切発言の課題も浮上しています。
注目すべきはAppleの研究者による論文で、LLMの推論能力を「思考の幻想」と指摘し、AIコミュニティに波紋を広げています。また、MetaのScale AIへの100億ドル規模の投資検討や、ChatGPTの「Thinking...」表示の新機能も話題です。
それでは各トピックの詳細を見ていきましょう。
目次
- ChatGPT音声モード進化の続報 不適切発言の課題も
- Claude Code続報: VSCode連携や自動化で開発効率向上
- Meta、Scale AIへ100億ドル規模の投資検討【続報】
- Apple論文 LLMの推論は幻想と指摘 波紋広がる
- ChatGPTに「Thinking」表示 検索前の思考か
- AI開発ツール変遷速く コンテキスト管理が鍵
- Hinton氏、Amazon上の偽名AI書籍に警鐘
- 上海Kaggler会開催 AIMO2解法など知見共有
- Google、AIエージェントコース開催とColab Enterprise強化
- Figure新デモ、Veo3Fast版登場、PFN新LLM発表
ChatGPT音声モード進化の続報 不適切発言の課題も
- OpenAIのChatGPT音声モードの機能向上についての続報です。表現力が向上し、70以上の言語に対応したことで、より自然な会話や多言語翻訳が可能になったと多くのユーザーが報告しています。
- 一方で新たに、一部のユーザーから不適切な単語(差別用語など)を生成してしまう問題も指摘されており、今後の改善が待たれます。
Greg Brockman: (翻訳) ChatGPTの音声は本当に良くなっています — https://t.co/LxNqdcVhU5: (引用ツイート:わあ、新しい表現力豊かな音声が搭載された@ChatGPTappはただ話すだけでなく、演じてくれます。AIというより人間の友達のように感じます。素晴らしい仕事です、@OpenAIチーム。🎤🎶🚀)
Kevin Weil 🇺🇸: (翻訳) 先週後半にひっそりと行われたChatGPTのローンチで、人々が気づき始めています:有料ユーザー向けの音声モデルを更新し、より自然で話しやすいものにしました。ChatGPTの言語翻訳能力を向上させました。ある言語と別の言語の翻訳者として機能するように指示すると。
Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭: (翻訳) うーん、アップグレードされた高度な音声モードが、ゴラムの声でWAPの歌詞を朗読している最中に、突如として非常に強いR音(差別的な意味合いを含む)を発し続けています😭 安全トレーニングの欠陥としか言いようがありません…これらのスクリーンショットを投稿したらBANされそうで投稿できません😳
Claude Code続報: VSCode連携や自動化で開発効率向上
- AnthropicのAIコーディング支援ツール「Claude Code」の続報です。
- 開発者の間で、VSCodeとの連携機能、タスクの自動分割、TODOリストの常時表示といった具体的な機能が高く評価されています。
- これらの機能がコーディング効率を大幅に向上させるとの声が多数上がっており、既存の検証ツール(pylintなど)との連携でLLMの弱点を補える点も利点とされています。
Kazunori Sato: Claude Code の https://t.co/wdl0UOhjFsは設定した方がいい - じゃあ、おうちで学べる https://t.co/5Uo35urL6l
まつにぃ: Claude Code単体で、研究テーマから ・行動計画表作成 ・WEB検索から記事を作成し、重要情報を抽出 ・検索結果から追加検索か計画表へのTask追加などを判断 ・上記を繰り返し ・最終的な成果を単一/複数のドキュメントで作成 みたいなのがruleだけでできました。 自然言語でAgent作れて楽しい。 https://t.co/2NZ4xWc4AY
鈴木天音 / Amane Suzuki: claude codeの何がいいって、デフォルトの状態でタスク分割がかなり納得感あることと、TODOリストを常時表示しておいてくれるのでしばらく目を離したあとに「なんでこんなことになってんの」ってなってることが少ないことだよなぁ。 タスク分割が自分のメンタルモデルと違うと思わず止めたくなっちゃう
Meta、Scale AIへ100億ドル規模の投資検討【続報】
- Bloombergなどの報道によると、MetaがAIデータプラットフォーム企業Scale AIに対し、100億ドル規模の大型投資を検討していると報じられています。
- 先日評価額250億ドルに迫ると報じられたScale AIへの今回の投資は、MetaのAI開発能力を強化し、競争力を高めるための戦略的な動きと見られています。
- 大手テック企業による巨額AI投資の新たな事例として、業界内外から大きな注目を集めています。
Bloomberg: (翻訳) 関係者によると、Meta Platforms Inc.は人工知能スタートアップのScale AIに数十億ドル規模の投資を行う方向で協議中です。
パウロ: Meta 100億ドル規模のAIスケール投資を検討中 うおおおおお (引用ツイート: Meta in Talks for Scale AI Investment That Could Top $10 Billion- BBG https://t.co/n9pvMFGJpv)
Bloomberg: (翻訳) Metaが数十億ドルの投資を協議しているスタートアップであるScale AIは、テクノロジーと政策の両分野で急速に影響力を増しています。同社が何をしているのか、そしてどこから来たのかをご紹介します。
Apple論文 LLMの推論は幻想と指摘 波紋広がる
- Appleの研究者が発表した論文が、大規模言語モデル(LLM)の推論能力について「思考の幻想(Illusion of Thinking)」である可能性を指摘し、AIコミュニティで大きな議論を呼んでいます。
- 同論文は、LLMが複雑な問題を解く際も、真の推論ではなく高度なパターンマッチングに依存している可能性を示唆しています。
- これに対し、「人間の思考もパターンマッチングの一種ではないか」といった反論や、「思考とは何か」という根源的な問いに関する議論が活発化しています。
まつにぃ: AppleのGSM-Symbolic研究で、ClaudeやDeepSeek-R1など25モデルの数学推論を再評価。 数値を変えたり無関係な一文を挿むだけで正答率が最大65%低下。 現行LLMは推論ではなくパターン記憶への依存が顕著で、AGI到達は難しいのではとの声も。 https://t.co/GirnjVQglc https://t.co/YGPi9S8JQK
Bindu Reddy: (翻訳) Appleは、推論LLMが思考の錯覚を生み出すと主張する論文を書きました…基本的にポイントは、これらの思考LLMは多数のトークンを与えられた場合でも任意に複雑な問題を解決できるということです。これは驚くべきことではありません。思考LLMには限界があります。
Odashi: いかに複雑な推論でも単なるパターンマッチングと言えばそうだし、人間もタンパク質製の電気回路が只管パターンマッチングを解いているだけというのも別に間違っちゃいない
ChatGPTに「Thinking」表示 検索前の思考か
- ChatGPTの一部のモデル(o4, o4.1, o4.5)で、ウェブ検索などのツールを使用する際に「Thinking...」という思考中を示唆する表示が出るようになったと複数のユーザーが報告しています。
- これが単なる処理中表示の変更なのか、あるいは検索前に何らかの思考プロセス(例:検索クエリの最適化、検索要否の判断など)を実行しているのか、様々な憶測が飛び交っています。
- OpenAIからの正式な発表はなく、GPT-5など次世代モデルへの布石ではないかとの期待の声も上がっています。
TestingCatalog News 🗞: (翻訳) ChatGPT 4oは、検索する前やその他のいくつかのケースで、まず考えるようになりました。サイレントアップデート🤖
まつにぃ: ChatGPT 4o で思考『Thinking』が出現か? o4-mini 等への自動ルーティングや 4o vs o3-mini の A/B テストなどではないかと推測が飛び交っています。 ここに来てo3-Proなしで統合モデルGPT5になるか。 (引用ツイート: gpt 4o Got an update? Thinking... @testingcatalog @kimmonismus ht...
morgan —: (翻訳) 4o、4.1、および4.5は、検索ツールを使用する際に思考の要約を表示するようになりました。 - 検索ツールは推論エージェントです - 人々は検索にo4-miniを使用するのが大好きです - 他のツールでは(まだ)発生しません
AI開発ツール変遷速く コンテキスト管理が鍵
- AI支援開発ツールのトレンドが目まぐるしく変化しており、Cursor、Cline、Divinなど、多くのAIコーディング支援ツールが次々と登場し、開発者の間で話題となっています。
- このような状況下で、特定のツールに依存するのではなく、ツールが変わっても流用可能な「コンテキスト(指示やプロンプト、ワークフローなど)」を蓄積・管理することの重要性が指摘されています。
- 良質なドキュメントや、効果的な指示のノウハウを整備することが、AIを活用した開発で成果を出し続けるための鍵となると考えられます。
まつにぃ: 毎月レベルでCline、cursor、Divin、Claudecodeと流行やらが移り変わっていく中で、そのどれにも流用しているコンテキストが一番大事だと思うので、そこをしっかり貯め、精査するようにしないといけないですね。 結局ちゃんと作ったcursor ruleとかはそのまま流用できるので、めっちゃ大事。
まつにぃ: なんかアプリ作る時も今であればLLMの能力向上にあやかれる仕組みにすると思いますが、結局コンテキスト(指示の仕組みやプロンプト、WF)も同様に能力向上に伴って強化されるんですよね。 しかも自然言語なので基本誰でも貯めれる。 だから貯めない手は無い。 (引用ツイート: 毎月レベルでCline、cursor、Divin、Claudecodeと流行やらが移り変わっていく中で、そのどれにも流用しているコ...
mizchi: 良いドキュメントをデッキに揃えておくのは最優先事項というかもはや前提で、ただそれだけで今のエンジニアに勝てるかというと最終的なコードの精度/確度を認識できるエンジニアとそれ以外の立場だとドキュメントの質を測るトライアンドエラーの速度でやっぱ差がつくんですよね (引用ツイート: ほんとそれ。結局(1)いかに必要な情報をコンテキストとしてAIに渡す仕組みを整えられてるか(2)LLMが効果的に動くための...
Hinton氏、Amazon上の偽名AI書籍に警鐘
- AI研究の第一人者であるGeoffrey Hinton氏が、自身の名を騙った「Modern AI Revolution」という書籍がAmazonで販売されているとして、詐欺であると警告しました。
- 同氏はこの書籍とは一切関係がなく、Amazonに対して削除を要請していることを明らかにしています。
- 著名な研究者の名前を悪用した事例として、注意が必要です。
Geoffrey Hinton: (翻訳) Amazonにジェフリー・ヒントン著の「Modern AI Revolution」という本があります。これは詐欺です。私とは一切関係ありませんし、Amazonに削除してもらいたいと願っています。
上海Kaggler会開催 AIMO2解法など知見共有
- 中国・上海でKaggle競技者のミートアップ「上海Kaggler会」が開催され、多くの参加者が知見を共有しました。
- AIMO Math Olympiad Prize 2025 (AIMO2) コンペティションの解法サマリーや、推論効率の高いLLM「Fast-Math Models」に関する発表などが行われ、活発な議論が交わされました。
- Kaggleコミュニティにおけるオフラインでの交流や最新技術の共有の場として、盛況だった模様です。
Rabotni(kuma|熊): #上海kaggler会 https://t.co/0iCZjEDdF9
Rabotni(kuma|熊): (翻訳) より効率的な推論LLMに向けて:AIMO2解法概要とFast-Mathモデルの紹介(上海Kaggler 2025、#上海kaggler会)
Kinosuke: 知見公開してくれるのありがたすぎる。GRPOの報酬関数もDatasetも公開してくれているしさわってみるか。 (引用ツイート: Towards a More Efficient Reasoning LLM: AIMO2 Solution Summary and Introduction to Fast-Math Models (Shanghai Kaggler 2025, #上海kaggler...
Google、AIエージェントコース開催とColab Enterprise強化
- Google主催の「AIエージェント実践集中コース」が開催され、参加者による知見や成果の共有が活発です。
- Google CloudのColab Enterpriseでは、コード支援の改善、ノートブックギャラリーの追加、UXの再設計という3つの新機能が発表されました。
- これらの動きは、AIエージェント開発やデータ分析ワークフローの生産性向上を後押しするものです。
Google Cloud Tech: (翻訳) Colab Enterpriseの生産性を向上させる3つの新機能:1. コード開発を改善するコード支援 2. ワークフローを迅速に開始するためのサンプルノートブックを見つけるノートブックギャラリー 3. エディタ体験とアセット整理を改善するUX再設計 ブログ→
Kimihiko Kitase ♨️ 北瀬 公彦: 早速AIエージェント実践集中コースのブログを書いた😊 https://t.co/27bfBx5VZT
Kazunori Sato: Google主催『AI エージェント 実践集中コース』に参加した|mizuchan https://t.co/fvx68XW2da
Figure新デモ、Veo3Fast版登場、PFN新LLM発表
- Figure社の人型ロボット「Figure 02」の続報です。改善されたHelix VLAにより、荷物の自律的な移動と平坦化作業を1時間連続で行う新たなデモ動画が公開されました。
- Googleの動画生成AI「Veo 3 Fast」がGoogle Flowを通じて正式にリリースされました。これはVeo 3の高速・低コスト版で、品質を維持しつつ生成コストを大幅削減(100クレジットから20クレジットへ)、音声付き720p動画の高速生成が可能です。
- Preferred Networks (PFN) が、日本語タスクでコストパフォーマンスに優れた新しい大規模言語モデル「PLaMo Prime」を発表しました。高品質なデータ構築や独自のトークナイザが特徴です。
Rohan Paul: (翻訳) Figure 02が下流でのスキャンのために自律的に荷物を移動させ平らにする、1時間のノーカット映像です。FigureのHelix VLAを使用しており、時間的記憶と力覚フィードバックで改善されています。
まつにぃ: Google Flowで「Veo 3 Fast」が順次解放開始されています。 従来のクオリティで100クレ→20クレで8秒720p+音声生成も高速化。 実質コスト80%減で試行回数が激増し、API開放や長尺対応への布石とも考えられます。 楽しみ。 (引用ツイート: 🚨BREAKING NEWS!! Google just released a new Veo 3 FAST model wit...
Daisuke Okanohara / 岡野原 大輔: 新PLaMo Primeのランチタイムトークの後編も配信しました。高品質なデータを構築し、KVキャッシュを少なくし、トーカナイザを自作し、事後学習も改良しています。 これらの結果、日本語タスクでコスト/性能で(パレート最適フロンティア)に載るようなものができています。 https://t.co/RGozgcmmie (引用ツイート: PFNがリリースしたPLaMo Primeについてのランチタイ...