08 6月 2025

2025年06月08日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

ChatGPT新音声機能と業界最新動向

今週は、OpenAIのChatGPT新音声モードが大きな注目を集めています。70言語以上に対応し、より自然な表現力と翻訳機能を備えた進化が評価されています。

GoogleではKingfallという新モデルのテストが噂され、Gemini 2.5 Proの最新版も高評価を獲得中です。また、CursorのシステムプロンプトリークやxAIのキャッシュ化プロンプト導入など、AIツールの内部動作に関する話題も活発です。

それでは、これらの最新動向について詳しく見ていきましょう。

ChatGPT新音声モード表現力向上・70言語超対応・翻訳も
Google新モデルKingfallテストの噂 Gemini 2.5 Pro最新版も【続報】
Cursor、システムプロンプトリークやAPI解析が話題に【続報】
Google AI Studio APIキー移行後も無料枠継続
Bengio氏設立LawZeroにHinton氏祝辞 AI安全研究で連携期待【続報】
xAI、APIにキャッシュ化プロンプト導入コスト効率化【続報】
Anthropic、WindsurfでのユーザーAPIキーによるClaude利用の可能性を示唆【続報】
Perplexity Labs 金融リサーチ視覚化機能リリース【続報】
プロンプトエンジニアリングの将来性を巡る活発な議論

ChatGPT新音声モード表現力向上・70言語超対応・翻訳も

OpenAIがChatGPTの新しい高度な音声モードの提供を開始したという続報です。
従来の音声モードと比較して、より自然で表現豊かな会話が可能になったとユーザーから報告されています。
この新モードは70以上の言語に対応し、より人間らしいイントネーションや感情表現が豊かになりました。
音声によるリアルタイム翻訳機能も搭載され、コミュニケーションツールとしての利便性向上が期待されます。

Greg Brockman: (翻訳) ChatGPTの音声は本当に良くなっています — https://t.co/LxNqdcVhU5:

Kol Tregaskes: (翻訳) ChatGPTで新しい高度な音声モードが展開中です。声が以前より格段に良くなりました！より表現力豊かで、自然で、多様です。実際に話すのが楽しく、普通のチャットのように感じます。以下に簡単なテストを載せます。もっと投稿します： https://t.co/3VNilXi1pl

TestingCatalog News 🗞: (翻訳) OpenAIは、本日の音声モードのアップグレードに関する詳細をリリースノートで更新しました。興味深いことに、適切な翻訳者としても機能するようになりました。「音声は直感的で効果的な言語翻訳も提供します」 https://t.co/LqTy7LsbgG

Google新モデルKingfallテストの噂 Gemini 2.5 Pro最新版も【続報】

Googleが「Kingfall」という新しいAIモデルをAI Studioでテスト中であるとの噂が広まっています。これがGemini 2.5 Proの正式版（full）に関連する可能性も指摘されています。【続報】
Gemini 2.5 Proの最新プレビュー版（06-05）も引き続きリリースされ、SimpleBenchなどのベンチマークで高い評価を得ており、特に長文コンテキスト処理能力の向上が注目されています。
開発者からは、動画からの情報抽出や複雑なRAGパイプライン構築支援など、具体的な活用事例と共に性能を称賛する声が上がっています。

Kol Tregaskes: (翻訳) Gemini 2.5 Proの6月5日（06-05）アップデートは、我々が持つ主要なベンチマークの1つであるSimpleBenchで大きなリードを奪いました。2.5は現在、どのOpenAIモデルよりも約10%高く、OAIはかなり遅れをとっています。この2.5が最終版ではないため、彼らはo3-proやGPT-5を早期にリリースする必要があります。

Chubby♨️: (翻訳) Simple benchが更新されました。人間レベルのベンチマークにどれだけ早く近づいているかを見るのは驚くべきことです。Googleは1ヶ月で10%向上しました。おそらく2025年末にはベンチマークが人間レベルに達すると考えられます。

TestingCatalog News 🗞: (翻訳) @Polymarketによると、Googleが6月末までに最高のAIモデルを持つ可能性は76%から88%です。「Kingfall」効果 👀 https://t.co/ZVnsokaAeZ

Cursor、システムプロンプトリークやAPI解析が話題に【続報】

AI搭載コードエディタ「Cursor」に関する続報です。
同社のARR5億ドル達成に続き、その内部動作にも関心が集まっています。
Cursorが使用しているとされるClaudeのシステムプロンプトがリークされたという情報や、APIコールのリバースエンジニアリング結果が話題になっています。
これらの情報は、AIエージェントがどのようにタスクを実行しているかを理解する手がかりとなる可能性があります。

久保田雅也@Coalis: Cursorは2年でARR$500M。歴史上最速成長の記録がまた塗り替えられた https://t.co/MwZJxs83qo

Rohan Paul: (翻訳) リークされたClaudeのシステムプロンプト。主要なエージェントAIパターンを採用： • コンテキスト再確認：環境コンテキストを継続的に更新 • 意図エコー：ユーザーの指示を正確に反映 • セマンティックアンカリング：正確なコード領域の引用 • 回答のみの出力：簡潔な、 https://t.co/NG4y6cgSFo

Ian Nuttall: (翻訳) TensorZeroはCursorのAPIコールをリバースエンジニアリングし、実際のプロンプトを確認し、内部でモデルを交換しました。ここにはいくつかの興味深い情報があります（リンクは最初のリプライを確認してください）。 - Cursorを独自のゲートウェイ経由でプロキシするステップバイステップのセットアップ（コードを共有しています） - Cursorの驚くべきほど https://t....

Google AI Studio APIキー移行後も無料枠継続

Google AI StudioがAPIキーベースの課金体系に移行するとの情報がありましたが、Google関係者は無料ティアが廃止されるわけではないと明言しました。
APIキーベースへの移行は、より柔軟な利用と管理を可能にするためと見られますが、無料でのアクセスが継続されることは多くの開発者にとって朗報です。
需要の急増により一時的に無料枠が絞られている可能性も示唆されており、今後の動向が注目されます。

Philipp Schmid: (翻訳) AI StudioをAPIキーベースに移行しても、無料ティアがなくなるわけではありません！当社のAPIには、何百万人もの開発者に利用されている無料ティアがあります。 https://t.co/k7ZjZkL23q

Chubby♨️: (翻訳) 重要：Google AI Studioの無料枠はすぐにはなくならない、とローガンは言っています https://t.co/PGLkx5Vm50

まつにぃ: 現在Google AI StudioのGemini2.5 ProはAPIの無料枠がなくなってますが無料枠は継続すると宣言されています。需要が大幅に増加したので一時的に絞ってますが、調整次第復活の見込みです。 https://t.co/mJhuB6ZyKl

Bengio氏設立LawZeroにHinton氏祝辞 AI安全研究で連携期待【続報】

以前お伝えした、AI研究の権威Yoshua Bengio氏による安全なAI設計を目指す新団体LawZero設立の続報です。
この取り組みに対し、同じくAI研究の第一人者であるGeoffrey Hinton氏が祝辞を述べました。LawZeroにはJeff Clune氏も科学顧問として参加しています。
LawZeroは、フロンティアAIシステムの潜在的リスクを踏まえ、AIの安全性を確保することを目的とした研究プロジェクトであり非営利団体です。
AIの安全性研究における重要な動きとして、引き続き注目されます。

Geoffrey Hinton: (翻訳) @Yoshua_Bengio氏の@LawZero_立ち上げ、おめでとうございます。これは、特にフロンティアシステムが自己保存や欺瞞的行動の兆候を見せ始めている中で、安全な設計によるAIを進めるための研究活動です。

xAI、APIにキャッシュ化プロンプト導入コスト効率化【続報】

xAIは、API利用時のコスト削減と効率化を目的として、キャッシュ化されたプロンプトトークン機能を導入しました。
これにより、繰り返し同じプロンプトを使用する際の処理費用を抑えることができます。
このアップデートは、xAIが提供するサービスの利便性と経済性の向上を目指すものです。
併せて、GrokのWebインターフェースにおける新しい画像生成UIの導入や、エンタープライズユーザー向けのManagement API提供も進められています。

Tech Dev Notes: (翻訳) xAIは最近、APIにキャッシュ化プロンプトトークンを導入しました：キャッシュ化プロンプトを使用して、繰り返されるプロンプトの費用を節約できるようになりました。保存されたプロンプトデータを再利用することで、同一リクエストの処理費用を節約できます https://t.co/3Q8OeP1rwv

Tech Dev Notes: (翻訳) Grok Webに新しい画像作成UIが間もなく登場： https://t.co/C9dxBC3bde

Tech Dev Notes: (翻訳) xAIがManagement APIをローンチしました！これにより、エンタープライズユーザーはアカウント詳細をプログラムで効率的に管理できます https://t.co/weMkYjeCTN

Anthropic、WindsurfでのユーザーAPIキーによるClaude利用の可能性を示唆【続報】

Anthropicの共同創業者Jared Kaplan氏は、AI開発プラットフォーム「Windsurf」において、ユーザーが自身のAPIキーを持ち込みClaudeを利用できる可能性に言及しました。【続報】
同氏はまた、WindsurfへのClaude API提供停止の背景として、OpenAIによる買収報道の影響の可能性や、計算資源の制約、長期パートナー優先の方針を説明しています。
これらに加え、Anthropicは国家安全保障の専門家を同社の長期利益信託のメンバーに任命し、AIの安全性と倫理への取り組みを強化しています。

TechCrunch: (翻訳) Anthropic、国家安全保障の専門家を統治信託に任命 | TechCrunch https://t.co/AmuOiE3Ilt

Tibor Blaho: (翻訳) 「私の理解では、Windsurfを使えば、実際に自分のAPIキーを持ち込んでClaudeを使い続けることができます...もっと複雑になるかもしれませんが...供給面では本当にかなり制約を受けてきました。トークンの利用可能性を大幅に向上させたいと考えています。私たちは https://t.co/G1eIBZQg2X

まつにぃ: Anthropic が Windsurf への Claude API を遮断した件。 OpenAI による 30 億ドル買収報道が理由と Kaplan 氏は語りました。計算資源は「持続的パートナー優先させたい」、「OpenAI による買収報道がある企業に計算資源を売るのは不自然だ」とのこと。 https://t.co/m65ANjPuxm

Perplexity Labs 金融リサーチ視覚化機能リリース【続報】

AI検索エンジンPerplexityの実験的機能を提供するPerplexity Labsが、SEC提出書類に基づく金融リサーチの視覚化機能をリリースしました。
これにより、複雑な財務情報をグラフやチャートなどで直感的に理解できるようになり、投資家やアナリストにとって有用なツールとなることが期待されます。
Perplexityは先日、全ユーザーへのメモリ機能提供開始も発表しており、継続的な機能拡充でユーザー体験の向上を図っています。

TestingCatalog News 🗞: (翻訳) Perplexity Labs経由でSEC提出書類に基づく金融リサーチを視覚化できるようになりました！たくさんのビジュアル 👀 https://t.co/EKPuUL9vMc

プロンプトエンジニアリングの将来性を巡る活発な議論

AIを活用した開発やコンテンツ生成において、プロンプトエンジニアリングの重要性や将来性について、開発者コミュニティで活発な議論が交わされています。
「求めるものを明確にできれば、AI自身が質問や選択肢を提示する形でも成り立つ」とし、必ずしも人間が完璧なプロンプトを書く必要がなくなる可能性を指摘する声があります。
一方で、現状のモデルでは指示追従性に課題があり、人間の意図を正確に汲み取らせるための工夫や、AIに批判的な視点を持たせることの重要性も議論されています。

K.Ishi@生成AIの産業応用: 「生成AIを使いこなすには正しいプロンプトを書ける必要がある」というのは今は多分そうだけど、いつまでもそうではない。要は「求めるものが何か」を明確に出来れば良いのであって、DeepResearchのように、AI自身が最初に質問と選択肢を用意して、人がそれに答えながら明確化する方式でも成り立つ。

ぬこぬこ: いや、これプロンプトエンジニアリングでどうにかなる話じゃないと思います... ふろむださん @fromdusktildawn の解像度に合わせた画像を指示通りに生成できない時点で、ふろむださん視点だと o3 は使えないって判断をするのは適切かと使いこなし方なんて十人十色で良いし...

mizchi: ミッションクリティカルなタスクやコード書かせる視点だと今のモデルは人間に媚びすぎてて、既存のコードを批判的に見る視点が欠けてるので、俺はもっとAIに否定されてえよ