2025年10月04日 朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

GPT-5のWikipedia検証とOpenAIのRoi買収が話題に

今週のAI業界では、GPT-5がWikipediaの記事誤りを検証する取り組みが注目を集めています。また、OpenAIがパーソナライズ金融AI「Roi」を買収し、AIのパーソナライゼーション強化に動き出しました。

一方で開発現場では、AIが開発作業負荷を下げても開発スピード向上には直結しないとの議論が交わされました。Google新モデルEmbeddingGemmaの公開や、テレンス・タオ氏のChatGPT活用事例なども話題となっています。

それでは、各トピックの詳細について見ていきましょう。

目次

  1. GPT-5、論文に続きWikipediaの誤りも発見
  2. OpenAI、パーソナライズ金融AIの「Roi」を買収
  3. 開発イベントでAI活用の実態が議論に
  4. (続報) OpenAI、ユーザーの苦痛検知時にGPT-5 Instantへ自動切替
  5. Bezos氏、現在のAI投資を「良いバブル」と表現
  6. Googleの動画AI Veo 3に画像からの動画生成機能の噂
  7. 数学者テレンス・タオ氏、ChatGPTで問題解決を報告
  8. Chatbot Arena、GPT-4oが5を上回り信頼性に再び疑問
  9. Google、オンデバイス向けEmbeddingGemmaを公開

GPT-5、論文に続きWikipediaの誤りも発見

  • GPT-5の思考能力(Thinking)を活用し、Wikipediaの記事の誤りを検証する試みが話題になっています。
  • OpenAIの共同創業者であるGreg Brockman氏もこの動きに言及しており、実際に多くの記事で出典と照合可能な誤りが発見されたと報告されています。
  • これは学術論文の引用ミスを指摘した事例に続くもので、AIが情報生成だけでなく、既存の知識ベースのファクトチェックにも活用できる可能性を示しています。
Greg Brockman: (翻訳) エラー発見のためのGPT-5 Thinking:

Chubby♨️: (翻訳) 驚き:@polynoamialはGPT-5 Thinkingを使ってウィキペディアの事実確認をしていますが、彼がチェックしたほぼすべてのページに、出典で検証可能な実際のエラーがありました。ウィキペディアのページ自体も安全ではありませんでした。 AIはここで幻覚を見ているだけではありません。最も信頼されているオープンナレッジの亀裂を明らかにしています。

OpenAI、パーソナライズ金融AIの「Roi」を買収

  • OpenAIが、パーソナライズされた金融アシスタントアプリを開発するスタートアップ「Roi」を買収したことが明らかになりました。
  • Roiは、投資を誰もが利用できるようにすることを目的として、3年前に設立された企業です。
  • この買収により、OpenAIはAIのパーソナライゼーションをさらに推し進め、個々のユーザーに適応し、共に進化するコンパニオンのような製品開発を目指すものと見られます。
TestingCatalog News 🗞: (翻訳) 速報🚨: OpenAIがパーソナライズ金融AIアシスタントアプリ「Roi」を買収。 「私たちが毎日使う製品は、静的で所定の体験のままではありません。それらは、私たちを理解し、私たちから学び、私たちと共に進化する、適応性のある非常に個人的なコンパニオンになるでしょう。」 https://t.co/x8C9cRvlyv

Tibor Blaho: (翻訳) OpenAIが興味深い買収を行いました

Rohan Paul: (翻訳) 📢 ニュース:OpenAIが、パーソナライズされた金融アシスタントアプリを開発したスタートアップ、Roiを買収しました。 Roiは3年前に、高度にパーソナライズされた金融ツールを作成することで、一般ユーザーが投資をより簡単にできるようにすることを目標に設立されました。 Roiの背後にあるアイデアは、そうでないアプリを構築することでした。

開発イベントでAI活用の実態が議論に

  • 開発者向けイベント「AI/Copilot時代のソフトウェア開発」(#aicoding)で、AI活用の現状について活発な議論が交わされました。
  • AIによって開発者の作業負荷は下がるものの、開発スピード自体が向上するわけではないという意見や、AIエージェントによる開発はまだ時期尚早であるとの見解が示されました。
  • また、AIは平均的な70点のモデリングは得意だが、事業モデルに応じた引き算(特定のドメインに特化した取捨選択)は苦手であるといった課題も指摘されました。
松本 勇気 (Yuki Matsumoto) | LayerX CTO: ソフトウェアエンジニア以外がソフトウェアを作るという流れは増える。それを加速するためのPlatform Engineeringの重要性は高くなる。n8nやAi Workforce的なワークフローの導入もですし、自社のオペレーション改善のための内部データアクセス等の足回りの整備なども。 #aicoding

松本 勇気 (Yuki Matsumoto) | LayerX CTO: Agentic AIとうまく連携するには、Interfaceがテキストだけだと厳しいんだよね。人間はホワイトボードとかスライドとか、Excelとか色々使って対話してる。その体験をうまく組み込んでいかないとならない。 #aicoding

Kazutaka Matsumoto@EXPLAZA CTO: レストランの席モデリング問題(4人席が8人席になったり、9人席になったり)、事業モデルによってラインを変える必要があるがAIでそれをするのが難しい #aicoding

(続報) OpenAI、ユーザーの苦痛検知時にGPT-5 Instantへ自動切替

  • OpenAIが、GPT-5に関するアップデートを発表しました。ユーザーが苦痛を感じている瞬間をより良く認識しサポートするため、会話のデリケートな部分がGPT-5 Instantに自動でルーティングされるようになります。
  • この変更により、より迅速で役立つ応答の提供を目指します。
  • なお、ユーザーが使用中のモデルを尋ねた際には、どのモデルがアクティブであるかが引き続き表示されるとのことです。
OpenAI: (翻訳) 私たちは、苦痛の瞬間にいる人々をよりよく認識し、サポートするためにGPT-5 Instantを更新しています。 会話のデリケートな部分は、GPT-5 Instantにルーティングされ、さらに役立つ応答を迅速に提供するようになります。ChatGPTは、尋ねられたときにどのモデルがアクティブであるかをユーザーに伝え続けます。

Bezos氏、現在のAI投資を「良いバブル」と表現

  • Amazon創業者のジェフ・ベゾス氏が、現在のAI分野への投資熱を「良い産業バブル」と表現し、話題を呼んでいます。
  • 同氏は、1990年代のバイオテクノロジーやドットコムバブル時代と比較し、多くの企業が淘汰される一方で、社会に永続的なインフラが残るとの見解を示しました。
  • 一部の投資は無駄になるものの、最終的には経済全体の生産性を向上させるという肯定的な見方です。
Rohan Paul: (翻訳) 💰 ジェフ・ベゾス氏は、AIへの支出急増は「良い産業バブル」であり、いくらかのお金を無駄にするが、経済全体の生産性を向上させるだろうと述べています。 彼は、多くの企業が倒産したがインフラは存続した1990年代のバイオテクノロジーやドットコム時代と今日を比較して、その主張をしました。 外部では

Bloomberg: (翻訳) Amazonのジェフ・ベゾス会長は、人工知能への支出は投資の損失につながる可能性のある「産業バブル」に似ているが、社会をより良くすることにもなると述べた https://t.co/ENkMCG3C2f

Financial Times: (翻訳) ジェフ・ベゾスは、人工知能への投資の急増は「良い」種類のバブルを煽っており、25年前に彼のeコマース会社の株価が劇的に暴落したとしても、社会に永続的な利益をもたらすと主張しています。 https://t.co/2PKjcWaKRD https://t.co/GQf6uqyG8C

Googleの動画AI Veo 3に画像からの動画生成機能の噂

  • Googleの動画生成AI「Veo 3」に、複数のフレーム画像から動画を生成する「Frames to Video」という新機能が搭載される可能性が浮上しました。
  • これはOpenAIのSoraに対抗する動きと見られており、動画生成AIをめぐる競争がさらに激化しそうです。
TestingCatalog News 🗞: (翻訳) Googleは、Veo 2が廃止されようとしているため、FlowでリリースするためにVeo 3「Frames to Video」を準備しています。 これは私が今まで見た中で最高の例です👀 https://t.co/kcFdQsZIJh

数学者テレンス・タオ氏、ChatGPTで問題解決を報告

  • フィールズ賞受賞者である数学者のテレンス・タオ氏が、ChatGPTの助けを借りて数学の問題を解決したと報告し、注目を集めています。
  • 同氏は、AIに慎重に指示を与え、各ステップを検証しながら進めることで、幻覚(ハルシネーション)を起こすことなく、数時間のコーディング作業を削減できたと述べています。
  • この事例は、生成AIが高度な科学研究の分野においても、人間の専門家を補助する強力なツールとなり得ることを示しています。
Chubby♨️: (翻訳) テレンス・タオ氏、ChatGPTがMathOverflowの問題を解決し、何時間もの手作業コーディングを節約してくれたと語る https://t.co/txXKsQ8odP

Rohan Paul: (翻訳) テレンス・タオ氏は、ChatGPTがMathOverflowの問題を解決し、何時間もの手作業によるコーディングを節約したと述べています。 彼はまた、AIから幻覚や無意味なことは報告されておらず、これは、次に進む前にすべてのステップを検証しながら、AIを注意深く導いたという事実に起因すると考えています。 https://t.co/ocIJPnGQpW

Chatbot Arena、GPT-4oが5を上回り信頼性に再び疑問

  • LLMの性能評価で広く利用される「Chatbot Arena」の信頼性に、再び疑問の声が上がっています。
  • 最近のリーダーボードでGPT-4oがGPT-5を上回るなど、直感に反する結果が指摘されています。
  • 各社のプレスリリースでの言及も減少傾向にあり、ベンチマークとしての価値が揺らいでいる可能性が示唆されます。
ML_Bear: 最近のChatbot Arenaがひどいと聞いて見に行ったら、本当に酷かった。chatgpt-4oがgpt-5-highよりも上位らしい😇 最近、各社のプレスリリースから言及されることもほぼなくなりましたね。 https://t.co/sFffEZUpyJ

Hirosato Gamo | AI Cloud Solution Architect: 全く同じ指摘してる人がいた。 最近のArena Leaderboardは本当にめちゃくちゃ過ぎて何を見せられてるんだというレベルなんよね。

Google、オンデバイス向けEmbeddingGemmaを公開

  • Googleは、オンデバイスでの利用に最適化された新しいモデル「EmbeddingGemma」をリリースしました。
  • このモデルは、デバイス上でのセマンティック検索やRAG(Retrieval-Augmented Generation)に特化しており、より応答性が高く、プライバシーに配慮したユーザー体験を実現します。
  • オフライン環境でも強力なAIアプリケーションを構築できるため、今後の活用が期待されます。
Google AI Developers: (翻訳) EmbeddingGemmaを使用して強力なオフラインAIアプリケーションを構築します。当社の新しいモデルは、デバイス上のセマンティック検索とRAGに最適化されており、より応答性が高くプライベートなユーザーエクスペリエンスを実現します。そのアーキテクチャとレシピの詳細をご覧ください: https://t.co/nrp514LfOQ

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください