2025年09月18日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
大手AIモデルの競技プログラミング快挙と進化するユーザー体験
OpenAIとGoogleのAIが国際プログラミングコンテストで人間レベルを超える成績を達成し、AIの問題解決能力が新たな段階に。
一方で実用面では、ChatGPTに思考時間調整機能が正式実装され、ユーザーが応答の速度と精度のバランスを自由に選べるようになりました。また、GoogleのNotebookLMはクイズ自動生成機能を全ユーザーに開放し、学習体験の向上に貢献しています。
それでは各トピックの詳細に目を向けてみましょう。
目次
- OpenAIとGoogleのAI、国際プロコンで人間超えの快挙
- ChatGPT、思考時間の設定機能が正式リリース
- OpenAIモデル進化、人間の役割は教師から評価者へ
- Gemini CLIの「3.0 Ultra」記述はテスト用と判明【続報】
- メルカリ、社内AIエージェントの育成手法などを公開【続報】
- MCP続報: GitHubが公式レジストリを公開、導入が容易に
- NotebookLMのクイズ自動生成機能、全ユーザーに提供開始【続報】
OpenAIとGoogleのAI、国際プロコンで人間超えの快挙
- OpenAIとGoogleのAIモデルが、大学対抗プログラミングコンテストの世界大会「ICPC World Finals 2025」で、人間を上回る金メダルレベルの成績を達成しました。
- OpenAIのシステムは12問全問正解、Googleの「Gemini 2.5 Deep Think」も10問正解と、AIによる高度な問題解決能力の進化を改めて示す結果となりました。
Jeff Dean: (翻訳) Geminiモデルのコーディング能力がどんどん向上しているのを見て、とても興奮しています! 2025年国際大学対抗プログラミングコンテスト(ICPC)世界決勝で、Gemini 2.5 Deep Thinkの先進バージョンが金メダルレベルのパフォーマンスを達成しました!🎉
Chubby♨️: (翻訳) はい、我々は転換点に到達しました。OpenAIは、最も重要な大学プログラミングコンテストであるICPC世界決勝2025で、5時間で12問中12問を完遂し、すべての人間のチームを上回る満点を達成しました。参加が許可されなかったAIチームは...
Greg Brockman: (翻訳) 私たちの最新の推論システムによる2025年ICPCプログラミングコンテストでの満点:
ChatGPT、思考時間の設定機能が正式リリース
- 以前からテスト中と報じられていた、GPT-5モデルの思考時間を調整する機能がWebUIに正式に実装されました。
- 有料プランのユーザーは「軽め」「標準」「じっくり」「深い」の4段階から、無料ユーザーは「標準」「じっくり」の2段階から選択できます。
- これにより、タスクの複雑さに応じて応答速度と精度のバランスをユーザー自身が調整可能になります。
Chubby♨️: (翻訳) GPT-5がリリース日に笑われ、間違った図表に人々が激怒したなんて信じられない。わずか1か月後、雰囲気は完全に変わった。今ではほとんどの人がGPT-5を気に入っており、OpenAIはすべてのオリンピックで最高の結果を出し続けている。OpenAIは復活した。未来は...
カレーちゃん: ChatGPTの有料ユーザは思考時間を選べるようになった。 Proユーザは、軽め・標準・じっくり・深いの4段階 その他のユーザーは、標準とじっくり(以前のデフォルト)の2段階 https://t.co/3k1mQj1Vcd
Shakeel: (翻訳) モデルピッカーをなくすのが目的だと言っていたのを覚えていますか
OpenAIモデル進化、人間の役割は教師から評価者へ
- The Informationの報道によると、OpenAIのモデルが非常に高度化したため、特定の専門分野では人間の契約チューターがモデルに新しいことを教えるのが困難になっていると報じられています。
- あるチューターは、GPT-5ができないタスクを見つけるのに苦労していると語っており、AIの自己学習能力の進化を示唆しています。
- この傾向は、AI開発における人間の役割が、教師からより高度な評価者やガイドへと変化していく可能性を示しています。
Stephanie Palazzolo: (翻訳) OpenAIのモデルは賢くなりすぎて、人間の契約社員が言語学などの特定の分野で新しいことを教えることができなくなっています。私が話したある契約社員は、GPT-5ができない新しいタスクを思いつくのに苦労していると語っていました。
Tibor Blaho: (翻訳) 「例えば、昨年OpenAIのo3モデルの教育を手伝っていたある専門家は、当時、モデルができない言語学関連のタスクを週に3~4個は思いついたと私に語った。この夏にローンチされたGPT-5で作業している今、思いつくのは難しくなっている」
The Information: (翻訳) AIアジェンダ:OpenAIのモデルは人間の教師にとって賢くなりすぎている 人間の専門家は、OpenAIとAnthropicのAIに新しいことを教えるのが難しくなっていると感じています。 @Steph_Palazzolo の記事を詳しく読む👇
Gemini CLIの「3.0 Ultra」記述はテスト用と判明【続報】
- 先日Gemini CLIリポジトリで「gemini-3.0-pro」が見つかり話題となりましたが、今度は「gemini-3.0-ultra」というモデル名が発見されました。
- しかし、これは次期モデル名ではなく、テスト用のプレースホルダーであったとの指摘がなされました。
- 憶測を呼んだコミットはすでにリポジトリから削除されており、一連の騒動は一旦終息した形です。
Chubby♨️: (翻訳) CLIリポジトリでGemini 3.0 Ultraが発見されました。ただし、これは単なるプレースホルダーかもしれません。しかし、いずれにせよGemini 3.0のリリースは間近のようです。
Kol Tregaskes: (翻訳) ここにあるGemini 3 Ultraは、おそらく単なるプレースホルダーでしょう。興奮しないでください。Gemini 3はおそらく1ヶ月ほど先です。もちろん、間違っていることが証明されれば嬉しいです。
TestingCatalog News 🗞: (翻訳) さらなる憶測を避けるため、Gemini CLIからGemini 3.0 Ultraの言及が削除されました。これはテストデータとして追加されたものであり、実際のモデル名を反映したものではありません。@patience_cave に戻ります👀
メルカリ、社内AIエージェントの育成手法などを公開【続報】
- メルカリのAIエージェントに関する続報です。同社が開催したイベントで、社内での具体的な活用事例が多数公開されました。
- 既報のデータ分析エージェント「Socrates」については、具体的な育成方法や評価方法に関する資料が公開されています。
- その他にも、インシデント対応を支援するエージェントなど、多様なAIエージェントが社内で運用されていることが明かされました。
na0: 今日の資料「データ分析エージェント Socrates の育て方」を公開しました #mercari_ai_agent https://t.co/id9FwdPST1
Kazutaka Matsumoto@EXPLAZA CTO: 参加してますー、わいわい #mercari_ai_agent
fufufukakaka: ゴミを置かない、に共感しかない 紛らわしいテーブルが範囲内にあると迷っちゃったりするのでルートを一つに統一してあげたりとかを最近は意識してます
MCP続報: GitHubが公式レジストリを公開、導入が容易に
- AIエージェント連携プロトコル「MCP」に関する続報です。
- GitHubが、MCPサーバーを一覧・導入できる公式レジストリ「MCP Registry」を公開しました。
- これにより、開発者はVS CodeやCopilotからワンクリックでMCPサーバーを導入できるようになります。
- DeepLearning.AIがBox連携を学ぶコースを公開するなど、エコシステムの拡大も続いています。
daka | Microsoft | AI: GitHubが 「MCP Registry」 を公開 https://t.co/2j7nLUx9XT AIエージェントやツールと連携できる MCPサーバを一括発見できる公式レジストリ。 VS CodeやCopilotからワンクリック導入可能、リポジトリ情報も確認OK https://t.co/VlYqo1BCy3
Andrew Ng: (翻訳) 新しいショートコース:MCPサーバーでAIアプリを構築する:Boxファイルでの作業。@Boxと共同で構築し、CTOの@BenAtBoxが教えます。多くのAIアプリケーションでは、基本的なファイル操作にカスタムコードが必要です。モデルコンテキストプロトコル(MCP)は、ファイルをオフロードできるようにすることでこれを標準化します。
NotebookLMのクイズ自動生成機能、全ユーザーに提供開始【続報】
- 以前お伝えした、GoogleのAIノートアプリ「NotebookLM」の学習支援機能が、全ユーザーに提供開始されました。
- この機能は、アップロードした資料から自動でフラッシュカードやクイズを生成するもので、効率的な知識の定着を支援します。
- 語学学習や試験勉強など、様々な場面での活用が期待されます。
NotebookLM: (翻訳) 今、私たちは公式に、公式に、公式に100%展開されました!
TestingCatalog News 🗞: (翻訳) 確認中👀 フラッシュカードとクイズの両方が、NotebookLMで100%のユーザーにご利用いただけるようになりました!テストの時間です!🔥