20 6月 2025

2025年06月20日朝のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

Gemini 2.5 Flash-Liteが実行時UI生成で新境地を開拓、AIコーディング競争も加速

GoogleのGemini 2.5 Flash-Liteが驚異的な速度でリアルタイムUI生成を実現し、開発の新たな可能性を示しています。一方でAnthropicのClaude Codeはリリース1ヶ月でユーザー数が3倍に急増。

AIの技術革新は医療分野にも広がり、Neuralinkの脳インプラントで6人目の被験者が思考だけでゲームプレイに成功。また、o3とGemini 2.5は科学的質問の回答で人間レベルを超える成果を達成しました。

それでは各トピックの詳細について見ていきましょう。

Gemini 2.5 Flash-Lite、実行時UI生成デモを公開【続報】
Claude Code続報: リリース1ヶ月でユーザー数が3倍に
【続報】Neuralink、6人目の被験者が思考でゲームプレイ成功
投資家不在のSurge AI、収益でScale AIを上回る
Gemini、Web・モバイルアプリで動画アップロードに対応
Perplexity、X上でVeo 3による動画生成が可能に
OpenAI Codex続報、スナップショット機能でタスク開始を高速化
o3とGemini 2.5、GPQAベンチマークで人間超えを達成
【続報】A.Ng氏、米AI競争力に移民受入の重要性を提言
国立情報学研究所、日本語LLM比較アリーナを公開

Gemini 2.5 Flash-Lite、実行時UI生成デモを公開【続報】

Google DeepMindが、軽量モデル「Gemini 2.5 Flash-Lite」の続報として、驚異的な速度を活かしたデモを公開しました。
デモでは、ボタンクリックのたびに前の画面の文脈だけを頼りに、UIとコードをリアルタイムで生成する「実行時UI生成」が披露されました。
この高速なUI生成能力は、UI/UXのあり方を根本から変える可能性を秘めていると注目されています。

Google DeepMind: (翻訳) Gemini 2.5 Flash-Liteが、前の画面に表示される内容のコンテキストのみに基づいて、UIとそのコンテンツのコードを、ボタンをクリックするだけで書き込む方法をご紹介します。💻 ↓ https://t.co/19aq0BDyAS

Kenn Ejima: なんじゃこりゃ…？\n\n何かOSみたいに見えるけど、実はボタンクリックした瞬間に毎回Gemini Flash-LiteがUIを生成してる。生成なのでクリックするたびに表示されるものがランダムに変わる。\n\n400トークン/秒という驚異のスピードだから実現できてるんだけど、凄すぎて理解が追いつかない…

mizchi: 実行時UI生成だ！

Claude Code続報: リリース1ヶ月でユーザー数が3倍に

AnthropicのAIコーディングアシスタント「Claude Code」に関する続報です。
リリースから4週間でユーザーベースが3倍以上に増加したとAnthropicのAlex Albert氏が報告し、開発者の間で急速に普及していることが改めて示されました。
その強力な性能から利用が活発化しており、月額固定プランでない場合の高額なトークン消費も引き続き話題となっています。

Alex Albert: (翻訳) Claude Codeの誇大広告は本物です。面白い統計：1か月足らず前のClaude 4の発売以来、Claude Codeのユーザーベースは3倍以上に増加しました🚀

mizchi: 試しに npx -y ccusage 叩いてみたら Claude MAXじゃない場合、 $3548.34 (51万) と出てヒエッとなった。もう全然元取れてる https://t.co/JJVNRF0MYP

西見公宏 | Generative Agents: 「生成AIによってプログラマは駆逐されるのか？」という、良くある命題ですが、身近な凄腕さんたちは「Claude Code楽しいｗｗｗ」しか言っていないので、多分そういうことなんだろうなと思います。

【続報】Neuralink、6人目の被験者が思考でゲームプレイ成功

イーロン・マスク氏率いるNeuralinkの続報です。脳インプラント「Telepathy」を埋め込んだ6人目の被験者が、思考だけでビデオゲームをプレイすることに成功しました。
同社はさらに、今後6〜12ヶ月で視覚障がい者の視力回復を支援できる可能性があると言及しており、以前から報じられていた視覚再現の目標に向けた大きな一歩となります。

Chubby♨️: (翻訳) ニューラリンクのテレパシーチップを埋め込まれた6人目の人間であるロブ・グレイナーは、思考でカーソルを動かし、ビデオゲームをプレイすることができます。なんて時代に生きているのでしょう。

Chubby♨️: (翻訳) ニューラリンクは、今後6〜12か月で、目の不自由な人々が再び見えるようにするのに役立ちます。なんてこった。

投資家不在のSurge AI、収益でScale AIを上回る

AIの学習データを作成するデータラベリング業界で、新たな企業が注目を集めています。,The Informationの報道によると、これまで無名だった「Surge AI」は、外部からの投資を一切受けずに10億ドル以上の収益を上げ、利益も出しているとのことです。,競合のScale AIを上回る勢いを見せており、AIエコシステムの知られざる有力企業の存在が明らかになりました。

Stephanie Palazzolo: (翻訳) これはあなたが聞いたことのないデータラベリングのスタートアップですが、収益は10億ドルを超え、利益も出ており、そして...投資家なしでそれをすべて成し遂げましたか？ @coryweinbergと私は、注目を浴びずに先行したScaleの競合であるSurge AIについて詳しく説明します。

The Information: (翻訳) 人工知能：投資家なしでScale AIを追い抜いた静かなAIの大物。 @steph_palazzoloと@CoryWeinbergによる詳細はこちら👇

Gemini、Web・モバイルアプリで動画アップロードに対応

GoogleのAIチャット「Gemini」のWeb版およびモバイルアプリ（iOS/Android）で、動画のアップロード機能が利用可能になりました。,これまで画像やテキスト、音声のみに対応していましたが、新たに動画を入力として利用できるようになります。,この機能により、動画の内容に関する質問や分析など、より高度で多様な使い方が期待されます。

TestingCatalog News 🗞: (翻訳) NEW 🔥: GeminiがWebおよびモバイルアプリで動画のアップロードをサポートするようになりました！

Perplexity、X上でVeo 3による動画生成が可能に

AI検索エンジンのPerplexityが、X（旧Twitter）上で動画生成に対応したことが明らかになりました。,Perplexityのボットアカウントに「@AskPerplexity generate a video of ...」とリプライを送ることで、Googleの最新動画生成AI「Veo 3」を利用して動画を作成できます。,これにより、Xのタイムライン上で手軽に高品質な動画を生成できるようになり、新たな活用法が期待されます。

TestingCatalog News 🗞: (翻訳) Perplexityボットが動画を生成できるようになった？！ @AskPerplexity たくさんのモニターの前で作業するサイバーパンクハッカーロボットの動画を生成して

TestingCatalog News 🗞: (翻訳) 速報🚨: Xで@AskPerplexity経由でVeo 3ビデオを生成できるようになりました!!! X Overviews 👀👀👀

OpenAI Codex続報、スナップショット機能でタスク開始を高速化

OpenAIのコーディング支援AI「Codex」に、タスクの開始を高速化する新機能が追加される見込みです。
「post-setup snapshotting」と呼ばれる機能で、セットアップ後のコンテナ状態をスナップショットとして保存します。
これにより、次回以降のタスク開始が高速化され、開発サイクルの短縮が期待されます。

Tibor Blaho: (翻訳) ChatGPTのCodexに、環境の「セットアップ後のスナップショット」を有効にするオプションが追加されます。「セットアップスクリプト後にコンテナの状態をスナップショットすることで、タスクの開始を高速化します。最新のデフォルトブランチのタスクのみがスナップショットを作成します。各タスクはスナップショットの使用をオプトアウトできます。」

TestingCatalog News 🗞: (翻訳) WIP 🤖: Codexは、環境スナップショットを保存できるようになるため、タスクをより速く実行できるようになります。 * 現在開発中

o3とGemini 2.5、GPQAベンチマークで人間超えを達成

OpenAIの「o3」モデルとGoogleの「Gemini 2.5」モデルが、科学的な質問に答える能力を測るベンチマーク「GPQA Diamond」で、初めて人間の博士号レベルを超えるスコアを達成したと報告されています。
このベンチマークは、専門家レベルの知識と推論能力を必要とする難易度の高いものです。
AIモデルの能力が急速に向上し続けていることを示す重要な結果として注目されます。

Kol Tregaskes: (翻訳) OpenAIとGoogleのo3モデルとGemini 2.5モデルは、それぞれGPQA Diamondベンチマークで初めて人間の博士号の範囲を飛び越えました。

【続報】A.Ng氏、米AI競争力に移民受入の重要性を提言

AI研究の第一人者Andrew Ng氏が、米国のAI競争力に関する新たな提言を行いました。
同氏は以前、米国のAI基礎研究への資金削減に警鐘を鳴らしましたが、今回は高度な技術を持つ移民や留学生の積極的な受け入れが不可欠だと主張しています。
世界的なAI人材獲得競争が激化する中、米国の強みである移民受け入れの歴史を活かすべきだと指摘しています。

Andrew Ng: (翻訳) 米国やその他の国がAIにおける競争力を確保するためにできる最も効果的なことの1つは、高度なスキルを持つ可能性のある高度なスキルを持つ移民や留学生を歓迎することです。何世紀にもわたって、米国は移民を歓迎してきました。

国立情報学研究所、日本語LLM比較アリーナを公開

国立情報学研究所（NII）が主催するLLM勉強会で、複数の日本語LLMの推論結果を比較できる「Chatbot Arena」が公開されました。,ユーザーは匿名化された2つのモデルの回答を評価することで、より優れたモデルを選ぶことができます。,Gemmaベースの「Swallow」など、最新の日本語モデルを手軽に試せる場として、言語資源の拡充への貢献が期待されています。

piqcy: NII 様が主催する LLM 勉強会で、複数の LLM の推論結果を比較できる Chatbot Arena が公開されました！最新の日本語モデルが試せるので、言語資源拡充のためにもぜひ試して頂ければ幸いです。個人的に Gemma ベースの Swallow は 9b とは思えない回答精度で驚きました https://t.co/kmJw4MgIGS