2025年07月11日 夜のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Grok 4の台頭と競合激化する大規模言語モデル市場
xAIのGrok 4がサードパーティプラットフォームでの展開を始める一方、中立性への懸念も浮上しています。同時にOpenAIの開発中GPT-5がGrok 4を性能で上回るとのリーク情報も。
Googleでは生成AIによるコード比率が50%を超え、開発体制の変革が加速。しかしMETRの研究では熟練開発者のAIツール使用で19%の生産性低下という意外な結果も報告されています。
AWSはAnthropicとの提携でAIエージェントマーケットプレイスの立ち上げを計画中です。それでは各トピックの詳細に目を向けていきましょう。
目次
- Grok 4続報、高評価の一方で中立性に懸念も
- Grok続報、Notion連携やデスクトップアプリ開発が進行
- OpenAI GPT-5、内部評価でGrok 4を上回る性能か
- 【続報】AWS、Anthropicを主要パートナーにAIエージェントのマーケットプレイス立ち上げへ
- GoogleのAI生成コード比率が50%超に、開発体制が大きく変化【続報】
- 熟練開発者、AIツールで生産性19%低下か METRが研究報告
- 関西Kaggler会が盛況、Udemy協力の新atmaCupも始動
- AI開発ツール動向: CursorとGrok統合、Google動画生成
Grok 4続報、高評価の一方で中立性に懸念も
- 先日発表されたxAIの新モデル「Grok 4」に関する続報です。
- PoeやPerplexityなどサードパーティのプラットフォームでも利用可能になりました。
- 多くのベンチマークで最高スコアを記録するなど高い性能が評価される一方、物議を醸す質問に対しイーロン・マスク氏の過去のツイートを元に回答を生成する挙動が確認され、その中立性に懸念が指摘されています。
- ベンチマークスコアの高さに反して、実際の性能が伴っていないとの声も上がっています。
Tech Dev Notes: (翻訳) Grok 4がPoeに登場! ほぼすべてのベンチマークで新記録を達成し、フロンティアモデルの中でトップに立ちました。(1/2) https://t.co/5DGuvCb31u
TechCrunch: (翻訳) Grok 4は物議を醸す質問に答えるためにイーロン・マスクに相談するようです | TechCrunch https://t.co/OipKDT1QZx
mizchi: Grok は見送りでいいや。ベンチマークと実際の挙動の乖離をみるに、よくあるベンチマーク用データを過学習しちゃって実体が伴ってないやつに見える
Grok続報、Notion連携やデスクトップアプリ開発が進行
- xAIのGrokに関する今後の開発ロードマップの続報です。
- 以前リーク情報のあったNotionとの連携に加え、Google CalendarやSlackとの連携機能、さらにネイティブデスクトップアプリの開発が進められていることが明らかになりました。
- 先日報じられたTesla車両への搭載や、今週末に予告されている新機能のリリースなど、Grokの展開が活発化しています。
Forbes: (翻訳) Grokはテスラ車で利用可能になると、同社のCEOイーロン・マスクが発表しました。 https://t.co/YQwtuHC1cc https://t.co/XEOCpcyldq
Tech Dev Notes: (翻訳) xAIは現在、Grok向けのGoogleカレンダー、Gmail、Notion、Slackの統合に取り組んでいます:https://t.co/98i3Qgci7O
Tech Dev Notes: (翻訳) 今週末には、さらにクールな@Grokの機能がいくつかリリースされます
OpenAI GPT-5、内部評価でGrok 4を上回る性能か
- 先日発表され、最高性能とされたxAIの「Grok 4」に関する続報です。
- OpenAIの内部評価で、開発中の次期モデル「GPT-5」が「Grok 4 Heavy」をわずかに上回る性能を示したとの情報がリークされました。
- まだ噂の段階ですが、モデル間の性能競争がさらに激化することを示唆しており、GPT-5の正式発表に注目が集まります。
Chubby♨️: (翻訳) OpenAIが何かを企んでいるようだ:内部評価によると、GPT-5はGrok 4より少し優れている! これはすごいことだ (引用ツイート:鳥たちから、内部評価ではgpt5がgrok 4 Heavyをわずかに上回っているという噂をいくつか聞いている。 評価はモデルの一面に過ぎないが、エージェント的な改善やその他の大きな改善があるかどうか興味がある。)
Tech Dev Notes: (翻訳) ほんの1年前はOpenAIが知能でトップだったのに、今やこうなっているなんて信じられない: 1. xAI 2. Google 3. OpenAI 4. Anthropic
Bindu Reddy: (翻訳) 2025年の最大のニュースは、MetaがAIで炎上する一方で、xAIが成功を収めることだ。 誰が考えただろうか?🤯
【続報】AWS、Anthropicを主要パートナーにAIエージェントのマーケットプレイス立ち上げへ
- AWSのAIエージェント分野への取り組みに関する続報です。
- TechCrunchの報道によると、AWSは来週にもAIエージェントのマーケットプレイスを立ち上げる計画です。
- このマーケットプレイスでは、協力関係にあるAnthropicが主要パートナーとして参加し、同社のAIモデルを活用したエージェントが提供される見込みです。
TechCrunch: (翻訳) AWSは来週、AnthropicをパートナーとしてAIエージェントマーケットプレイスを立ち上げる予定 | TechCrunch https://t.co/2SX3uNfJDm
Tetsuro Miyatake: Amazonが再度Anthropicに数千億円レベルの出資を検討しているらしい。 過去に$8Bほど出資済みだが、より関係性を深めるための施策として追加出資を考えているとのこと。 特にGoogleも$3Bほど投資しているので、より多くの持分を保有したいと思われている。 https://t.co/w9HUCqS5GH
morgan —: (翻訳) siegler氏が指摘:アマゾンは既存の契約に基づき、今年後半までにアンスロピックに「さらに27億ドル」を投資することをすでに約束しているため、FTが新しい資金について報じているのかは不明確だ https://t.co/eWBaZEoRiM (引用ツイート:アマゾンはアンスロピックへの新たな数十億ドル規模の投資について協議しており、この提携を「根本的に重要」と呼んでいる http...
GoogleのAI生成コード比率が50%超に、開発体制が大きく変化【続報】
- Google社内でAIが記述するコードの割合が50%を超えたことが明らかになりました。これは4月末に報告された30%超から、わずか1ヶ月ほどで大幅に増加したことになります。
- この変化により、人間の開発者はAIが生成したコードのレビューや修正、より高度な設計やアーキテクチャの検討に注力するようになると見られています。
Chubby♨️: (翻訳) よく考えてみてください。今やGoogleの全コードの50%以上をAIが書いているのです!なんてこった https://t.co/0bagZbh5a7 (引用ツイート:AIは今やGoogleのコードの50%を記述しています。https://t.co/fHau0IRlXc)
E. Nakai: 200回記念です :) 「第200回 Google社内での大規模言語モデルによるコードレビュー支援(パート1)」 https://t.co/P0WvWMBsHD
Taro Fukuyama: + Software 1.0 従来知っているソフトウェア開発。PythonやC++などのプログラミング言語で人間が一行一行コードを書く。人間がプログラムの動作を細かく設計する。 + Software 2.0
熟練開発者、AIツールで生産性19%低下か METRが研究報告
- AIコーディングツールが開発者の生産性に与える影響について、新たな研究結果が注目を集めています。
- METRが実施したランダム化比較試験によると、経験豊富なオープンソース開発者がAIツールを使用した場合、本人は20%速くなったと感じていたものの、実際には19%遅くなっていたことが判明しました。
- この結果は、AIツールの導入が必ずしも生産性向上に直結するわけではない可能性を示唆しており、開発者コミュニティで活発な議論を呼んでいます。
Kol Tregaskes: (翻訳) AIコーディングツールは、経験豊富な開発者の実際の作業を19%遅らせたが、本人は20%スピードアップしたと認識していた。 - METRは、平均22,000以上のスターを持つ自身のリポジトリで246の実際のタスクに取り組む16人の経験豊富なオープンソース開発者を対象に、ランダム化比較試験を実施した。https://t.co/quAPgkxGco (引用ツイート:AIコーディングツールが...
Maxwell! 🌃 🌻 🐇 ☃: 経験豊富な人の場合は,AI coding tool を使うとかえって遅くなるということなのではないだろうか (引用ツイート: We ran a randomized controlled trial to see how much AI coding tools speed up experienced open-source developers. The results surprised ...
Rohan Paul: (翻訳) この研究によると、AIは開発者をスピードアップさせるどころか、19%も遅くすることがわかった。 でも私にとっては、今AIなしでコードを書くのはこんな感じだ😃 https://t.co/dVn8taBj4p (引用ツイート:なんだって。 この研究によると、AIはベテラン開発者をスピードアップさせるどころか、19%も遅くすることがあるという。🤯 🔍 テスト内容 研究者たちは、16人の...
関西Kaggler会が盛況、Udemy協力の新atmaCupも始動
- 大阪で「関西Kaggler会」が開催され、多くのKagglerが集まり盛況となりました。イベントでは、もくもく会、ランニングとKaggleの両立、モダンなPythonの書き方、shake-upの科学など、多岐にわたるLTが行われました。
- また、Udemyとのコラボレーションによる新たなデータコンペ「atmaCup #20」の開催が発表され、参加申し込みが始まっています。
- さらに、8月23日には「第4回 関東Kaggler会」の開催も告知され、Kaggleコミュニティの活発な動きが続いています。
比戸将平 Shohei Hido: #関西Kaggler会 会場満員で開催中、盛り上がっています!東京からの参加者も多くて驚いています。 https://t.co/WOyvmhUWHx
ころんびあ: atmaCup #20 in collaboration with Udemy に参加を申し込みました! https://t.co/650ZSO689J #Udemy
Ino.Ichi: 第4回関東Kaggler会のイベントページをオープンしました!今回も豪華なゲストの方にご講演いただけることになりました🙌🎊会場は第2回と同じくLayerX様のすごく綺麗なイベントスペースを使わせていただきます🙏LTも大募集してますので、ぜひご応募ください🤩 #kanto_kaggler https://t.co/XCLn76sF7J
AI開発ツール動向: CursorとGrok統合、Google動画生成
- AI開発を加速させるツールや機能のアップデートが続いています。OpenAIはAPIを更新し、公開されているURLであればPDFファイルを直接入力として渡せるようになりました。また、GoogleはGeminiアプリに、Veo 3モデルを利用して画像から音声付き動画を生成する「Flow」機能を追加しました。さらに、AIコーディングエディタのCursorは、xAIのオフィスにエンジニアチームを常駐させ、Grok 4との統合をリアルタイムで進めていることがイーロン・マスク氏によって明かされました。
Kazuhiro Sera (瀬良): 📄 OpenAI の responses API の入力で、公開された URL であれば PDF ファイルの URL をそのまま渡せるようになりました! (引用ツイート: To use a PDF with the OpenAI API, you can just pass its URL now—no upload needed! 📄🔗 https://t.co/gquFIT4sRn)
Tetsuro Miyatake: Googleが写真を動画化することが出来るGeminiの新AI機能をローンチした。 Veo 3動画モデルを活用して画像をリファレンスして8秒の動画を生成することが可能。 https://t.co/x7zLYWLndB https://t.co/dazqErxAM7
まつにぃ: イーロン・マスクが「CursorのエンジニアがxAIに常駐し統合問題をリアルタイムに解決していく」と明言。 Grok 4 CodeのIDE連携を狙うxAIと協業し、Cursorのメインモデルの1つになっていきそうですね。 (引用ツイート: 🚨Breaking Cursor News: @elonmusk “A Cursor engineer team is at xAI today, so ...