2025年09月15日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
最新モデル競争が加速、国産LLM議論も活発化
xAIが「Grok 4 Fast」をベータリリースし、瞬時に応答する驚異的な速度が称賛を集めています。一方、GPT-5は複雑なバックエンド開発で「熟練エンジニア級」との高評価を獲得。
また、日本語処理の効率や精度の問題から、国産LLM開発の重要性が改めて議論されています。AIエージェント技術では「手続き記憶」を更新できる新フレームワーク「Memp」も注目を集めています。
それでは各トピックの詳細を見ていきましょう。
目次
- xAI、高速版モデル「Grok 4 Fast」をベータリリース
- GPT-5、バックエンド開発で高評価 熟練エンジニア級との声も
- 国産LLM開発の重要性が改めて議論に
- CodexとClaude Codeの比較続報、連携の課題や使い分けが焦点に
- xAI、GrokのChangelogやAPIのCollections機能公開【続報】
- AIエージェントの「手続き記憶」を更新するMemp提案
xAI、高速版モデル「Grok 4 Fast」をベータリリース
- xAIがGrok 4の高速版である「Grok 4 Fast」をベータ版としてリリースしました。
- 多くのユーザーから、複雑な問題に対してもほぼ瞬時に応答するなど、その驚異的な速度性能を称賛する声が上がっています。
- Web版やiOSアプリの早期アクセス設定から利用可能とのことです。
TestingCatalog News 🗞: (翻訳) 速報🚨: xAIがGrokウェブで「Grok 4 Fast」を早期ベータ版としてリリースしました。\n\nGrok 4とGrok 4 Fastの速度比較はこちらです。\n\n地球上で最速のAI?👀
Chubby♨️: (翻訳) Grok 4 Fast(早期アクセスベータ版)がリリースされました。そして、信じられないほど高速です。ChatGPTを使って非常に複雑な数学の問題を作成しましたが、Grok 4はほぼ瞬時に回答しました。ベータプログラムは、設定 -> サブスクリプション -> 早期アクセスモデルを有効にする、で有効にできます。
まつにぃ: お、Grok4がコーダーモデル並みに爆速になってる。 これ同じ性能か? なら凄いな。 めっちゃ早い、Groqみたい(ややこしい)
GPT-5、バックエンド開発で高評価 熟練エンジニア級との声も
- 賛否両論あるGPT-5の性能ですが、複雑なバックエンド開発の領域で高い評価が報告されています。
- 特に、指示通りに動作する能力が優れており、以前のモデルが「不注意なインターン」だったのに対し、GPT-5は「熟練したエンジニア」のようだと評されています。
- 実際に、LiveBenchのランキングではGPT-5 ProとHighがトップに位置しており、その高い問題解決能力を裏付けています。
Haider.: (翻訳) GPT-5-highは、複雑なバックエンドシステムにおいてOpus 4よりも大幅に優れています。Codexはほぼ毎日改善されています。最も良い点は、GPT-5が実際に指示通りに動作することです。これはClaudeからの大きな進歩であり、不注意なインターンのようにではなく、熟練したエンジニアのように振る舞います。
Bindu Reddy: (翻訳) GPT-5 ProがLiveBenchに登場しました。GPT-5 ProとHighはどちらもLiveBenchのトップにあり、互いに似ています。全体として、GPT-5思考モデルは問題解決に優れていますが、時々無限ループに陥ると耐え難いほど遅くなることがあります。そして、そう、私たちはまだAGIを達成していません。
Haider.: (翻訳) GPT-5-thinking (トークンごと支払い) vs GPT-5-instant (無料)
国産LLM開発の重要性が改めて議論に
- 国内での独自LLM開発について、コスト効率や精度の観点からその重要性を説く意見が注目を集めています。
- 主要な海外製LLMは、日本語を扱う際に英語と比較してコスト効率が約2倍悪く、精度も劣るという問題が指摘されています。
- 現在の技術進化の速さから追いつくのは困難かもしれないとしつつも、将来的にLLMが社会インフラとなる可能性を考えれば、国内での開発は重要であると論じられています。
Hirosato Gamo | AI Cloud Solution Architect: 「国内で独自LLM開発やったって追いつけないから無駄」という論調はよく見るけど、メインベンダのLLMは英語と比較すると日本語はコスト効率が悪くなっていて、その差は諸説あるが2倍近いとされている。もちろん精度も悪い。今はかなり進化が激しいので追いつくのは難しいかも知れないが、LLMがあらゆる
パウロ: かと言って数兆円計算資源にぶち込める企業や政府は存在しないし、結局はGAFAM, BATTが作ったオープンウェイトを蒸留する方向なんでしょうね 今は中国のモデルを蒸留する方向になりそうだけど、気持ち的、安全保障的に割り切れる人は少なそう
パウロ: 特に長文や音声込みの動画だとだいぶ差が出そうですね 音声込みの動画を動作、表情含めて翻訳するのは現実的なコストではないですね
CodexとClaude Codeの比較続報、連携の課題や使い分けが焦点に
- AIコーディング支援ツール「Codex」と「Claude Code」の比較に関する続報です。
- 開発者の間では、両ツールの連携や特性に合わせた使い分けの模索が続いています。
- 具体的には、Claude Codeのsubagents定義ファイルをCodexに読み込ませようとしても、うまく機能しないといった課題が報告されています。
Haider.: (翻訳) Codexはほぼ毎日更新されており、いずれはClaude Codeが持つ機能の多くを搭載するでしょう。CLIはオープンソースなので、GPT-5を使ってエージェントのような同様の機能を追加できます。計画されている機能が不足している場合でも、「exp-dev/codex」フォークにはすでにコマンドとして実装されています。
Itomaru: claude codeのsubagents定義ファイルをcodexやcursorに読み込ませてその定義に従って振る舞うよう指示しているんだけどまあなかなか上手く働いてくれないね、😓
エチレン: codex cli 使い始めて2日目だけど、返答が遅いこと以外は満足
xAI、GrokのChangelogやAPIのCollections機能公開【続報】
- xAIに関する続報です。
- Grokの変更履歴をまとめたChangelogページが開設されたほか、Web版の設定に「早期アクセスモデルを有効にする」オプションが追加されました。
- xAI APIのドキュメントには、ドキュメントの効率的な管理・検索を可能にする「Collections」機能が追加されています。
Tech Dev Notes: (翻訳) xAIがGrokの変更履歴ページを作成しました
Tech Dev Notes: (翻訳) Grok Webの新しい設定:「早期アクセスモデルを有効にする」
Tech Dev Notes: (翻訳) xAIはxAI APIにCollections機能のドキュメントを追加しました。「この機能により、ドキュメントの効率的な管理、検索、活用が可能になり、AI主導のワークフローとアプリケーションが強化されます。」
AIエージェントの「手続き記憶」を更新するMemp提案
- AIエージェントに更新可能な「手続き記憶」を持たせるフレームワーク「Memp」が提案され、注目を集めています。
- 手続き記憶は、LLMが事前学習で獲得したパターン認識や系列予測の能力と定義されており、特にBtoBでの導入において重要視されています。
- このフレームワークでは、高精度モデルが持つ手続き記憶を、より小型のモデルへ蒸留することも可能で、エージェントの効率化が期待されます。
おじろ: 更新可能な手続き記憶をエージェントに持たせるフレームワークMempの提案。 個人的に手続き記憶はtoB導入時に非常重要だと思うのでこの分野は追っかけていきたい。 高精度モデルの手続き記憶が小型モデルへ蒸留っぽいことができるのも面白い https://t.co/7cz1N5G4j6
おじろ: こちらでは、LLMが主に事前学習で獲得したモデルのパラメータを通じて、パターン認識や系列予測を自動的に実行する能力を手続き記憶と定義している。 まあ、そうとも言えるな。。。 https://t.co/57yvrxdk22
おじろ: こういうので手続き記憶を抽出→保存していければ良いんだろうな https://t.co/6x9IdiXOg7