2026年06月22日 夜のAIニュースまとめ

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。

(ほぼ)毎日AIニュースが届きます
ぜひご登録ください

OpenAIの次世代音声モデル展開と国内外の最新モデル動向

OpenAIから双方向の対話が可能な次世代音声モデル「gpt-bidi-1」の展開が始まりました。

また、Sakana AIやPFNから高性能な最新モデルがリリースされるなど、国内外で開発が活発化しています。

一方で、AIへの依存が専門家のスキル低下を招くリスクを指摘する研究も発表されました。

本日の主要な動向を順に確認してまいりましょう。

目次

  1. Sakana AIがFugu Ultraをリリース【続報】
  2. Kaggleポケカコンペでゲームエンジン解析が議論に【続報】
  3. ObsidianのAIエージェント化事例が続々【続報】
  4. GoogleとMediaTekがTPU v9開発で協業か【続報】
  5. OpenAI次世代音声モデル「gpt-bidi-1」展開開始【続報】
  6. PFN、国産LLM「PLaMo 3.0 Prime」提供開始【続報】
  7. インドJioが5億人の通信網をAIエージェントのテストベッドに
  8. AI導入が専門家のハードスキルを低下させる可能性を示す研究

Sakana AIがFugu Ultraをリリース【続報】

  • Sakana AIのマルチエージェントシステム「Fugu」に関する続報です。
  • 複数モデルをオーケストレーションする「Fugu」および上位版の「Fugu Ultra」がリリースされ、API経由で利用可能になりました。
  • Fugu UltraはClaude FableやMythosに匹敵する性能を持つとされています。
  • 自身の再帰的な呼び出しを含む設計が特徴で、多くの開発者が早速テストし、その性能や日本語の読みやすさを高く評価しています。
🚨 AI News | TestingCatalog: (翻訳) 速報🔥:Sakana AIがSakana FuguおよびSakana Fugu Ultraシステムを発表しました。これらは多くのベンチマークでClaude Fable 5およびMythos 5と同等の性能を発揮します。 > Sakana AIは日本のAIラボであり、Fuguは他のLLMを操作するように訓練されたオーケストレーションモデルです。

Kosuke Nakago: とうとうFuguがリリースされました! 世界最先端のモデル群をOrchestrationすることで、FableなしでもFableに迫る・越す性能を発揮します。 最先端AIのどれを使うか自分で迷うことなくタスクごとに最適なLLM、最適なWorkflowをFuguが毎回動的に構築しタスクをこなしてくれます。 https://t.co/XbpkkWlit8

kami: 複数モデルをオーケストレーションするFugu のAPIが正式に使えるようになりました!

Kaggleポケカコンペでゲームエンジン解析が議論に【続報】

  • Kaggleで開催中のポケモンカードゲームAIコンペに関する続報です。
  • ゲームエンジンのコード公開の是非が話題となっており、リバースエンジニアリングへの投資判断に迷う声が上がっています。
  • また、シミュレーターの仕様に関する推測から、マルチデッキ戦略の有効性についても活発な議論が交わされています。
エチレン: ホストが明言してくれないとgame engineのreverse engineeringにどれだけ投資すればいいのか読めないから、懸念点を全てDiscussionに投げた https://t.co/bJLcIN1w7r

: 投げました。ぱっと見 simulator が deck.csv を直接読んでないのでマルチデッキ戦略が出来そうだけど、ホスト的にはそれってアリなの?という話。 #ポケカABC https://t.co/mHTIUgky3C

エチレン: これがKaggleじゃないならreverse engineeringすらダメだと思うんだけど、仮にKaggleでOKだった場合にチキンレースした者勝ちになるのは嫌だな

ObsidianのAIエージェント化事例が続々【続報】

  • ノートアプリ「Obsidian」をAIエージェント化する取り組みに関する続報です。
  • フォルダを第2の脳化するツール「Graphify」などが新たに登場しました。
  • 毎朝自動でトレーディングアイデアを生成して利益を上げた事例なども共有され、ローカルナレッジベースとAIの連携がさらに加速しています。
CyrilXBT: (翻訳) OBSIDIANの作成者が、あなたのノートVaultをAIエージェントに変えました。プラグインでも統合でもありません。Claude Code、Codex、OpenCodeに、パワーユーザーのようにObsidian Vault内で読み、書き、推論することを教える完全なエージェントスキルシステムです。

CyrilXBT: (翻訳) バーミンガム大学でナレッジグラフの論文を書いたロンドン在住のAIエンジニアがGRAPHIFYをリリースしました。1つのコマンドで任意のフォルダをClaude Codeの第2の脳に変えます。KarpathyがLLM wikiのアイデアを投稿してから48時間で構築されました。

CyrilXBT: (翻訳) ある中国人トレーダーがObsidian内に第2の脳を構築し、毎朝6時に3つのトレーディングアイデアを生成させ、6ヶ月で18万ドルを稼ぎました。Bloomberg端末も分析デスクもアナリストチームもありません。壁際のMac MiniとポケットのiPhone、そして1つのローカルObsidian Vaultだけです。

GoogleとMediaTekがTPU v9開発で協業か【続報】

  • Googleの次世代TPU開発に関する続報です。
  • 以前キャンセルされたと報じられていたTPU v9について、新たにMediaTekと協力してアップグレード版(コードネーム:Triggerfish)を開発していると報じられました。
  • AIエージェントや強化学習をターゲットとし、SRAM容量の大幅なアップグレードが特徴とされています。
  • MediaTekがこの高価格な新規受注を独占的に獲得したとの見方が広がっています。
Jukan: (翻訳) 「私の最新の業界調査によると、GoogleはTPU v9 / Humufishをベースにしたアップグレード版v9チップ(コードネーム:Triggerfish)を開発しており、MediaTekがこの高価格な新規受注を独占的に獲得したようです。(中略)このプロジェクトは、MediaTekがGoogleの優先パートナーであることをさらに裏付けています」

パウロ: (翻訳) GoogleとMediaTekは、SRAM容量の大幅なアップグレードを通じて、TPU v9をHumufishから「Triggerfish」へと移行させています。これは戦略的に妥当なロードマップです。SRAM容量の強化はMediaTekの技術的得意分野に完全に合致しています。

Compute King: (翻訳) GoogleがMediaTekとのTPU v9での協力を深化:TriggerfishはAIエージェント、強化学習、有効算力の最大化を指向。郭氏の情報によると、Googleはアップグレード版TPU v9チップを推進しており、内部コードネームはTriggerfishの可能性が高いとのことです。

OpenAI次世代音声モデル「gpt-bidi-1」展開開始【続報】

  • OpenAIの次世代音声モデルに関する続報です。
  • 双方向(Bidirectional)の音声モードを備えた「gpt-bidi-1」が、ChatGPTアプリの一部ユーザー向けに展開され始めました。
  • ユーザーの発言を遮ったり、話しながらカウントしたり、間違いを訂正したりすることが可能です。
  • リアルタイムで自然な対話を実現するデモ動画が公開され、大きな反響を呼んでいます。
leo 🐾: (翻訳) 🚨 OpenAIの次世代音声モデル「gpt-bidi-1」が、ChatGPTアプリの一部ユーザー向けに展開されています。このデモをご覧ください!

PFN、国産LLM「PLaMo 3.0 Prime」提供開始【続報】

  • Preferred Networks (PFN) が開発する国産大規模言語モデルの続報です。
  • 最新版となる「PLaMo 3.0 Prime」の提供が開始されました。
  • 複雑なタスク向けのReasoningモデルと高速なNon-reasoningモデルが用意され、256Kのコンテキスト長に対応しています。
  • 同価格帯のモデルと比較して、日本語の指示追従やコーディング能力で同等以上の性能を実現しているとのことです。
Daisuke Okanohara / 岡野原 大輔: PLaMo 3.0 Primeの提供を開始しました! 主要ベンチマークで大幅な性能向上を達成し、同価格帯の商用モデルやオープンモデルと比較しても、日本語指示追従、コーディング、ツール利用などで、匹敵、上回る性能を実現しています。さらに256K コンテキスト長への対応してます。 ぜひお試しください! https://t.co/4L8k6zga81

インドJioが5億人の通信網をAIエージェントのテストベッドに

  • インドの通信大手Jioが、5億人のユーザーを抱える自社の通信ネットワークを日常的なAIエージェントの巨大なテストベッドにしていると報じられました。
  • 「Jio Call Agent」は通話内に常駐し、同意のもとで音声を書き起こし、要約し、タクシーの手配や食事の注文などのアクションをトリガーします。
  • 大規模なインフラを活用したAIエージェントの実社会への統合事例として注目されています。
Rohan Paul: (翻訳) TechCrunch:アンバニ氏は、Jioの5億人の通信ネットワークを、日常的なAIエージェントのためのインド最大のテストベッドに変えようとしています。Jio Call Agentは通話内に常駐し、同意のもとで音声を書き起こし、会話を要約し、タクシーの予約や食事の注文などのアクションをトリガーします。

AI導入が専門家のハードスキルを低下させる可能性を示す研究

  • Nature誌に掲載された新しい研究で、AIの導入が専門家のハードスキルを低下させる可能性が示唆されました。
  • ポーランドで行われた大腸内視鏡検査の研究では、経験豊富な内視鏡医のAI支援なしでの腺腫発見率が、AI導入後に28.4%から22.4%に低下しました。
  • AIは時間を節約する一方で、専門家が依存することで本来のスキルが弱まるリスクがあるとして議論を呼んでいます。
Rohan Paul: (翻訳) Nature誌に掲載された新しい研究:AIは時間を節約するかもしれませんが、初期の証拠は、専門家が依存するハードスキルを弱める可能性があることを示唆しています。ポーランドの大腸内視鏡検査の研究では、経験豊富な内視鏡医のAI支援なしでの腺腫発見率が、AI導入後に28.4%から22.4%に低下しました。

Subscribe to ML_Bear Times

(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください