2025年04月28日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Gemini 2.5 Pro進化と各社AIモデルの特性比較
Gemini 2.5 Proが注目を集めています。新たに追加されたファイル編集機能やリアルタイム音声対応が高く評価されています。一方、Claude 3 Opusとの日本語対応の違いも議論されています。
GPT-4oとClaude 3 Opusではハルシネーション増加の懸念が報告され、精度と人間らしさのバランスが課題となっています。AIエージェント関連では、MCPエコシステムの拡大やLangChainの新ツール登場など技術進化が続いています。
それでは各トピックの詳細を見ていきましょう。
目次
- Gemini 2.5 Pro、ファイル編集やリアルタイム音声対応で高評価【続報】
- o3 vs Gemini 2.5 Pro: 日本語自然さで評価に差
- GPT-4o・Claude 3 Opus ハルシネーション増加の指摘【続報】
- 【続報】Grok iOS版、ファイル管理・音声自動再生機能を追加
- MCP続報: Dify連携や有料サーバー事例が登場
- ICLR 2025 ロボット基盤モデルやSim2Real研究発表相次ぐ
- LangChain/LangGraph開発続報: 新ツールRyoma, DeepGit 2.0登場、Agent Inbox議論も
- Huawei新AIチップ報道とTSMC先端PKG増強【半導体続報】
- Cline誤字チェック活用、Difyエージェント機能など事例増
Gemini 2.5 Pro、ファイル編集やリアルタイム音声対応で高評価【続報】
- Gemini 2.5 Proについて、新たな高評価が報告されています。【続報】
- 特に、Aiderに触発されたdiff形式でのファイル編集機能が組み込まれ、コード以外の編集にも応用可能と注目されています。
- また、Google AI Studioでのリアルタイム音声応答機能で日本語がサポートされ、よりスムーズな対話が可能になった点も評価されています。
- コード生成能力の高さも引き続き評価されています。
erukiti: ざっくり試してる限りでは、o3よりもGemini 2.5 Proの方がコード生成がちゃんとできる
Philipp Schmid: (翻訳) Gemini 2.5 Proは、(Aiderに触発された)diff形式を使用して正確なファイル編集を行うことができます。📝 これはコードだけでなく、すべてのドキュメントで機能します。SEARCH/REPLACEブロックを使用します。 google-genaiを使用したノートブックの完全な例:https://t.co/VEFwiGIsMp https://t.co/MeDbi43aN0
Kimihiko Kitase ♨️ 北瀬 公彦: おぉぉ!Google AI Studio で リアルタイム音声応答の言語に日本語が選択できるように✨✨ これでゲーム実況しても、スムーズな日本語になりますね🎮 https://t.co/kOrq6lkLFe の Stream Realtime 試してみてねー。 https://t.co/9uIQjERaoa
o3 vs Gemini 2.5 Pro: 日本語自然さで評価に差
- 最新モデルGemini 2.5 Proの登場を受け、AnthropicのClaude 3 Opus (o3)との性能比較に関する議論が活発化している。
- コード生成能力ではGemini 2.5 Proが優れているとの意見がある一方、日本語の自然さや文章の分かりやすさではo3に軍配が上がるとの声もある。
- また、o3は時に難解な語彙を使い、賢く見せようとする傾向があるとの指摘も見られ、モデルの特性の違いが浮き彫りになっている。
Bindu Reddy: (翻訳) o3は世界で断トツに最高の総合LLMです。R2がそれに近づくだけでも大変なことです! R2はおそらくGeminiを上回るでしょうが、o3には及ばないでしょう。
限界助教|ChatGPT/Claude/Geminiで論文作成と科研費申請: Gemini 2.5 Proとo3は甲乙つけ難いですが、o3は必要以上に難しい単語を使って、賢く見せようとしている印象を受けることがあります🤓
K.Ishi@生成AIの産業応用: K.Ishi@生成AIの産業応用 (@K_Ishi_AI) [tweet_id=1916377282622398520] : Gemini 2.5 Proなどが出てきて、Claude 3.7 Sonnetが完全に終了したかというと、そうでもない。 例えば、英語の文章を自然な日本語に翻訳するタスクを与えると、Claudeの日本語訳の方がスッと頭に入ってくるのがわかる。 Claudeは、「人の認知にス...
GPT-4o・Claude 3 Opus ハルシネーション増加の指摘【続報】
- ChatGPT(GPT-4o)とClaude 3 Opusについて、最近ハルシネーションが増加したとの指摘が複数ユーザーから上がっています【続報】。
- 特にGPT-4oは最新アップデート後、応答の人間らしさは向上したものの、事実に基づかない出力が増えた可能性が懸念されています。
- Claude 3 Opusについても、以前からハルシネーションに関する指摘がありましたが、改めて注意喚起されています。
Chubby♨️: (翻訳) 最近、ChatGPTのハルシネーションがかなり増えたと複数の人から聞いています。ユーザーに対してより人間的で感情的なスタンスを取ってくれることは本当に感謝していますし、気に入っています。しかし、それがハルシネーションを犠牲にするものであってはなりません。
mizchi: SCP風の「メタ事象観測員」なる概念を作ってテンプレートに従ってSCP風レポートを作らせてみたら元々ハルシネーションだらけの o3 が更にイキってる感じになった https://t.co/iBDE3Ok9cw
Chubby♨️: (翻訳) どんなに優れたAIが登場しても、必ず欠点を指摘し、それをつついて面白がる人がいます。はい、ChatGPTにも欠点はありますし、最新のアップデートは少し媚びすぎているかもしれません。しかし、真面目な話、ChatGPTは素晴らしいです。最新のイテレーションは素晴らしいです。何
【続報】Grok iOS版、ファイル管理・音声自動再生機能を追加
- Grokに関する続報です。
- iOSアプリ版において、アップロードされたファイルを管理する機能が追加されました。
- また、ユーザー入力なしでGrokが連続して話し続ける「音声自動再生」機能も利用可能になった模様です。
Kol Tregaskes: (翻訳) XのアルゴリズムはxAIまたはGrokのアルゴリズムになります。これにより、ある程度のインテリジェンスがもたらされるはずですが、いくつかのハルシネーションも発生するでしょう。
TestingCatalog News 🗞: (翻訳) Grokの設定に、アップロードされたファイルを管理できる新しいセクションが追加されました。
TestingCatalog News 🗞: (翻訳) iOS版Grokの音声モードに自動再生提案のトグルが追加されました。オンにすると、自分で話す必要なく、しばらくGrokの話を聞くことができます。
MCP続報: Dify連携や有料サーバー事例が登場
- AIエージェント連携プロトコルMCPに関するエコシステム拡大の続報です。
- ローコードAIアプリ開発プラットフォームDifyがMCPサーバー実行とアプリ連携に対応しました。
- 文字起こしツールfast-whisper用や有料のMCPサーバー事例も登場し、活用が広がっています。
まつにぃ: メール来てましたが、 ・Dify上でMCPが実行出来る ・作成したDifyをMCP経由で実行出来る ということで、相当MCP対応広がりましたね! 特に後者は作成したフローがそのままtoolになるので、かなりAgentの武器を増やしやすくなった印象です。 Difyも相変わらず便利で、ネイティブサポート楽しみ。 https://t.co/QQXKZgEEmp
からあげ: fast-whisperで文字起こしするMCPサーバ作りました https://t.co/D1f6fAo6TK
Ian Nuttall: (翻訳) これは私が現在収益化されているのを見た最初(唯一?)のMCPサーバーです。ソロプレナー、vibe coded、おそらくすでに月間経常収益1,000ポンドになっているでしょう(ですよね、@serafimcloud?!)。他に有料MCPサーバーの例を知っている人はいますか?
ICLR 2025 ロボット基盤モデルやSim2Real研究発表相次ぐ
- シンガポールで開催中の国際会議ICLR 2025にて、ロボット学習に関する研究発表が活発に行われている。
- Google DeepMindやStanford大学の研究者らが、ロボット基盤モデル(π-0, π-0.5など)やSim2Real(シミュレーションから実世界への適用)技術に関する最新の知見を発表している。
- 特に、汎用的なロボットポリシー(Generalist Policy)開発における評価の難しさや、センサーシミュレーションへのNeRF活用などが議論されている。
Chelsea Finn: (翻訳) 今日/日曜日に #ICLR2025 で2つの講演を行います! - ポストトレーニングロボット基盤モデル(ロボット学習ワークショップ @ 午後12:50) - オープンエンド汎化を備えたロボット基盤モデル(Foundation Models in the Wild @ 午後2:30) π-0、Demo-SCORE、Hi Robot、π-0.5について説明します。
Hidehisa Arai: 今日と明日はworkshop day、ということでRobot LearningのワークショップでChelsea Finnの話を聞いてきました Piの開発の過程で得られた知見がまとめられていてとても参考になりました 個人的にもGeneralist Policyの開発の中で1番厳しいボトルネックはなにか?という質問をすることができました。 https://t.co/29ozmm162p
Hidehisa Arai: Google DeepmindのSandy Huangのトークでは、sim-to-realの話を聞くことができました 現実とシミュレーションを近づける様々な工夫について聞くことができました。Vision basedなアプローチにするときに、センサーシミュレーションをNeRFをつかってやる話などは自動運転にも通じる話だと思いました https://t.co/UPALm0OEB1
LangChain/LangGraph開発続報: 新ツールRyoma, DeepGit 2.0登場、Agent Inbox議論も
- LangChain/LangGraphを用いたAIエージェント開発の続報。
- 自然言語をDBクエリに変換する「Ryoma」、GitHubリポジトリ検索「DeepGit 2.0」など、新たなツールが登場。
- エージェントとの新たなUIとして「Agent Inbox」形式の可能性も議論されている。
LangChain: (翻訳) 📊🤖 Ryoma: AIデータエージェントフレームワーク LangChainエージェントを活用して自然言語をデータベースクエリに変換するフレームワーク。複数のデータベースにわたるインタラクティブなデータ探索のための組み込みUIを備えています。 GitHubでRyomaをチェック https://t.co/IsN1DHn8bg https://t.co/r6UyrWgVlW
Harrison Chase: (翻訳) 予言します:次のUXは「エージェント受信箱」スタイルになるでしょう。アンビエントエージェントが増えるにつれて、人間とコミュニケーションをとる場所が必要になります。したがって、受信箱です。私たちはこれをプロトタイプ化しました:https://t.co/fVwu5aUuIk このようなものを構築している場合は、連絡してください!
LangChain: (翻訳) 🔍🤖 DeepGit 2.0 LangGraphを活用したGitHub検索システムで、ColBERT v2埋め込みを使用してリポジトリをインテリジェントに検出し、ハードウェア機能に適合させます。 ここで探索してください 👉 https://t.co/B5etkWXxhi https://t.co/z0lylCN2Ij
Huawei新AIチップ報道とTSMC先端PKG増強【半導体続報】
- HuaweiがNVIDIA対抗の新AIチップ「Ascend 910D」を開発中と報じられました(続報)。
- 米国の輸出規制下で製造可能なDUV技術を用いるとみられますが、性能や生産量については懐疑的な見方も出ています。
- 一方、TSMCはAI半導体需要増に対応するため、先端パッケージング技術(CoWoS等)の生産能力増強を加速しています。
unusual_whales: (翻訳) 中国のファーウェイがNvidia($NVDA)に対抗する新しいAIチップを開発
パウロ: Blackwellと同等の性能はHBMとプロセスで無理ですね センセーショナルな見出しに釣られないようにしたい
パウロ: TSMC先端パッケージングの生産能力増強を加速、CoWoSだけでなく、SoICやInFOも 引用 同社は2022年から2026年までの過去5年間の生産能力拡大の年平均成長率(CAGR)の傾向について、CoWoSが80%以上、SoICが100%以上、AI関連テストが80%以上に達すると予測している。 https://t.co/x3mNg8L9kH
Cline誤字チェック活用、Difyエージェント機能など事例増
- AI開発を支援する各種ツールの活用事例が引き続き報告されています。
- コーディング支援ツールClineでは、記事の誤字脱字チェックでの有用性やVertex AI連携、.clinerulesを用いたMCPプラグイン作成などが共有されています。
- ローコードAIアプリ開発プラットフォームDifyでは、エージェント機能のチュートリアルやMCP対応などが話題です。
- また、Google CloudのVertex AIを機械学習パイプライン構築に活用する検討事例も見られます。
azukiazusa: Cline で記事の誤字脱字を指摘させるのが便利
nishimoto: Difyチュートリアル⑤として、エージェント機能について書いてみました。チャットフロー複雑にするならエージェント機能の利用もあり。 #note https://t.co/JhGobiCH34
pon / Hiromu Nakamura: Vertex AI使ったことなかったので、概要をガッと掴むために読んだ。趣味開発のBTC自動取引Botの学習パイプラインがローカル実行で重い&推論環境がKubenetes上にあってインフラ管理面倒になってきたので、勉強がてらVertex AIにマイグレーションしても良さそうだな。 https://t.co/t4vmEjmmGx