2026年01月30日 朝のAIニュースまとめ
(ほぼ)毎日AIニュースが届きます。ぜひご登録ください。
(ほぼ)毎日AIニュースが届きます
ぜひご登録ください
Googleの世界生成AI「Genie」限定公開開始とAppleの20億ドル買収
Googleが世界生成AI「Genie 3」を米国のAI Ultra加入者向けに限定公開しました。テキストや画像から仮想世界を生成できる技術で、ゲーム制作への応用が期待されます。
また、AppleがイスラエルのqAIを約20億ドルで買収。ささやき声やサイレントスピーチを認識する技術を保有しており、Siriの強化や新インターフェース開発が狙いと見られています。
中国ではByteDanceとAlibabaが2月中旬に新モデルをリリース予定で、競争が激化しています。
では、それぞれのニュースを詳しくご紹介します。
目次
- Google、世界生成AI「Genie」を限定公開【続報】
- xAIの動画生成「Grok Imagine」APIが提供開始【続報】
- Apple、音声認識AI企業qAIを20億ドルで買収か
- 中国AI戦国時代、ByteDanceとAlibabaが2月に新モデル発表か
- (続報) OpenAI、ChatGPTのWeb UIを整理へ 一部モデルを2026年2月に提供終了
- Alibabaの音声認識モデルQwen3-ASRがOSS公開、52言語対応【続報】
- 化学大手Dow、AI活用で4500人削減計画か
- Kaggle金メダル解法記事、生成AI活用術が公開
Google、世界生成AI「Genie」を限定公開【続報】
- 以前お伝えしたGoogleの世界生成AI「Genie 3」の続報です。「Project Genie」という名称で、米国のGoogle AI Ultra加入者向けに限定公開が開始されました。
- テキストや画像からインタラクティブな仮想世界を生成し、その中をリアルタイムで探索・編集できる機能が特徴で、ゲーム制作などへの応用が期待されています。
Google Labs: (翻訳) 🚨新しいLABSの実験🚨 無限に多様な世界を創造し、探検できる実験的プロトタイプ「Project Genie」をご紹介します!画像やテキストでプロンプトを入力すると、リアルタイムで自己構築していく生きた、広がる世界を創造できます。 本日より https://t.co/JTOUdGp8vU でアクセスが順次開始されます。
Chubby♨️: (翻訳) さあ、Genie 3がライブで利用可能になりました! 予想通り、現在米国のGoogle AI Ultra加入者のみが利用できます。 このツールは、世界のスケッチ、ライブ探索、移動に応じた動的な環境のリミックスと生成をサポートし、物理演算とインタラクションがシミュレートされます。
まつにぃ: GeminiUltra向けにProject Genieが開始。 少しづつGeminiUltraの価値が上がってきてるが、果たして実力は...👀
xAIの動画生成「Grok Imagine」APIが提供開始【続報】
- xAIの画像・動画生成モデル「Grok Imagine」に関する続報です。
- 新たにAPI経由での提供が開始され、低コストで利用できるBatch APIも公開されました。
- 「Artificial Analysis Video Arena」のリーダーボードでは、Text to VideoとImage to Videoの両部門で1位を獲得したと報告されています。
Tech Dev Notes: (翻訳) Grok ImagineがxAI APIで利用可能になりました https://t.co/htZkSCl6G9
Tech Dev Notes: (翻訳) xAIがBatch APIをローンチしました。 「xAI APIを使用する必要があるが、リアルタイムの結果を必要としないサービスがある場合、Batch APIを使用してコストを削減し、レート制限の利用率を高めることができます。」
Chubby♨️: (翻訳) 素晴らしい:Grokは、Artificial Analysis Video Arena経由のText2videoとimage2videoにおいてナンバーワンです。 さらに素晴らしいことに、Veo3.1(12ドル)よりもはるかに安く、音声込みで1分あたり4.20ドルのKling 2.5と同等です。
Apple、音声認識AI企業qAIを20億ドルで買収か
- AppleがイスラエルのAIスタートアップ「qAI」を約20億ドルで買収したとFinancial Timesなどが報じました。
- qAIは、ささやき声や声に出さない発話(サイレントスピーチ)を認識する技術を開発しているとされています。
- この買収は、AppleがSiriなどの音声アシスタント機能の強化や、将来のデバイスにおける新たなインターフェースを模索している動きと見られています。
Financial Times: (翻訳) Apple、AIデバイスでMetaやGoogleと競う中、イスラエルのスタートアップ https://t.co/o6wbrIa1f3 を買収
Evan: (翻訳) Apple $AAPL は、イスラエルのステルススタートアップqAIを20億ドルと評価する取引で買収に合意したと報じられています - Financial Times
Yuchen Jin: (翻訳) AppleがイスラエルのスタートアップqAIを20億ドルで買収しました。 qAIは「サイレント音声認識」を手がけており、ささやき声を読み取ることができます。 AppleはSiriの動力源としてGeminiを選びました。これでようやく使えるようになることを願います。qAIが加われば、人々が携帯電話にささやいてClaude Codeをプロンプトする奇妙な未来が来るかもしれません。
中国AI戦国時代、ByteDanceとAlibabaが2月に新モデル発表か
- The Informationによると、中国IT大手のByteDanceとAlibabaが、2月中旬にそれぞれ新しいAIモデルをリリースする準備を進めているとのことです。
- ByteDanceは3つの新モデル、Alibabaは次世代モデルを投入する見込みです。
- 既報のDeepSeekも同時期に次期モデルの発表が噂されており、中国国内のAI開発競争が一層激化する見込みです。
The Information: (翻訳) 独占記事:ByteDanceとAlibaba Groupは、2月中旬に次期フラッグシップAIモデルをリリースする準備を整えており、競争が激化しています。 詳細はこちら @JuroOsawa @QianerLiu 👇 https://t.co/IOzHlRQD0z
Jukan: (翻訳) ByteDanceとAlibabaが新しいAIモデルを発表予定(The Information)。 • ByteDanceは来月3つの新しいAIモデルを発表する計画で、Alibabaも来月次世代AIモデルを発表する予定です。
Lisan al Gaib: (翻訳) 約2〜3週間後には、以下が手に入ります: - DeepSeek-V4 - Qwen-3.5 - Seed 2.0
(続報) OpenAI、ChatGPTのWeb UIを整理へ 一部モデルを2026年2月に提供終了
- 以前提供開始をお伝えしたGPT-4oやGPT-4.1などのモデルについて、OpenAIがChatGPTのWeb UI上での提供を2026年2月13日に終了すると発表しました。
- 提供終了の対象となるのは、GPT-4o、GPT-4.1(およびmini)、o4-miniなどのモデルです。
- これらのモデルはAPI経由では引き続き利用可能で、今回の措置はWeb UI上でのモデル選択肢を整理する目的とみられます。
Legit: (翻訳) OpenAIがChatGPTのモデルを廃止します - GPT-4o - GPT-4.1 (および 4.1 mini) - o4-mini これは2月13日に行われます これらのモデルはAPIでは引き続き利用可能です
Tibor Blaho: (翻訳) OpenAIは2026年2月13日をもって、ChatGPTからGPT-4o, GPT-4.1, GPT-4.1 mini, o4-mini, およびGPT-5 Instant and Thinkingを廃止します。
morgan —: (翻訳) openai: 4oを選ぶユーザーはまだ0.1%しかいない ツイッター上の声高な少数派は、すべての公式投稿のリプライで血を要求したとしても、依然として非常に少数派である
Alibabaの音声認識モデルQwen3-ASRがOSS公開、52言語対応【続報】
- 以前お伝えしたAlibabaの音声認識モデル「Qwen3-ASR」が、オープンソースで公開されました。
- 対応言語が9言語から52の言語・方言に大幅に拡大されています。
- リアルタイムのストリーミング音声認識にも対応し、ノイズの多い実世界の音声データでも高い精度を発揮します。
Junyang Lin: (翻訳) 先週のttsに続き、タイムスタンプ予測のためのqwen3-asrとforcedalignerをリリースし、オープンソース化しました!オムニモデルの上に構築されたqwen3-asrは、かなり優れたパフォーマンスを達成でき、52以上の言語と方言をサポートしています!
Qwen: (翻訳) Qwen3-ASRは、ネイティブストリーミングをサポートする業界初のオープンソースLLMベースASRです。デモ:https://t.co/y2X1slCMcs vLLMの例:https://t.co/5id4AeTFFz
webbigdata: Qwen3-ASR 1.7B 4.7GB、0.6B 1.88GB タイムスタンプ付加用のForcedAlignerは 0.6B 1.84G apache-2.0 添付は0.6BのTransformers版で2分の音声を書き起こしたデモで別途高速化は可能 従来モデルでは認識が難しいYoutube、Podcast、CEOなどの英単語にも対応できており実感としてGeminiに迫る感触 https:/...
化学大手Dow、AI活用で4500人削減計画か
- 化学大手のDowが、事業の簡素化と合理化のためにAIと自動化を活用し、約4,500人の従業員を削減する計画であることがBloombergによって報じられました。
- この動きは、AI技術が製造業などの伝統的な産業においても、業務効率化と人員構成の最適化を目的として導入が進んでいることを示す事例です。
- AIの導入が雇用に与える影響について、改めて議論を呼び起こしそうです。
Bloomberg: (翻訳) ダウはAIと自動化を活用して事業を強化する計画で、約4,500人の雇用を削減する予定です。
Evan: (翻訳) 化学メーカーの$DOWは、AIと自動化を用いて業務を簡素化・効率化することを目指し、4,500人の人員削減計画を発表しました - Bloomberg
Kaggle金メダル解法記事、生成AI活用術が公開
- Kaggleで開催された「MABe Challenge」で金メダルを獲得したチームの解法記事が公開され、その中で生成AIを活用した開発スタイルが注目されています。
- 特に、学習時と推論時で処理を一致させるためのパイプライン構築の部分が高く評価されています。
- コンペティションにおける実践的なAI活用事例として、多くのKaggle参加者にとって有益な情報となっています。
yu4u: ネズミコンペでチームメイトだった @monnu0621 さんの記事です!生成AI活用のところも良いのですが、個人的にはこの推論パイプラインの構築部分が好きです。前回の関東Kaggler会でもこの辺りの話も入れたいなと思っていました。 学習時と同じ処理にするというのが言うは易し的な感じで(文字数 https://t.co/b2vhXJFYfd