谷歌发布GeminiOmni原生多模态模型

Alpha 派 3 信息等级 3 抓取：2026-05-20 04:28

AI 行业动态美股

摘要

谷歌在I/O开发者大会上正式发布原生多模态模型Gemini Omni，支持任意模态输入输出与实时视频编辑。同时发布Gemini 3.5 Flash和个人AI助理Spark，构成全栈式Agentic AI升级。

客观事实

谷歌在I/O大会上发布原生多模态模型Gemini Omni
Gemini Omni支持任意模态输入输出与实时视频编辑
谷歌同时发布Gemini 3.5 Flash和Spark AI助手

谷歌 Gemini Omni Gemini 3.5 Flash Spark

原文

北京时间5月20日，谷歌在I/O开发者大会上正式发布了原生多模态模型Gemini Omni，其支持任意模态输入输出与实时视频编辑，并与高效的Gemini 3.5 Flash和个人AI助理Spark共同构成了全栈式的Agentic AI升级。这一系列发布标志着AI竞争的焦点已从单纯的模型参数与能力比拼，转向以Agent为核心、深度整合全家桶生态的入口级战争，谷歌正凭借其工程化与生态整合能力重构AI交互范式，加速应用商业化落地。关注：阅文集团/中文在线/恺英网络/奥飞娱乐（原生多模态模型降低了IP内容视频化、游戏化的生产成本与门槛），快手/腾讯控股/阿里巴巴/昆仑万维（面临从模型单点能力到“模型+Agent平台+生态”的全栈竞争压力），汇量科技/易点天下（AI生态的完善与商业化加速，利好AI营销与应用分发）