谷歌在I/O开发者大会上正式发布原生多模态模型Gemini Omni,支持任意模态输入输出与实时视频编辑。同时发布Gemini 3.5 Flash和个人AI助理Spark,构成全栈式Agentic AI升级。
北京时间5月20日,谷歌在I/O开发者大会上正式发布了原生多模态模型Gemini Omni,其支持任意模态输入输出与实时视频编辑,并与高效的Gemini 3.5 Flash和个人AI助理Spark共同构成了全栈式的Agentic AI升级。这一系列发布标志着AI竞争的焦点已从单纯的模型参数与能力比拼,转向以Agent为核心、深度整合全家桶生态的入口级战争,谷歌正凭借其工程化与生态整合能力重构AI交互范式,加速应用商业化落地。关注:阅文集团/中文在线/恺英网络/奥飞娱乐(原生多模态模型降低了IP内容视频化、游戏化的生产成本与门槛),快手/腾讯控股/阿里巴巴/昆仑万维(面临从模型单点能力到“模型+Agent平台+生态”的全栈竞争压力),汇量科技/易点天下(AI生态的完善与商业化加速,利好AI营销与应用分发)