DeepSeek开源多模态模型并发布技术报告

Alpha 派 4 信息等级 4 发布：2026-05-02T20:07 抓取：2026-05-03 07:58

AI 算力动态

摘要

5月1日，DeepSeek在GitHub开源多模态模型并同步发布技术报告。该模型引入视觉原语框架以补齐单模态短板，官方宣称其性能超越GPT-5.4。此外，云天励飞AI芯片平台已宣布完成与该模型的适配工作。此次发布标志着该公司技术路线向全模态方向拓展。

客观事实

5月1日DeepSeek在GitHub开源多模态模型并发布技术报告
该模型采用视觉原语框架，官方宣称性能超越GPT-5.4
云天励飞AI芯片平台已完成与DeepSeek模型的适配

DeepSeek GitHub 云天励飞 GPT-5.4

原文

5月1日，继其V4语言模型发布后，DeepSeek在GitHub迅速开源了多模态模型并发布技术报告，通过“视觉原语”框架弥补了此前单模态的短板。此举标志着其技术路线从长文本追赶快速切入全模态竞争，其宣称超越GPT-5.4的性能若得以验证，将重塑国内AI竞争格局并加速多模态应用的商业化落地。关注：云天励飞（其AI芯片平台已与DeepSeek模型完成适配，有望受益于“模算协同”趋势），AI应用/Agent（国产高性能开源多模态模型降低开发门槛，加速商业化进程），国产算力产业链（DeepSeek模型持续与国产芯片深度适配，形成“模型-芯片-云”闭环趋势，带动算力需求）