Hugging Face 发布了开源 DNA 基础模型 Carbon,具有开放权重、训练代码和数据管道,比同尺寸最佳模型快 275 倍,可在笔记本电脑上本地运行,使用 DNA 原生 tokenizer 分割序列。
Lab0推出AI FDE产品,自动化企业软件售后交付流程,从客户流程发现、配置、测试到上线,将原本六个月的部署时间缩短至十天。
罗尔斯罗伊斯动力系统在伦敦数据中心直播活动中发表主题演讲,探讨AI时代的电力挑战。演讲人Vittorio Pierangeli,演讲标题为“为AI时代提供动力”。
Google在I/O大会上发布了一系列基于Gemini的新产品和功能,包括Omni模型、Gemini 3.5 Flash、Spark代理、Antigravity 2.0以及搜索升级,旨在将Gemini打造成其所有产品的代理引擎。
EU负责关键IT系统的机构讨论了AI在政府数据中心运营中的愿景,认为AI将带来变革但需要时间,短期内不会完全实现。
英伟达RTX 5090D V2游戏芯片被加入海关禁令列表,发生在黄仁勋访问北京期间,传递出降级芯片无机会的明确信号。
推特用户爆料,中国已禁止进口被削弱版本的NVIDIA RTX 5090显卡。
Jabil在JP Morgan炉边谈话中确认,与Sivers合作的1.6T LRO光收发器量产时间提前,未来1-4个月进入认证,认证周期2-6个月。该产品功耗约11千瓦,远低于现有1.6T方案,形成显著竞争壁垒。需求极度旺盛,供应不足,任何生产的产品都将被市场采购,收入实现窗口预计在2026年底至2027年初。
Zepto联合创始人Aadit Palicha在Startup School India分享公司发展历程:从新冠期间在孟买通过WhatsApp群组配送杂货起家,现已成长为拥有超过20万员工、日处理数百万订单的印度最大即时电商平台之一。公司基于10分钟配送模式,自建暗店网络,并利用AI和机器人提升供应链效率,同时拓展广告业务。
OpenAI宣布向Y Combinator当前批次的每家初创公司提供200万美元API积分,用于支持下一代AI应用的计算需求。
OpenAI计划用价值8亿美元的算力换取400家YC初创公司约2%的股权,这是一项直接交易,涉及金额和股权比例明确。
@levie 在推特分享与多家财富500强企业CIO晚餐后的观察,指出Token成本将成为企业应用AI的主导话题。CIO们尝试多种成本管理策略,但尚未找到完美方案。
OpenAI愿意用8亿美元的计算资源换取400家YC创业公司约2%的股权。该交易涉及大量计算资源与初创企业股权交换,可能影响AI初创生态。
OpenAI向Y Combinator当前批次每家初创公司提供200万美元API信用额度,用于计算资源支持,推动下一代技术发展。
OpenAI宣布向Y Combinator当前批次每家初创公司提供200万美元API积分投资,旨在为新一代初创企业提供算力支持。
Google在I/O 2026发布Gemini 3.5 Flash,月处理token量达3.2万亿同比增长7倍,Gemini应用月活超9亿覆盖230+国家。同时展示Gemini Live语音、Omni视频等模态及Antigravity代理栈。
RADAR 宣布完成 1.7 亿美元 B 轮融资,估值超过 10 亿美元。该公司专注于 Physical AI 领域。
Gemini Flash 3.5 模型上线 CursorBench 编码智能体评估基准,团队将随新模型发布持续更新排行榜。
一家大型保险公司使用Runway AI工具进行广告本地化,仅花费7美元积分即完成唇形同步和音频生成,避免了超过1万美元的重拍成本,实现99%的成本降低。
OpenAI CEO Sam Altman表示对代币化初创公司充满期待,并宣布OpenAI向YC当前批次的每家初创公司投资200万美元代币。
GBrain 推出新功能,可将技能、代码、测试、解析器及其触发器和评估打包成 SKILLPACK,方便用户分享和安装。
OpenAI CEO Sam Altman在Y Combinator活动中宣布,向当前批次的每个YC初创公司提供200万美元的OpenAI tokens。涉及金额明确,对象具体。
OpenAI CEO Sam Altman在Y Combinator活动上宣布,向当前批次的每个YC初创公司提供200万美元的OpenAI代币资助。
Google I/O 2026 首日发布多项重大产品:Gemini 3.5 Flash 模型、Anti-Gravity 2.0 开发平台、AI Studio Workspace 集成、Gemini 消费端重新设计、Omni 视频生成模型、Flow 视频编辑工具等。
NVIDIA发布了Nemotron-Labs-Diffusion系列扩散语言模型,该模型能够同时生成多个token,不同于传统逐token生成的语言模型。
Hugging Face开源了基因组基础模型,推动AI在基因组学领域的应用。
开源Marlin-2B视觉语言模型,用于从视频中提取结构化信息。该模型专注于两个问题的微调。
在Google I/O大会上,NVIDIA和Google Cloud宣布联合开发者社区在一年内突破10万名开发者。社区成员已构建RAG应用、多智能体管道等。今年新增JAX学习路径、NVIDIA Dynamo优化codelab和月度开发者直播。此外,NVIDIA与Google DeepMind合作,使用SynthID为NVIDIA Cosmos模型输出添加水印。
GBrain v0.36.6版本发布,新增完整多模态图像嵌入功能,用户可加载照片和图像并随时检索。
谷歌Q1云业务同比增长63%,积压订单达4620亿美元,环比增90%;今年TPU出货指引400-480万颗,明年1500万颗,后年3000万颗,产业链预计明年增长3倍;Anthropic年化收入4月初300亿美元,预期5月底达500亿美元;谷歌I/O大会将发布新Gemini模型、安卓17等,利好TPU、OCS、液冷产业链。
OpenAI的一个模型解决了80年历史的单位距离问题,否定了离散几何中的主要猜想,标志着AI驱动数学的里程碑。
Ramp公司工程师利用Codex与GPT-5.5进行代码审查,显著加速开发流程,将获取实质性反馈的时间从数小时缩短至数分钟。
OpenAI 推进“Education for Countries”计划,通过新合作伙伴关系、教师培训和工具,扩大 AI 在学校中的应用,旨在改善全球学习成果。
NVIDIA发布Nemotron-Labs-Diffusion系列扩散语言模型,参数规模3B至14B,支持并行生成多个token并在生成过程中进行修订,提升推理速度,还包括视觉语言变体。
NVIDIA技术博客提出为Agent harnesses(如Claude Code、Codex、LangChain Deep Agents)添加专门深度研究技能,以克服其在多文档合成、企业数据决策简报和长周期分析等任务中的局限性,提升复杂研究能力。
llm-gemini 发布0.32版本,新增gemini-3.5-flash模型,用于Gemini 3.5 Flash。
NVIDIA 发布验证代理技能功能,为 AI 代理提供能力治理,旨在增强透明度和信任,确保代理使用的技能可信。
开源了一个名为Marlin-2B的小型视觉语言模型,用于从视频中提取结构化信息。
谷歌将Gemini CLI替换为Agy(antigravity cli),但Agy并非开源且不再支持ACP。该消息来自Twitter,引起社区关注。
2026年AI工程调查启动,与Notion合作,旨在收集AI工程师相关数据。
开发者宣布Chrome开发者工具将支持llms.txt验证功能,该消息来自推特,引起少量讨论。
伊利诺伊大学香槟分校研究人员发表论文,证明旋转位置编码(RoPE)在长上下文任务中既不能区分位置也不能区分token,对LLM长上下文理解提出挑战。
根据Twitter用户@simonw的笔记,Google计划将Gemini 3.5 Flash模型用于其多个自有产品,该模型定价是Gemini 3 Flash的三倍。
谷歌在I/O大会发布Gemini 3.5 Flash,直接进入通用可用阶段,用于Gemini应用、AI搜索、Antigravity平台等。新模型价格上涨,输入每百万tokens 1.5美元,输出9美元,是上一代Flash的3-6倍。支持104万输入token,知识截止2025年1月。同时推出Interactions API测试版,对标OpenAI的Responses模式。
gdb在推特宣布,提供折扣token和容量保证以换取1-3年承诺,并预期未来模型持续进步将导致容量日益紧张。
推文指出,Gemini 3.5 Flash定价9美元,较15个月前发布的Gemini 2.0 Flash的0.4美元上涨22.5倍。
Eric Jang报告指出,当前AI模型已能良好实现和运行实验,但无法可靠地选择下一个要探究的正确问题,也无法判断何时陷入死胡同,这是自动化AI研究的主要瓶颈。
JeffDean在推特宣布Google发布新模型Gemini 3.5 Flash,强调其快速且能力强大。
OpenAI 宣布 ChatGPT 每周生成超过 15 亿张图片,产品负责人和研究专家探讨图像 2.0 的新用例和趋势。
在Google IO 2026上,Google宣布为Gmail的AI收件箱增加对话式语音搜索功能,允许用户通过语音指令让Gemini AI查找邮件中的特定信息。