高通CEO公开表示,公司正在与OpenAI、Meta及其他公司合作开发下一代产品,此前外界曾认为OpenAI仅与联发科合作。
OpenAI 介绍了安全运行 Codex 的方案,包括沙箱、审批、网络策略和代理原生遥测,以支持安全合规的编码代理采用。
Charmaine Klee 在推特上表示,Claude managed agents 已在 Val Town 上可用,其编辑-浏览器-部署模型为构建代理提供了良好的开发体验。
浮动数据中心作为AI基础设施的非传统实验正在兴起,Panthalassa的项目吸引了数百万投资,表明这一创新方向获得关注。
英伟达与康宁深化合作,共同推进光纤和光子学技术在AI数据中心基础设施中的应用,以支持超大规模部署和光网络发展。
Anthropic与SpaceXAI达成合作,使Anthropic能够使用全球最大的超级计算机之一。这标志着AI基础设施在全球范围内进一步扩展。
Fluence Energy盘前上涨18.66%,因公司将获得2个直接超大规模云服务商合同。市场认为此类合同对小市值公司是重大利好,可能引发估值重估。
AI数据中心导致不可预测的电力波动,迫使电力公司改变建模方式,从仅关注功耗转向分析设施在扰动中的行为,以保障电网稳定。
OpenAI发布了三个新的API语音模型:GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper。其中Realtime-2具备GPT-5级别的推理能力,支持同时使用多个工具并能边思考边说话。在Big Bench Audio基准测试中,Realtime-2得分96.6%,较前代提升15个百分点,显著缩小了推理差距。
4月Product Hunt榜单盘点显示,AI Agent产品竞争从“命名红利”转向“能干活”,产品需切入真实高频工作流。Brila以1287票获月最高票,为本地商家生成网站;其他产品如ProdShort、Figma for Agents、Claude Code Routines、Fathom 3.0等也各有具体场景。
Frost & Sullivan的白皮书指出,液冷和热管理正成为AI数据中心性能和可持续性的核心。
OpenAI发布了GPT-Realtime-2等三个实时语音模型,在Big Bench Audio上性能提升15.2%,新增前导语、并行工具调用、更强恢复行为、128K上下文、可控语气和推理级别调整等功能。
施耐德电气与NVIDIA合作,利用数字孪生技术模拟和验证吉瓦级数据中心,以支持AI工作负载的扩展。该技术可在实际部署前优化设计,提升效率与可靠性。
Original 苏清涛 苏清涛 九章具身-价值锚
在具身智能这个依然处于“寒武纪大爆发”前夜的赛道里,资本市场从不缺能画出完美 DCF(现金流折现)模型的分析师。他们用精密的 Excel 表格,推演着一家家初创公司在 2030 年的现金流,仿佛未来已经像瑞士钟表一样精准运转。
但毫不客气地说,这些模型在具身智能这种离大规模商业落地还有很长时间的产业,往往只是“伪精确”的自我安慰。
事实上,许多定量分析、财务预测与估值推演,本质上是写给那些认知能力不行的人看的,或者是写给那些很享受“上当受骗的感觉”的外行看的。 他们需要一个确定的数字来抚慰对不确定性的恐惧,哪怕这个数字是虚构的、瞎编的。
在这个充满噪音的阶段,**定量分析
GStack v1.28 发布,GStack Browser 新增下载功能,支持在无头 Linux 容器中通过 Xvfb 运行带有反机器人检测的 headed 模式;添加 llms.txt 文件便于各类 AI 代理使用所有技能。
GBrain v0.29和v0.29.1版本发布,新增显著性功能,可识别情感强烈、对人类重要、不寻常或有趣的内容。
vLLM项目维护者正在优化DeepSeekv4的首日性能,并在周末合并了初始模型支持PR,强调速度是关键优势。
OpenAI发布GPT-5.5-Cyber模型有限预览,面向防御者用于保护关键基础设施。
Sam Altman表示希望帮助公司提升自身安全,并认为应尽快开始相关工作。
YC在旧金山举办AI销售主题闭门会,邀请销售领导者参与。LinkedIn技术运营副总裁和ClickUp销售策略AI负责人与HyperboundAI联合创始人讨论AI应用,8家YC初创公司进行闪电演示。
Rork 推出 AI Cloud,支持 150 多种模型,可一键启动几乎所有 AI 应用,包括 Higgsfield。
Hugging Face 为 Reachy Mini 推出具身机器人应用商店,NVIDIA Robotics 转发称其为向更易获取的物理 AI 迈出重要一步。
人形板块回调48个交易日,跌幅25%,换手率回升至3.4%。特斯拉Optimus V3将于7-8月发布,供应链将提前获订单;国内厂商已传完成PPAP,宇树等国产本体厂推进IPO。
Nvidia与IREN计划合作部署高达5GW的AI基础设施,位于德克萨斯州Sweetwater的园区被定位为Nvidia DSX AI工厂架构的旗舰站点。
OpenAI的Codex现在可以驱动Chrome浏览器后台标签页,实现自动化操作。该功能提升了AI与浏览器的集成能力。
台积电先进封装收入占比将提升至12%,CoWoS产能紧缺,日月光已提价20%-40%。先进封装扩产需1.5年,供需缺口至少维持3-4个季度,净利率可达30%。
OpenAI在其API中推出了新的语音智能功能,可应用于客户服务、教育和创作者平台。
Cognition 在推特宣布推出 SWE-1.6 Fast 版本,由 Cerebras 提供支持,宣称速度达到每秒 1000 tokens。
Perplexity 确认基于 NVIDIA 平台运行,并使用 CUTLASS Python 栈优化模型,展示了双方在 AI 算力上的合作。
人工智能健身教练应用Imperfect正式上线,可根据用户健康数据实现个性化训练、恢复和营养计划调整。
AI Heroes 使用 gbrain 与其自有生产记忆栈进行对比测试,在 150 个实际问题上 gbrain 获胜。
BitboardHQ 宣布推出一个数据分析工作空间,支持连接 Claude、Cursor 等 AI 代理工具。
NVIDIA发布技术博客,介绍GB200 NVL72系统通过NVLink扩展一致性实现整机架性能,带来机架级局部性硬约束,并对Slurm调度器进行优化以提升集群效率。
NVIDIA 发布 Model Optimizer 工具,用于模型量化,可降低 VRAM 使用并提升在 GeForce RTX GPU 等消费级设备上的推理性能。
NVIDIA官方推特表示Perplexity运行在NVIDIA上,并介绍了团队使用CUTLASS Python堆栈优化推理模型的细节。
Anthropic将开源对齐工具Petri捐赠给Meridian Labs,并发布重大更新,提升测试的适应性、真实性和深度。
AI初创公司Pit由欧洲滑板车巨头Voi的联合创始人创立,a16z领投其1600万美元种子轮融资,成为斯德哥尔摩新星。
Claude管理代理快速入门在Val Town平台上线,用户可以分叉并添加API密钥后运行。
Vellum公司宣布完成2500万美元融资,用于构建全球首个个人智能(Personal Intelligence)系统,名为Vellum,强调AI属于用户。该消息在Twitter上传播,获得了较高关注。
OpenAI为ChatGPT推出信任联系人安全措施,在对话涉及自残风险时可触发联系预设联系人。
OpenAI宣布Codex现在可以直接在Chrome浏览器中工作,支持macOS和Windows系统,并改进了与Chrome中应用和网站的配合。
Antirez宣布推出DS4,这是一个专为DeepSeek v4 Flash设计的推理引擎。项目进展顺利。
据曝光细节,xAI与Anthropic就Colossus数据中心达成协议:Anthropic获得Colossus 1,而xAI保留使用更大的Colossus数据中心。该交易涉及两大AI公司的基础设施分配,影响算力资源格局。
Whisper模型新增实时流式转录功能,推出gpt-realtime-whisper模型,支持流式处理。
开发者将 hello-realtime 演示更新为使用新的 gpt-realtime-2 模型,该模型支持推理功能。
OpenAI宣布Codex现在可以直接在Chrome浏览器上运行,支持macOS和Windows系统,能够并行处理多个标签页,无需接管浏览器。用户需安装Chrome插件。
OpenAI宣布推出新的实时翻译模型,即日起可通过API使用。
Chronicle Labs 推出了一个面向企业 AI agent 的 staging 环境,允许团队在沙盒中重放生产事件进行回测,类似于交易算法在实盘前的回测。
Perplexity 推出 Personal Computer,将 AI 代理带入 Mac,现已对所有人开放。
llm-gemini 0.31版本发布,其中gemini-3.1-flash-lite模型从预览版转为正式版。