Deep Agents宣布与Nebius AI的Token Factory集成,使用户能够在生产级AI基础设施上运行代理工作负载。该消息由LangChain转发,获得一定关注。
Perplexity AI 宣布其产品 Perplexity Computer 帮助 Rho 公司每周会议时间减少 90%。该产品可自动检查 Slack、Notion、Jira、Figma 和 Google Docs 等工具。
Andrej Karpathy是OpenAI联合创始人,已加入Anthropic的预训练团队。预训练是训练Claude模型核心知识的关键阶段,也是构建前沿模型中最昂贵和计算密集的环节之一。
Radar完成1.7亿美元B轮融资,估值达10亿美元。其天花板安装的硬件可高精度读取RFID标签,帮助零售商实时了解库存,已在1400多家门店部署,客户包括American Eagle Outfitters和Gap Inc.等。
弗吉尼亚州修订数据中心发电机许可指南,反映对超大规模备用发电机在AI负载增长下使用频率增加的担忧,社区审查加强。
AWS 博客介绍通过自定义 MCP 服务器扩展 Kiro CLI 的对话记忆,集成 Amazon Bedrock AgentCore Memory 托管服务,实现持久上下文存储与语义检索,支持短期工作记忆和长期智能记忆。
亚马逊宣布SageMaker Feature Store新增支持Apache Iceberg表格式、流式摄取、批量摄取以及通过Lake Formation进行细粒度访问控制,解决元数据膨胀和访问控制难题。
AWS 介绍了在 Amazon Bedrock 上实现程序化工具调用(PTC)的三种方式:自托管 Docker 沙箱、托管解决方案和基于 Anthropic SDK 的代理。PTC 通过模型生成代码并在沙箱中执行,减少多工具工作流中的延迟和 token 消耗。
AI研究员Andrej Karpathy宣布加入Anthropic,将专注于前沿大语言模型的研发工作。他保持对教育的热情,计划未来继续从事相关教育项目。
Y Combinator宣布Andustry(@andustry_hq)是一款AI原生经纪商,帮助制造商寻找工业品供应商。该平台声称可帮助客户节省30%成本,将采购时间缩短一半。
Modal 宣布现支持 Claude AI 的托管代理,通过 Modal Sandboxes 提供运行环境。
Hugging Face 与 tomaarsen 联合发布 Ettin Reranker 家族,包含六种新的 CrossEncoder 重排序模型,参数规模从 17M 到 1B,声称在同规模下达到最先进性能。
General Instinct公司发布技术方案,将前沿AI模型部署到边缘硬件(如Jetson、移动NPU、ARM CPU),实现离线低延迟运行,帮助机器人和物理AI团队。该消息由Y Combinator发布祝贺。
黑石集团承诺投资50亿美元,与谷歌合作成立一家新的美国数据中心公司,专注于围绕谷歌云TPU(AI定制芯片)建设AI云基础设施。
Dell通过NativeEdge、AI Factory和PowerEdge系统推进边缘编排,旨在分布式数据中心环境中实现实时AI扩展。
LeadbayAI 宣布获得 430 万美元融资,其客户包括 Corgi、Deel、L'Oréal 等公司,旨在通过 AI 革新销售流程。
俄克拉荷马州通过新立法,旨在防止人工智能和超大规模数据中心的电力成本转嫁给居民用户。该法律针对数据中心电力费用分摊问题,为居民提供保护。
华创研究所2026年中期策略会提及南方传媒:2025年营收86.35亿元,归母净利润10.43亿元同比增近29%;2026年Q1营收19.69亿元,归母净利3亿元;核心教材教辅业务增2.43%,粤版国标教材审定数全国第二,粤教祥云覆盖1.94万所学校;AI业务2025年体量约2亿元,预计2026年增20%以上;发力书影融合新赛道。
OpenAI宣布推进AI内容来源技术,包括Content Credentials、SynthID和验证工具,以帮助用户识别和信任AI生成的媒体内容。
马斯克对OpenAI、Sam Altman、Greg Brockman和微软提起的超过1000亿美元的诉讼被陪审团驳回,理由是起诉时间过晚。马斯克称判决为“日历技术性”问题并计划上诉。
GSR分析文章指出,Nvidia在中国收入占比从约26%降至约5%,但其战略意图并非收入,而是将中国视为观察AI基础设施演进的实验室。中国本土AI芯片生态(华为、DeepSeek、阿里巴巴)已进入架构实验和系统优化阶段。然而,GSR认为Nvidia中国团队未能有效执行战略,与客户沟通不足。
暗光纤提供商Big Fiber获得2.5亿美元融资,将用于扩建暗光纤路由和容量。此次融资的背景是超大规模云服务商在电力丰富地区建设分布式AI园区,推动了对暗光纤的需求。
陶氏推出面向液冷数据中心的新型冷却液管理服务,旨在满足AI工作负载对热可靠性的增长需求。该服务提供全面的冷却液支持,确保数据中心高效运行。
Digital Realty在巴塞罗那启用首个数据中心BCN1,旨在满足AI算力需求并受益于地中海海底电缆增长。
三星电子和SK海力士为应对内存短缺,加速工厂建设竞赛。三星加快平泽园区P5 Fab 1建设,计划将工期缩短过半,原定2028年下半年完工;P6工厂将于7月开工。双方争夺施工材料,竞争加剧。
GBrain发布v0.36.1版本,新增Hindsight功能,可追踪预测并帮助改进预测。该功能灵感来自周末黑客马拉松团队的创意,并首次加入了完整评估。
Anthropic正在构建下一代Claude模型,其负责人Alex Albert分享了5个关键要点,包括模型和硬件协同设计等方向。
llama.cpp 新增 MTP(多令牌预测)支持,本地模型推理速度显著提升,足以作为日常驱动。Qwen3.6-27B 密集生成在 A10 GPU 上得到展示,推动本地 AI 部署实用性。
玻璃纤维严重短缺,AI服务器升级至224G PAM4推动高性能低介电Low-Dk和低热膨胀Low-CTE材料需求激增。台燿科技高端M7/M8材料供不应求,计划2026年三季度出货下一代M9材料。日本企业主导高端Low-CTE玻璃纤维市场,台湾厂商富乔纤维进入AI服务器供应链,宝特扩展高强度玻璃纤维,Grandsys受益于通用产品涨价并开发新材料。
Lucius是一家企业级AI员工公司,创始人赵赫称其产品为Context Layer,通过有SLA的合同保证交付。公司服务三十余家企业客户,最快案例客户仅看10分钟Demo即购买。团队12人,CTO来自谷歌YouTube机器学习组。
据台湾媒体,英伟达CEO黄仁勋可能重返台湾,并在Computex展会上发布一款与联发科合作开发的边缘设备芯片。
英伟达官方宣布,SpaceX及埃隆·马斯克将试用其新一代Vera CPU。该CPU为英伟达最新产品,标志着其在CPU领域的重要布局。
Perplexity Computer 新增 Artifacts 页面,侧边栏提供快捷方式,用户可查看和固定应用、文档等。
戴尔CEO迈克尔·戴尔在Dell TechWorld大会上发表演讲,强调提供模型选择以避免基础设施混乱,并提及Kimi K2.6、DeepSeek V等模型,展示公司在AI基础设施领域的布局。
huggingface的hf-mem工具更新,新增将混合专家模型(MoE)内存估计分解为基础权重、路由专家和KV缓存三个部分的功能。
llama.cpp 新增 MTP 支持,使本地模型运行速度足够日常使用。Qwen3.6-27B 模型在 A10 GPU 上实现快速文本生成。
NVIDIA首次交付自研CPU Vera给AnthropicAI、OpenAI、SpaceX和OracleCloud等合作伙伴,面向智能体AI时代。这是NVIDIA首款定制CPU,标志着其进入CPU领域。
阿里未来资本开支超原计划3800亿元,数据中心规模较2022年增10倍,自研AI推理芯片已量产,60%算力服务外部客户;腾讯一季度经营性资本开支同比增84%,下半年国产算力资本开支将大幅提升。国家建设全国一体化算力网,今年六网基建投资超7万亿元,要求自立自强,利好国产芯片、服务器、IDC等全产业链。
SandboxAQ 将其药物发现模型集成到 Anthropic 的 Claude 平台,旨在降低 AI 药物发现的计算门槛,使无需深厚计算背景的研究人员也能使用。
Y Combinator将于5月30日在旧金山举办语音代理黑客马拉松,获奖者将获得保证的YC面试机会及其他特别奖项。
Mentra Live开源智能眼镜正式发布,面向实际工作场景部署,已出货数千台。
据推特消息,文学期刊正在发表并奖励AI创作的故事,包括知名杂志Granta。这反映了AI在文学领域的渗透趋势。
GBrain v0.36版本发布,包含全新README和重构的skillpack系统,允许用户自行修改技能包,同时保持与官方更新兼容。
Anthropic收购了纽约初创公司Stainless,该公司成立于2022年,专注于自动化生成和维护软件开发工具包(SDK),其客户包括OpenAI、Google和Cloudflare。
Nous Research发布Hermes Agent v0.14.0,新增Grok订阅、Codex运行时和Windows测试版支持。
VentureBeat报道LangSmith Engine可自动化代理修复循环,检测失败、诊断原因并起草PR,涉及多模态功能。
本文介绍如何使用Amazon Nova 2 Lite进行内容审核,基于MLCommons AILuminate标准,支持自定义审核政策。文章展示了该模型在三个公共数据集上与其他基础模型的基准测试结果,强调通过提示调整审核策略无需训练数据。
llama.cpp 新增对 Qwen3.6 系列的多 Token 预测(MTP)支持,被视为本地 AI 生态的重要里程碑,带来性能提升。
生物学家利用DeepMind的Co-Scientist系统快速发现新因子,成功逆转人类细胞衰老,实现细胞年轻化。
Hugging Face与戴尔在戴尔科技世界大会上宣布合作,旨在通过开源模型推动企业级本地AI部署,作为应对GPU短缺的解决方案。