NVIDIA与Unsloth合作,通过开源贡献使LLM训练速度提升约25%,并发布指南以降低训练门槛。
UnslothAI与NVIDIA合作发布了一项技术,通过3种优化方法使LLM训练速度提升约25%,并分享了实现细节。
英伟达宣布与SpaceX和AnthropicAI达成新的计算合作伙伴关系,将提供超过22万块英伟达GPU,部署在Colossus 1超级计算机上。
Arden公司推出审计自动化代理,可收集证据、测试控制、撰写审计工作底稿,将数周工作缩短为数小时。
HuggingFace首席执行官Clement Delangue将参加Datadog举办的DASH2026大会,并与Datadog CEO Olivier Pomel进行一场炉边谈话。
卫星互联网公司Astranis宣布完成4.5亿美元融资,资金用于扩大产能以满足激增的需求。
据提案,SpaceX计划在德克萨斯州建设名为“Terafab”的芯片工厂,投资高达1190亿美元。该设施将是多阶段、下一代、垂直整合的半导体制造和先进计算制造设施。
Corgi公司成为YC孵化的最新独角兽,从创立到估值13亿美元用时不到两年。
2025年底,Chipbook团队关注高端AI加速器封装测试重要性提升,于12月23日指出两家关键测试耗材公司:台湾Winway和韩国ISC。
Hugging Face CEO转推宣布Qwopus3.6-35B-A3B-v1模型上线,通过Hugging Face Space提供,但具体细节未公布。
NVIDIA宣布Adobe正在其NemoClaw平台上构建Adobe CX Enterprise Coworker。Adobe CX业务总裁Anil Chakravarthy表示,品牌可在NVIDIA OpenShell运行时中部署Adobe客户体验智能,实现企业代理的治理、可观测和可审计。
Harvey与@hwchase17合作开发长周期法律智能体基准测试,旨在推动行业特定基准的建立。
Corgi公司宣布完成1.6亿美元B轮融资,估值达13亿美元,由TCV领投,资金将用于扩展业务。
Anthropic宣布与SpaceX达成合作伙伴关系,将大幅增加其计算能力。该合作将支持其AI模型的训练和推理需求。
Hugging Face推出开源机器人应用商店Reachy Mini App Store,包含200多个应用,类似机器人的应用商店。
Hugging Face推出面向消费者的机器人应用商店,旨在为机器人提供应用程序分发平台,推动机器人技术普及。
NVIDIA AI宣布推出TokenSpeed推理引擎,专为高速智能体工作负载设计。该引擎具备高级KV缓存管理、安全高效调度器、可插拔分层内核系统,支持多芯片,并在NVIDIA Blackwell上实现最快的MLA注意力内核。
谷歌发布并部署了新的开源网络协议MRC,专为大型AI训练集群设计,旨在提高多路径可靠连接性能,已在谷歌最大训练集群上生产部署。
Hugging Face 宣布推出机器人应用商店,旨在推动AI机器人技术的民主化,目前已上线300多个应用。
Meru Health 宣布推出护理模型 Meru Health Advanced,旨在改进心理健康治疗。创始人分享个人经历,强调该模型相对于传统精神病学的创新。
Meru Health Advanced 正式发布,这是一款旨在改善心理健康护理模式的新产品。创始人因哥哥自杀未获有效治疗而创立该公司。
Astranis宣布获得4.5亿美元新融资,用于扩大生产规模以满足激增的需求。
Hugging Face CEO Clement Delangue宣布推出机器人应用商店,已上线300多个应用,部署了10000台机器人,并展示非编程人员快速构建应用的案例。
Serno是一款新工具,可针对单个模型无法回答的问题,即时构建多智能体团队,利用最佳AI模型协同工作。
台湾宠物科技公司Tomofun为其Furbo宠物摄像头采用AWS Inferentia2芯片部署视觉语言模型,替代GPU以降低实时推理成本并保持精度,实现大规模宠物行为检测。
英国设立国家数据中心日,通过#BackToSchool活动将数据中心引入课堂,以解决数字技能缺口并提升对数字基础设施职业的认知。
a16z宣布投资Ethos,Ethos正在构建AI驱动的人力机会基础设施,利用AI语音代理捕捉传统档案遗漏的知识和专长,匹配人才与各类经济机会,顶尖用户月收入超过1万美元。
该公司自研推理引擎ROSE,用于处理从嵌入到万亿参数MoE的生产及API流量。ROSE集成了CuTeDSL,以加速内核部署并在Hoppers和Blackwells GPU上实现峰值性能。
Ethos 宣布从 a16z 获得 2250 万美元融资,用于发展其专家网络平台。该公司目前每周 onboarding 约 35000 名专家,并提供语音入职功能。
Y Combinator 宣布将于5月21日在纽约举办现场面试,面向金融科技创业者,聚焦代币化、稳定币、预测市场、AI交易等领域。
OpenAI发布新型网络协议Multipath Reliable Connection (MRC),用于AI超级计算机中大规模芯片间的高效可靠数据传输,并向全行业开放使用。
一家公司宣布在其API中引入实时授权金融数据,开发者可通过工具调用获取带验证的实时数据,提升金融查询准确性。
Equinix发布2025年可持续发展报告,概述其Future First战略,旨在降低数据中心运营环境影响并支持客户增长。
微软Azure宣布在欧洲多国扩展数据中心,包括奥地利、比利时、丹麦、希腊、芬兰,以支持客户对云和AI的强劲需求。Azure平台驱动Microsoft 365 Copilot和Microsoft Foundry等创新,客户如曼彻斯特市议会已在使用。微软提供主权云解决方案,确保数据合规。
Jackrong和KyleHessling1在Hugging Face上发布了新模型Qwen3.6 35B。该消息通过推文传播,获得较多互动。
OpenAI与AMD、博通、英特尔、微软、英伟达合作发布新型开放网络协议MRC,旨在提升大型AI训练集群的速度和可靠性,减少GPU时间浪费。该协议通过多路径可靠连接优化网络性能,影响AI计算基础设施。
Hugging Face上的SWE-bench Verified排行榜现在比较近50个模型,强调社区基准测试优于封闭测试。
亚马逊科学家研究中程物流网络优化,通过考虑需求、道路延迟等不确定性因素,优化需求可变性可节省0.5%的成本,以维持次日达服务承诺。
OpenAI推出新的Multipath Reliable Connection(MRC)网络协议,旨在减少大型AI集群中的拥塞和故障相关减速,支持超大规模扩展至数十万GPU,以应对日益增长的算力需求。
Google DeepMind宣布与Eve Online开发者合作,利用该游戏复杂的玩家驱动宇宙作为安全沙盒,测试AI智能体在记忆、持续学习和长期规划方面的能力。
AMD MI355x在SGLang上运行DeepSeekv4 Pro,自发布以来每GPU吞吐量提升超过10倍。
HPE推出自主网络功能,可实时处理网络问题,标志着自驱动网络进入生产阶段。企业采用取决于信任和风险承受能力。
AMD因EPYC和Instinct产品需求强劲,数据中心业务增长57%,推动收入达103亿美元,推理工作负载扩大AI基础设施支出。
据供应链分析师郭明錤报告,OpenAI正在加速开发其首款AI手机,目标是在2027年上半年量产,比此前报道提前一整年。时间线调整可能受IPO野心和竞争加剧驱动。
锂电板块88家公司一季度营收同比增42%,利润同比增75%;4月周订单达22万,5月铁锂排产同比增近70%;隔膜、铜箔供需偏紧或于5月中下旬涨价;钠电获20GWh储能订单,能量密度达175Wh/kg;宁德时代入股清研电子布局固态电池。
芬兰AI实验室QyTw0完成2500万欧元天使轮融资,估值达3.25亿欧元(约3.8亿美元),由前AMD Silo AI CEO Peter Sarlin创立。
Wonder公司计划将其机器人厨房转变为AI驱动的“餐厅工厂”,允许任何人通过输入提示快速创建虚拟食品品牌,利用AI技术简化餐饮创业流程。
Anthropic与Blackstone、Hellman & Friedman、高盛合资,融资15亿美元,为企业定制Claude系统。OpenAI成立The Deployment Company,融资约40亿美元,投前估值100亿美元,专注于企业软件销售。两家公司通过合资加速AI服务落地。
Hermes智能体新增browser-harness技能,具备自我改进的浏览器工具和并行处理能力,是技术产品功能的更新。
Y Combinator董事会成员Brian透露,最近一期孵化器有175家公司,其中只有16家不是企业级(toB)公司,其余均为企业服务方向。