在DeepSeekv4 Pro 1.6T模型上,GB300 NVL72搭配SGLang disaggregation和DeepSeek MegaMoe kernels,性能比B200提升6.5倍。该成果由Radix Ark、LMSYS Org、NVIDIA AI、CoreWeave等团队协作实现。
三星工会集会已导致内存产线下降18.4%,代工产线下降58.1%。工会威胁从5月21日起罢工18天,要求三星支付约45万亿韩元奖金。代工线因自动化程度低,产出受更大影响。
SemiAnalysis宣布AI代理MERLIN加入团队担任研究总监,其拥有覆盖公司、事件、财报等的代理研究团队,可将覆盖一家公司的时间从15小时缩短至数分钟。另有两名AI代理Claudia和Snoopz分别负责会议分析和产品研究。
DeepSeek v4 Pro发布不到一周,vllm_project和inferact团队通过vLLM 0.20.0版本中的MegaMoE内核,在GB200平台上实现了显著性能改进。