Zibra Labs正在构建高性能计算(HPC)集群,允许量化交易公司大规模运行比以往多100倍的回测。该集群利用跨多个超大规模云和neocloud的spot实例处理并行工作负载。
Pulse AI 在 AWS ML Blog 发布新文章,介绍如何使用 AWS Inferentia 和 Jamba 1.5 mini 进行部署。
Madrone公司开发数据中心冷却系统,采用新型露点冷却技术,在得克萨斯州可节省30%的电力和水。
Expanse 推出新平台,利用空闲 GPU 容量,支持云和本地 HPC 环境,提供作业提交、优化和调试功能。
Y Combinator 播客介绍两篇递归AI模型论文:HRM和TRM。7百万参数模型在ARC Prize等任务上超越千倍参数模型,通过推理时递归扩展计算深度,以较少参数实现SOTA。