简街(Jane Street)展示了其在德克萨斯州的AI训练数据中心内部,拥有4032个GPU、56个机架和8000公里光纤。
推特消息称,有人通过第一性原理推导出GPT-5预训练的token数量、Gemini 3的KV缓存字节数以及Claude缓存命中的内存类型。