推文介绍Nvidia Tensor Cores通过systolic arrays大幅提升芯片吞吐量,并附有解释链接。
推特用户@dwarkesh_sp分享了@reinerpope关于AI芯片时钟周期的解释:芯片内部电路每秒数十亿次暂停,由时钟周期控制。内容包含视频链接,属于技术普及。
reinerpope发布新黑板讲座,从逻辑门开始讲解AI训练和推理的构建过程,并手工演示4位乘累加操作,指出该操作是训练中矩阵乘法的基础。
Eric Jang报告指出,当前AI模型已能良好实现和运行实验,但无法可靠地选择下一个要探究的正确问题,也无法判断何时陷入死胡同,这是自动化AI研究的主要瓶颈。
推文称,加州在疫情期间仅将25%的疫苗成功接种,并指出政治角力导致推广延误。
简街(Jane Street)展示了其在德克萨斯州的AI训练数据中心内部,拥有4032个GPU、56个机架和8000公里光纤。
David Reich与Ali Akbari发表论文,通过扩展古DNA测序和新统计方法,推翻自然选择在农业革命后休眠的共识,发现选择加速,青铜时代尤其剧烈,过去1万年认知能力基因预测值提升约一个标准差。
reinerpope从第一性原理推导出前沿模型相对于Chinchilla最优的训练过度程度,是一项有趣的技术推导。
推特消息称,有人通过第一性原理推导出GPT-5预训练的token数量、Gemini 3的KV缓存字节数以及Claude缓存命中的内存类型。