Unsloth Studio 推出新功能,支持自动推测解码和 MTP,可将推理速度提升至 2 倍且无精度损失,并针对 Mac、GPU 和 CPU 优化了参数。
UnslothAI发布Qwen3.6通过MTP GGUFs实现本地运行加速,速度提升约1.4-2.2倍,仅需18GB RAM。
Unsloth发布实验性Qwen3.6 MTP GGUF版本,27B模型在单GPU上达到140 tokens/s,35B-A3B模型达到220 tokens/s,相比原始GGUF速度提升1.4倍,且精度不变。建议最大草稿token数为2。
Unsloth 在推特上宣布正式成为 PyTorch 生态系统项目,感谢 PyTorch 的合作,并表示未来将有更多进展。
NVIDIA与Unsloth合作,通过开源贡献使LLM训练速度提升约25%,并发布指南以降低训练门槛。
UnslothAI与NVIDIA合作发布了一项技术,通过3种优化方法使LLM训练速度提升约25%,并分享了实现细节。