UnslothAI宣布其产品现在支持运行GPT、Claude等模型,并可在本地UI中连接API,实现代码执行、网络搜索和图像处理等功能。
Unsloth Studio 推出新功能,支持自动推测解码和 MTP,可将推理速度提升至 2 倍且无精度损失,并针对 Mac、GPU 和 CPU 优化了参数。
UnslothAI发布Qwen3.6通过MTP GGUFs实现本地运行加速,速度提升约1.4-2.2倍,仅需18GB RAM。
Qwen3.6 MTP Unsloth GGUFs运行速度提升至1.8倍,得益于llama.cpp新增--spec-draft-p-min参数。同时发布了0.8B至9B多个尺寸的MTP GGUF模型,并支持两种推测解码算法。
Unsloth发布实验性Qwen3.6 MTP GGUF版本,27B模型在单GPU上达到140 tokens/s,35B-A3B模型达到220 tokens/s,相比原始GGUF速度提升1.4倍,且精度不变。建议最大草稿token数为2。
Unsloth 在推特上宣布正式成为 PyTorch 生态系统项目,感谢 PyTorch 的合作,并表示未来将有更多进展。
Unsloth宣布加入PyTorch生态系统。Unsloth是一个开源项目,专注于加速模型训练,此次加入将获得PyTorch社区支持。
NVIDIA与Unsloth合作,通过开源贡献使LLM训练速度提升约25%,并发布指南以降低训练门槛。
UnslothAI与NVIDIA合作发布了一项技术,通过3种优化方法使LLM训练速度提升约25%,并分享了实现细节。
UnslothAI发布指南,指导如何在Claude Code、Codex和OpenClaw中运行开源大语言模型,并推荐使用Gemma 4和Qwen3.6的GGUF格式进行本地智能体应用。