清除 当前 6 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 21 小时前 微信公众号 · 42章经 · 4 天 16 小时前 微信公众号 · DeepTech深科技 · 4 天 16 小时前 微信公众号 · Founder Park · 4 天 16 小时前 微信公众号 · FundaAI · 4 天 16 小时前 微信公众号 · 九章智驾 · 4 天 16 小时前 微信公众号 · 晚点LatePost · 4 天 16 小时前 微信公众号 · 琢磨事 · 4 天 16 小时前 微信公众号 · 甲子光年 · 4 天 16 小时前

Unsloth Studio 推出新功能,支持自动推测解码和 MTP,可将推理速度提升至 2 倍且无精度损失,并针对 Mac、GPU 和 CPU 优化了参数。

  • Unsloth Studio 新增自动推测解码和 MTP 支持
  • 推理速度提升可达 2 倍且无精度损失
  • 已针对 Mac、GPU 和 CPU 优化参数

UnslothAI发布Qwen3.6通过MTP GGUFs实现本地运行加速,速度提升约1.4-2.2倍,仅需18GB RAM。

  • Qwen3.6使用MTP GGUFs运行速度提升2倍
  • 本地运行仅需18GB RAM

Unsloth发布实验性Qwen3.6 MTP GGUF版本,27B模型在单GPU上达到140 tokens/s,35B-A3B模型达到220 tokens/s,相比原始GGUF速度提升1.4倍,且精度不变。建议最大草稿token数为2。

  • 发布Qwen3.6 MTP GGUF版本,支持推测解码
  • 27B模型单GPU推理速度140 tokens/s
  • 35B-A3B模型速度220 tokens/s,提升1.4倍

Unsloth 在推特上宣布正式成为 PyTorch 生态系统项目,感谢 PyTorch 的合作,并表示未来将有更多进展。

  • Unsloth 成为 PyTorch 生态系统项目

NVIDIA与Unsloth合作,通过开源贡献使LLM训练速度提升约25%,并发布指南以降低训练门槛。

  • NVIDIA与Unsloth合作使LLM训练速度提升约25%
  • 双方发布训练优化指南

UnslothAI与NVIDIA合作发布了一项技术,通过3种优化方法使LLM训练速度提升约25%,并分享了实现细节。

  • UnslothAI与NVIDIA合作,实现LLM训练提速约25%
  • 通过3种优化方法实现加速