清除 当前 10 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 21 小时前 微信公众号 · 42章经 · 4 天 16 小时前 微信公众号 · DeepTech深科技 · 4 天 16 小时前 微信公众号 · Founder Park · 4 天 16 小时前 微信公众号 · FundaAI · 4 天 16 小时前 微信公众号 · 九章智驾 · 4 天 16 小时前 微信公众号 · 晚点LatePost · 4 天 16 小时前 微信公众号 · 琢磨事 · 4 天 16 小时前 微信公众号 · 甲子光年 · 4 天 16 小时前

UnslothAI宣布其产品现在支持运行GPT、Claude等模型,并可在本地UI中连接API,实现代码执行、网络搜索和图像处理等功能。

  • UnslothAI支持运行GPT和Claude等模型
  • 可在本地UI中连接API执行代码、搜索和图像处理

Unsloth Studio 推出新功能,支持自动推测解码和 MTP,可将推理速度提升至 2 倍且无精度损失,并针对 Mac、GPU 和 CPU 优化了参数。

  • Unsloth Studio 新增自动推测解码和 MTP 支持
  • 推理速度提升可达 2 倍且无精度损失
  • 已针对 Mac、GPU 和 CPU 优化参数

UnslothAI发布Qwen3.6通过MTP GGUFs实现本地运行加速,速度提升约1.4-2.2倍,仅需18GB RAM。

  • Qwen3.6使用MTP GGUFs运行速度提升2倍
  • 本地运行仅需18GB RAM

Qwen3.6 MTP Unsloth GGUFs运行速度提升至1.8倍,得益于llama.cpp新增--spec-draft-p-min参数。同时发布了0.8B至9B多个尺寸的MTP GGUF模型,并支持两种推测解码算法。

  • Qwen3.6 MTP Unsloth GGUFs运行速度从1.4倍提升至1.8倍
  • 速度提升因llama.cpp添加--spec-draft-p-min 0.75参数
  • 发布了Qwen3.6-0.8B至9B MTP GGUF模型

Unsloth发布实验性Qwen3.6 MTP GGUF版本,27B模型在单GPU上达到140 tokens/s,35B-A3B模型达到220 tokens/s,相比原始GGUF速度提升1.4倍,且精度不变。建议最大草稿token数为2。

  • 发布Qwen3.6 MTP GGUF版本,支持推测解码
  • 27B模型单GPU推理速度140 tokens/s
  • 35B-A3B模型速度220 tokens/s,提升1.4倍

Unsloth 在推特上宣布正式成为 PyTorch 生态系统项目,感谢 PyTorch 的合作,并表示未来将有更多进展。

  • Unsloth 成为 PyTorch 生态系统项目

Unsloth宣布加入PyTorch生态系统。Unsloth是一个开源项目,专注于加速模型训练,此次加入将获得PyTorch社区支持。

  • Unsloth宣布加入PyTorch生态系统
  • Unsloth是开源项目,专注于加速训练

NVIDIA与Unsloth合作,通过开源贡献使LLM训练速度提升约25%,并发布指南以降低训练门槛。

  • NVIDIA与Unsloth合作使LLM训练速度提升约25%
  • 双方发布训练优化指南

UnslothAI与NVIDIA合作发布了一项技术,通过3种优化方法使LLM训练速度提升约25%,并分享了实现细节。

  • UnslothAI与NVIDIA合作,实现LLM训练提速约25%
  • 通过3种优化方法实现加速

UnslothAI发布指南,指导如何在Claude Code、Codex和OpenClaw中运行开源大语言模型,并推荐使用Gemma 4和Qwen3.6的GGUF格式进行本地智能体应用。

  • UnslothAI发布了在Claude Code、Codex和OpenClaw中运行开源LLM的指南
  • 指南推荐使用Gemma 4和Qwen3.6的GGUF格式