← 返回列表

@huggingface: RT @QGallouedec: TRL v1.4 is out! two things I'm excited about: → chunked NLL loss for SFT. Way less VRAM, same loss, often faster. Qwen3-…

@huggingface 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-05-10T22:27 抓取:2026-05-11 16:02
🔗 原文链接
摘要

Hugging Face的TRL库发布v1.4版本,新增chunked NLL损失用于监督微调,使用更少显存且速度更快,并提及Qwen3模型。

客观事实
  • TRL v1.4版本发布
  • 新增chunked NLL损失用于SFT
  • 显存更少,损失相同,速度更快
TRL Qwen3

原文

RT @QGallouedec: TRL v1.4 is out! two things I'm excited about:

→ chunked NLL loss for SFT. Way less VRAM, same loss, often faster. Qwen3-…

likes: 43 | retweets: 8 | replies: 4 | views: 13865