@huggingface: RT @QGallouedec: TRL v1.4 is out! two things I'm excited about: → chunked NLL loss for SFT. Way less VRAM, same loss, often faster. Qwen3-…

@huggingface 3 信息等级 3 发布：2026-05-10T22:27 抓取：2026-05-11 16:02

AI 研究动态

摘要

Hugging Face的TRL库发布v1.4版本，新增chunked NLL损失用于监督微调，使用更少显存且速度更快，并提及Qwen3模型。

客观事实

TRL Qwen3

RT @QGallouedec: TRL v1.4 is out! two things I'm excited about:

→ chunked NLL loss for SFT. Way less VRAM, same loss, often faster. Qwen3-…

likes: 43 | retweets: 8 | replies: 4 | views: 13865