← 返回列表

@ClementDelangue: RT @cmpatino_: Introducing nanowhale 🐳! A tiny DeepSeek model fully pretrained by an agent. Inspired by @karpathy's nanochat, we gave ml-i…

@ClementDelangue 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-05-04T18:01 抓取:2026-05-06 04:02
🔗 原文链接
摘要

推文介绍nanowhale,一个由代理完全预训练的小型DeepSeek模型,灵感来自Karpathy的nanochat。

客观事实
  • nanowhale是一个小型DeepSeek模型
  • 该模型由代理完全预训练
nanowhale DeepSeek

原文

RT @cmpatino_: Introducing nanowhale 🐳! A tiny DeepSeek model fully pretrained by an agent.

Inspired by @karpathy's nanochat, we gave ml-i…

likes: 984 | retweets: 95 | replies: 37 | views: 102134