← 返回列表

@huggingface: RT @cognitivelab_ai: Launching NayanaOCR Corpus 👉🏼 1M+ Document images across 22 languages Largest open source synthetic > multilingual...

@huggingface 3 信息等级 3 1 噪音/剔除;2 较弱;3 普通事实;4 重要行业动态;5 极重大事件。该分数是信息显著性,不是投资建议。 发布:2026-05-25T16:10 抓取:2026-05-25 17:18
🔗 原文链接
摘要

Hugging Face转发宣布推出NayanaOCR语料库,包含超过100万张文档图像,覆盖22种语言,是最大的开源合成多语言OCR数据集。

客观事实
  • 发布NayanaOCR语料库
  • 100万+文档图像,22种语言
  • 最大开源合成多语言OCR数据集
Hugging Face NayanaOCR

原文

RT @cognitivelab_ai: Launching NayanaOCR Corpus
👉🏼 1M+ Document images across 22 languages

Largest open source synthetic
> multilingual…

likes: 37 | retweets: 9 | replies: 3 | views: 13865