HyperAIHyperAI

Command Palette

Search for a command to run...

Chinese Text in the Wild 中文字符数据集

在 Discord 上讨论

日期

3 年前

数据集组织

Tsinghua University(清华大学)

论文 URL

arxiv.org

许可证

Other

Featured Image

Chinese Text in the Wild 是一个用自然图像中包含的文字创建的大型数据集。该数据集包含 32,285 张带有 1,018,402 个中文字符的图像,远远超出了之前的数据集,这些图片来自腾讯街景,从中国数十个不同的城市获取,没有任何特殊目的。

由于其多样性和复杂性,该数据集存在极大的挑战性。它包含平面文本,凸起文本,城市文本,农村文本,低亮度文本,远处文本,部分遮挡文本等。

对于每个图像,由专家标注其所有中文。对每一个中文字符,该数据集标注了它的底层字符,边界框和 6 个属性,以指示它是否被遮挡,复杂背景,扭曲,3D 文字,艺术字和手写体。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供