这个工具有问题吗?

关于「图片文字识别 在线」

该工具对图像执行光学字符识别(OCR),将任何可见文本提取为可编辑、可搜索、可复制的形式。上传扫描文档、标志的照片、文章的屏幕截图或任何带有文本的图像,工具就会返回识别出的字符。

OCR 对于数字化纸质文档、从拍照页面中提取引文、从无法访问原始来源的图像中捕获文本,或使图像档案可搜索都至关重要。

准确性取决于图像质量、字体清晰度和语言。干净的英文印刷文本通常可达到 95% 以上的准确率。手写、低对比度扫描、装饰字体和不常见的语言可能会产生更多错误。包括对主要书写系统的多语言支持。

如何使用这个工具

如何查看图像的像素统计

  1. 上传图片

    把 JPEG、PNG、WebP、HEIC、AVIF、GIF 或 TIFF 拖到「Image」字段。与其他图像工具相同的输入。

  2. 这个工具实际做了什么

    此构建未启用服务器端 OCR。处理器完全不进行文字识别——只返回 Sharp 元数据以及每通道的均值统计,便于你核对所上传的图像。

  3. 点击运行

    输出包含 width、height、format、channels、hasAlpha、density、色彩空间、isOpaque 与 dominantChannelMeans(来自 sharp.stats() 的 R/G/B/A 均值)。note 会告诉你去哪做真正的 OCR。

  4. 请在他处做 OCR

    要真正提取文字,请使用操作系统的 screenshot-to-text 功能、Google Lens / Translate 或桌面 OCR 应用(Tesseract、ABBYY)。本工具按设计仅返回元数据。