这个工具有问题吗?

关于「PDF 转 Office 在线」

该工具将 PDF 文档转换为可编辑的 Office 格式,包括 Word (DOCX) 和 Excel (XLSX)。转换提取文本、表格和基本布局,让您无需重新输入即可继续编辑内容。

对于最初从 Office 文件创建的 PDF,转换最为精确。扫描的 PDF 需要先进行 OCR 处理才能获得较好的结果。

转换后的文件以下载方式返回,不会在请求完成后存储在服务器上。

如何使用这个工具

如何把 PDF 转成 Word(.docx)

  1. 上传 PDF

    把 .pdf 拖到「PDF file」字段。表单的其他选项卡也接受 URL 或粘贴的 base64。

  2. 提取的内容

    pdf-parse 读取 PDF 的文本层;底层使用 pdfjs。没有 OCR——纯图片/扫描 PDF 不会返回文本,只是一段简短提示。

  3. 点击运行

    输出为 .docx 文件(文件名 converted-from-pdf.docx),由 docx 库根据提取到的纯文本构建。备注会告知处理了多少页以及是否找到文本。

  4. 现实期望

    只有文本会保留——原始版式、表格、字体、分栏、页眉页脚、图片与表单字段都不会带过去。需要高保真请使用商用转换器,或在 Word 中重建文档。