将图像转换为 DOCX-OCR-java

您可以将图像转换为 DOCXDOC 文件格式的可搜索或可编辑的 Word 文档。 JPGPNGTIFFBMP等流行的图像格式,可以转换为带有OCR的word文档(DOC/DOCX)爪哇。请参阅以下主题以了解更多信息:

图像到 Word 文档转换器 – Java API 安装

Aspose.OCR for Java 可用于图像的高效光学字符识别。您可以使用 Java 以编程方式将扫描的图像转换为可搜索的 DOCX 文件。请从 New Releases 下载 JAR 文件或在基于 Maven 的项目的 pom.xml 文件中配置它,如下所述:

存储库:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

依赖:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

使用 Java 将图像转换为可搜索的 Word 文档 (DOC/DOCX)

您可以通过以下步骤将图像转换为可搜索的 Word 文档:

  1. 声明 AsposeOcr 类的一个实例。
  2. 实例化 RecognitionSettings 类对象。
  3. 使用 RecognizePage 方法识别输入图像。
  4. 最后,将输出保存为 Microsoft Word 文档 (DOC/DOCX) 格式。

以下代码展示了如何使用 Java 将图像转换为 Word 文档 (DOC/DOCX):

// 初始化 AsposeOcr 的一个实例
AsposeOCR api = new AsposeOCR();

// 实例化 RecognitionSettings 类对象
RecognitionSettings settings = new RecognitionSettings();

// 使用 RecognizePage 方法识别输入图像
RecognitionResult result = api.RecognizePage("sample.png", settings);

// 以 Microsoft Word 文档格式保存结果
result.save("sample.docx", Format.Docx);

使用 Java 中的拼写检查将图像转换为可搜索的 Word 文档 (DOC/DOCX)

您可以通过以下步骤将图像转换为 Word 文档 (DOCX/DOC):

  1. 首先,指定一个 AsposeOcr 类的实例。
  2. 声明 RecognitionSettings 类对象。
  3. 使用 RecognizePage 方法使用 OCR 识别图像。
  4. 使用拼写检查将结果保存为 Word 文档 (DOC/DOCX) 格式。

下面的代码解释了如何在 Java 中通过拼写检查将图像转换为可搜索的 word 文档:

// 初始化 AsposeOcr 的一个实例
AsposeOCR api = new AsposeOCR();

// 实例化 RecognitionSettings 类对象
RecognitionSettings settings = new RecognitionSettings();

// 使用 RecognizePage 方法使用 OCR 识别图像
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// 使用拼写检查将结果保存为 Word 文档 (DOC/DOCX) 格式
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

获取免费 API 许可证

您可以使用 免费临时许可证 测试 API 的全部功能。

结论

在本文中,您学习了如何将图像转换为 Word 文档 (DOC/DOCX)。此外,您可以通过使用相应的字典进行拼写检查来提高准确性。请通过 API 文档 了解更多信息。此外,请随时通过 免费支持论坛 与我们联系。

也可以看看