您可以将图像转换为 DOCX 和 DOC 文件格式的可搜索或可编辑的 Word 文档。 JPG、PNG、TIFF、BMP等流行的图像格式,可以转换为带有OCR的word文档(DOC/DOCX)爪哇。请参阅以下主题以了解更多信息:
- 图像到 Word 文档转换器 – Java API 安装
- 使用 Java 将图像转换为可搜索的 Word 文档 (DOC/DOCX)
- 使用 Java 中的拼写检查将图像转换为可搜索的 Word 文档 (DOC/DOCX)
图像到 Word 文档转换器 – Java API 安装
Aspose.OCR for Java 可用于图像的高效光学字符识别。您可以使用 Java 以编程方式将扫描的图像转换为可搜索的 DOCX 文件。请从 New Releases 下载 JAR 文件或在基于 Maven 的项目的 pom.xml 文件中配置它,如下所述:
存储库:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
依赖:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
使用 Java 将图像转换为可搜索的 Word 文档 (DOC/DOCX)
您可以通过以下步骤将图像转换为可搜索的 Word 文档:
- 声明 AsposeOcr 类的一个实例。
- 实例化 RecognitionSettings 类对象。
- 使用 RecognizePage 方法识别输入图像。
- 最后,将输出保存为 Microsoft Word 文档 (DOC/DOCX) 格式。
以下代码展示了如何使用 Java 将图像转换为 Word 文档 (DOC/DOCX):
// 初始化 AsposeOcr 的一个实例
AsposeOCR api = new AsposeOCR();
// 实例化 RecognitionSettings 类对象
RecognitionSettings settings = new RecognitionSettings();
// 使用 RecognizePage 方法识别输入图像
RecognitionResult result = api.RecognizePage("sample.png", settings);
// 以 Microsoft Word 文档格式保存结果
result.save("sample.docx", Format.Docx);
使用 Java 中的拼写检查将图像转换为可搜索的 Word 文档 (DOC/DOCX)
您可以通过以下步骤将图像转换为 Word 文档 (DOCX/DOC):
- 首先,指定一个 AsposeOcr 类的实例。
- 声明 RecognitionSettings 类对象。
- 使用 RecognizePage 方法使用 OCR 识别图像。
- 使用拼写检查将结果保存为 Word 文档 (DOC/DOCX) 格式。
下面的代码解释了如何在 Java 中通过拼写检查将图像转换为可搜索的 word 文档:
// 初始化 AsposeOcr 的一个实例
AsposeOCR api = new AsposeOCR();
// 实例化 RecognitionSettings 类对象
RecognitionSettings settings = new RecognitionSettings();
// 使用 RecognizePage 方法使用 OCR 识别图像
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);
// 使用拼写检查将结果保存为 Word 文档 (DOC/DOCX) 格式
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);
获取免费 API 许可证
您可以使用 免费临时许可证 测试 API 的全部功能。
结论
在本文中,您学习了如何将图像转换为 Word 文档 (DOC/DOCX)。此外,您可以通过使用相应的字典进行拼写检查来提高准确性。请通过 API 文档 了解更多信息。此外,请随时通过 免费支持论坛 与我们联系。