convert-Image-to-DOCX-OCR-java

Você pode converter uma imagem em um documento do Word pesquisável ou editável no formato de arquivo DOCX bem como DOC. Formatos de imagem populares como JPG, PNG, TIFF, BMP, etc., podem ser convertidos em um documento do Word (DOC/DOCX) com OCR em Java. Consulte os seguintes tópicos para saber mais:

Conversor de imagem para documento do Word – Instalação da API Java

Aspose.OCR for Java pode ser usado para reconhecimento óptico de caracteres eficiente de imagens. Você pode converter imagens digitalizadas em arquivos DOCX pesquisáveis programaticamente usando Java. Faça o download do arquivo JAR de New Releases ou configure-o no arquivo pom.xml do seu projeto baseado em Maven, conforme explicado em:

Repositório:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Dependência:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Converter imagem em documento do Word pesquisável (DOC/DOCX) usando Java

Você pode converter uma imagem em um documento do Word pesquisável com as etapas abaixo:

  1. Declare uma instância da classe AsposeOcr.
  2. Instancie o objeto de classe RecognitionSettings.
  3. Reconheça a imagem de entrada com o método RecognizePage.
  4. Por fim, salve a saída no formato Documento do Microsoft Word (DOC/DOCX).

O código a seguir mostra como converter uma imagem em um documento do Word (DOC/DOCX) usando Java:

// Inicialize uma instância de AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instanciar o objeto da classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Reconhecer a imagem de entrada com o método RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Salve o resultado no formato de documento do Microsoft Word
result.save("sample.docx", Format.Docx);

Converter imagem em documento do Word pesquisável (DOC/DOCX) com verificação ortográfica em Java

Você pode converter uma imagem em um documento do Word (DOCX/DOC) com as seguintes etapas:

  1. Em primeiro lugar, especifique uma instância da classe AsposeOcr.
  2. Declare o objeto de classe RecognitionSettings.
  3. Reconheça a imagem com OCR usando o método RecognizePage.
  4. Salve o resultado no formato Documento do Word (DOC/DOCX) com verificação ortográfica.

O código abaixo explica como converter uma imagem em um documento do Word pesquisável com verificação ortográfica em Java:

// Inicialize uma instância de AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instanciar o objeto da classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Reconhecer imagem com OCR usando o método RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Salve o resultado no formato Documento do Word (DOC/DOCX) com verificação ortográfica
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Obtenha licença de API gratuita

Você pode testar a API em sua capacidade total com uma Licença Temporária Gratuita.

Conclusão

Neste artigo, você aprendeu como converter uma imagem em um documento do Word (DOC/DOCX). Além disso, você pode melhorar a precisão verificando a ortografia com o respectivo dicionário. Consulte a API documentação para obter mais informações. Além disso, sinta-se à vontade para entrar em contato conosco no Fórum de suporte gratuito.

Veja também