convertir-Imagen-a-DOCX-OCR-java

Puede convertir una imagen en un documento de Word editable o con capacidad de búsqueda en formato de archivo DOCX y DOC. Los formatos de imagen populares como JPG, PNG, TIFF, BMP, etc., se pueden convertir a un documento de Word (DOC/DOCX) con OCR en Java. Consulte los siguientes temas para obtener más información:

Conversor de documentos de imagen a Word: instalación de la API de Java

Aspose.OCR for Java se puede utilizar para el reconocimiento óptico de caracteres de imágenes. Puede convertir imágenes escaneadas en archivos DOCX con capacidad de búsqueda mediante programación usando Java. Descargue el archivo JAR de Nuevos lanzamientos o configúrelo en el archivo pom.xml de su proyecto basado en Maven como se explica a continuación:

Repositorio:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Dependencia:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Convertir imagen a documento de Word con capacidad de búsqueda (DOC/DOCX) usando Java

Puede convertir una imagen en un documento de Word con capacidad de búsqueda con los siguientes pasos:

  1. Declare una instancia de la clase AsposeOcr.
  2. Crea una instancia del objeto de clase RecognitionSettings.
  3. Reconocer la imagen de entrada con el método RecognizePage.
  4. Finalmente, guarde la salida en formato de documento de Microsoft Word (DOC/DOCX).

El siguiente código muestra cómo convertir una imagen en un documento de Word (DOC/DOCX) usando Java:

// Inicializar una instancia de AsposeOcr
AsposeOCR api = new AsposeOCR();

// Crear una instancia del objeto de clase RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Reconocer la imagen de entrada con el método RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Guarde el resultado en formato de documento de Microsoft Word
result.save("sample.docx", Format.Docx);

Convierta la imagen en un documento de Word con capacidad de búsqueda (DOC/DOCX) con el corrector ortográfico en Java

Puede convertir una imagen en un documento de Word (DOCX/DOC) con los siguientes pasos:

  1. En primer lugar, especifique una instancia de la clase AsposeOcr.
  2. Declare el objeto de clase RecognitionSettings.
  3. Reconocer imagen con OCR utilizando el método RecognizePage.
  4. Guarde el resultado en formato de documento de Word (DOC/DOCX) con corrector ortográfico.

El siguiente código explica cómo convertir una imagen en un documento de Word que permite realizar búsquedas con el corrector ortográfico en Java:

// Inicializar una instancia de AsposeOcr
AsposeOCR api = new AsposeOCR();

// Crear una instancia del objeto de clase RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Reconocer imagen con OCR utilizando el método RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Guarde el resultado en formato de documento de Word (DOC/DOCX) con corrector ortográfico
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Obtenga una licencia de API gratuita

Puede probar la API en toda su capacidad con una licencia temporal gratuita.

Conclusión

En este artículo, ha aprendido a convertir una imagen en un documento de Word (DOC/DOCX). Además, puede mejorar la precisión revisando la ortografía con el diccionario respectivo. Consulte la documentación de la API para obtener más información. Además, no dude en ponerse en contacto con nosotros en el Foro de soporte gratuito.

Ver también