convertir-Image-en-DOCX-OCR-java

Vous pouvez convertir une image en un document Word consultable ou modifiable au format de fichier DOCX ainsi qu’au format de fichier DOC. Les formats d’image populaires comme JPG, PNG, TIFF, BMP, etc., peuvent être convertis en un document Word (DOC/DOCX) avec OCR dans Java. Veuillez consulter les rubriques suivantes pour en savoir plus :

Convertisseur d’image en document Word - Installation de l’API Java

Aspose.OCR for Java peut être utilisé pour une reconnaissance optique efficace des caractères des images. Vous pouvez convertir des images numérisées en fichiers DOCX consultables par programmation à l’aide de Java. Veuillez télécharger le fichier JAR à partir de New Releases ou configurez-le dans le fichier pom.xml de votre projet basé sur Maven, comme expliqué sous :

Repository:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Dependency:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Convertir une image en document Word consultable (DOC/DOCX) à l’aide de Java

Vous pouvez convertir une image en un document Word consultable en suivant les étapes ci-dessous :

  1. Déclarez une instance de la classe AsposeOcr.
  2. Instanciez l’objet de classe RecognitionSettings.
  3. Reconnaître l’image d’entrée avec la méthode RecognizePage.
  4. Enfin, enregistrez la sortie au format Microsoft Word Document (DOC/DOCX).

Le code suivant montre comment convertir une image en un document Word (DOC/DOCX) à l’aide de Java :

// Initialiser une instance de AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instancier l'objet de classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître l'image d'entrée avec la méthode RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Enregistrez le résultat au format Microsoft Word Document
result.save("sample.docx", Format.Docx);

Convertir une image en document Word consultable (DOC/DOCX) avec vérification orthographique en Java

Vous pouvez convertir une image en un document Word (DOCX/DOC) en procédant comme suit :

  1. Tout d’abord, spécifiez une instance de la classe AsposeOcr.
  2. Déclarez l’objet de classe RecognitionSettings.
  3. Reconnaître l’image avec OCR en utilisant la méthode RecognizePage.
  4. Enregistrez le résultat au format Word Document (DOC/DOCX) avec correcteur orthographique.

Le code ci-dessous explique comment convertir une image en un document Word interrogeable avec correcteur orthographique en Java :

// Initialiser une instance de AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instancier l'objet de classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Reconnaître l'image avec OCR en utilisant la méthode RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Enregistrez le résultat au format Word Document (DOC/DOCX) avec correcteur orthographique
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Obtenez une licence API gratuite

Vous pouvez tester l’API dans toute sa capacité avec une licence temporaire gratuite.

Conclusion

Dans cet article, vous avez appris à convertir une image en un document Word (DOC/DOCX). De plus, vous pouvez améliorer la précision en vérifiant l’orthographe avec le dictionnaire correspondant. Veuillez consulter l’API documentation pour plus d’informations. De plus, n’hésitez pas à nous contacter sur le Forum d’assistance gratuit.

Voir également