converti-Image-to-DOCX-OCR-java

È possibile convertire un’immagine in un documento di Word ricercabile o modificabile nel formato di file DOCX e DOC. I formati immagine più diffusi come JPG, PNG, TIFF, BMP, ecc. possono essere convertiti in un documento Word (DOC/DOCX) con OCR in Giava. Si prega di fare riferimento ai seguenti argomenti per saperne di più:

Convertitore da immagine a documento Word – Installazione dell’API Java

Aspose.OCR per Java può essere utilizzato per un efficiente riconoscimento ottico dei caratteri delle immagini. È possibile convertire le immagini scansionate in file DOCX ricercabili a livello di codice utilizzando Java. Scarica il file JAR da Nuove versioni o configuralo nel file pom.xml del tuo progetto basato su Maven come spiegato di seguito:

Archivio:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Dipendenza:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Converti immagine in documento Word ricercabile (DOC/DOCX) utilizzando Java

Puoi convertire un’immagine in un documento di Word ricercabile con i passaggi seguenti:

  1. Dichiara un’istanza della classe AsposeOcr.
  2. Istanziare l’oggetto classe RecognitionSettings.
  3. Riconosci l’immagine di input con il metodo RecognizePage.
  4. Infine, salva l’output in formato Microsoft Word Document (DOC/DOCX).

Il codice seguente mostra come convertire un’immagine in un documento Word (DOC/DOCX) utilizzando Java:

// Inizializza un'istanza di AsposeOcr
AsposeOCR api = new AsposeOCR();

// Istanziare l'oggetto della classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Riconosci l'immagine di input con il metodo RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Salva il risultato in formato documento Microsoft Word
result.save("sample.docx", Format.Docx);

Converti immagine in documento Word ricercabile (DOC/DOCX) con il controllo ortografico in Java

Puoi convertire un’immagine in un documento Word (DOCX/DOC) con i seguenti passaggi:

  1. Innanzitutto, specifica un’istanza della classe AsposeOcr.
  2. Dichiara l’oggetto classe RecognitionSettings.
  3. Riconosci l’immagine con l’OCR usando il metodo RecognizePage.
  4. Salva il risultato in formato documento Word (DOC/DOCX) con il controllo ortografico.

Il codice seguente spiega come convertire un’immagine in un documento di parole ricercabile con il controllo ortografico in Java:

// Inizializza un'istanza di AsposeOcr
AsposeOCR api = new AsposeOCR();

// Istanziare l'oggetto della classe RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Riconosci l'immagine con l'OCR usando il metodo RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Salva il risultato in formato documento Word (DOC/DOCX) con il controllo ortografico
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Ottieni la licenza API gratuita

Puoi testare l’API nella sua piena capacità con una Licenza temporanea gratuita.

Conclusione

In questo articolo hai imparato come convertire un’immagine in un documento word (DOC/DOCX). Inoltre, puoi migliorare la precisione effettuando il controllo ortografico con il rispettivo dizionario. Per ulteriori informazioni, consulta la documentazione dell’API. Inoltre, sentiti libero di metterti in contatto con noi nel Forum di supporto gratuito.

Guarda anche