Bild-in-DOCX-OCR-java konvertieren

Sie können ein Bild in ein durchsuchbares oder bearbeitbares Word Dokument im DOCX- sowie im DOC Dateiformat konvertieren. Gängige Bildformate wie JPG, PNG, TIFF, BMP usw. können mit OCR in ein Word Dokument (DOC/DOCX) konvertiert werden Java. Weitere Informationen finden Sie in den folgenden Themen:

Image to Word Document Converter – Java API Installation

Aspose.OCR for Java kann zur effizienten optischen Zeichenerkennung von Bildern verwendet werden. Sie können gescannte Bilder mit Java programmgesteuert in durchsuchbare DOCX Dateien konvertieren. Bitte laden Sie die JAR Datei von New Releases herunter oder konfigurieren Sie sie in der pom.xml Datei Ihres Maven-basierten Projekts wie unten beschrieben:

Repository:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Abhängigkeit:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Konvertieren Sie Bilder mit Java in ein durchsuchbares Word Dokument (DOC/DOCX).

Mit den folgenden Schritten können Sie ein Bild in ein durchsuchbares Word Dokument konvertieren:

  1. Deklarieren Sie eine Instanz der Klasse AsposeOcr.
  2. Instanziieren Sie das Klassenobjekt RecognitionSettings.
  3. Eingegebenes Bild mit der methode RecognizePage erkennen.
  4. Speichern Sie abschließend die Ausgabe im Format Microsoft Word Document (DOC/DOCX).

Der folgende Code zeigt, wie Sie ein Bild mit Java in ein Word Dokument (DOC/DOCX) konvertieren:

// Initialisieren Sie eine Instanz von AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instanziieren Sie das RecognitionSettings Klassenobjekt
RecognitionSettings settings = new RecognitionSettings();

// Eingegebenes Bild mit der RecognizePage methode erkennen
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Speichern Sie das Ergebnis im Microsoft Word Dokument format
result.save("sample.docx", Format.Docx);

Konvertieren Sie ein Bild mit der Rechtschreibprüfung in Java in ein durchsuchbares Word Dokument (DOC/DOCX).

Sie können ein Bild mit den folgenden Schritten in ein Word Dokument (DOCX/DOC) konvertieren:

  1. Geben Sie zunächst eine Instanz der Klasse AsposeOcr an.
  2. Deklarieren Sie das Klassenobjekt RecognitionSettings.
  3. Erkennen Sie Bilder mit OCR mithilfe der Methode RecognizePage.
  4. Speichern Sie das Ergebnis im Format Word Dokument (DOC/DOCX) mit Rechtschreibprüfung.

Der folgende Code erklärt, wie Sie ein Bild in ein durchsuchbares Word Dokument mit Rechtschreibprüfung in Java konvertieren:

// Initialisieren Sie eine Instanz von AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instanziieren Sie das RecognitionSettings Klassenobjekt
RecognitionSettings settings = new RecognitionSettings();

// Erkennen Sie Bilder mit OCR mithilfe der RecognizePage methode
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Speichern Sie das Ergebnis im Format Word Dokument (DOC/DOCX) mit Rechtschreibprüfung
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Erhalten Sie eine kostenlose API Lizenz

Mit einer kostenlosen temporären Lizenz können Sie die API in vollem Umfang testen.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie ein Bild in ein Word Dokument (DOC/DOCX) konvertieren. Darüber hinaus können Sie die Genauigkeit durch eine Rechtschreibprüfung mit dem jeweiligen Wörterbuch erhöhen. Weitere Informationen finden Sie in der API Dokumentation. Außerdem können Sie sich gerne im Free Support Forum mit uns in Verbindung setzen.

Siehe auch