Führen Sie OCR mit Java durch

Die Optical Character Recognition (OCR)-Technologie hat es ermöglicht, den Text in den gescannten Dokumenten und Bildern zu erkennen und zu lesen. Mit OCR können Sie den schreibgeschützten Text in ein bearbeitbares Formular umwandeln. Der konvertierte Text kann für Operationen wie Textanalyse weiterverarbeitet werden. In diesem Artikel zeige ich Ihnen, wie Sie OCR für Bilder (PNG, JPG, BMP und GIF) durchführen und Bilder in Text konvertieren Verwendung der Java-OCR-API - Aspose.OCR for Java.

Tipp: Möglicherweise interessieren Sie sich für einen kostenlosen Text to GIF Converter, mit dem Sie Animationen aus Texten generieren können.

Java-OCR-API - Installation

Aspose.OCR for Java kann als JAR heruntergeladen oder mit den folgenden Konfigurationen in einer Maven-basierten Anwendung installiert werden.

Repository:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Abhängigkeit:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Konvertieren Sie Bilder mit Java in Text

Meistens sind die Bilder für OCR die Seiten gescannter Dokumente, Rechnungen, Quittungen, Rechnungen usw., bei denen der Text aus mehreren Zeilen besteht. In solchen Szenarien müssen Sie den gesamten Text aus dem Bild abrufen. Im Folgenden sind die Schritte zum Durchführen von OCR für das Bild mit mehreren Textzeilen mit Aspose.OCR for Java aufgeführt.

  • Erstellen Sie eine Instanz der Klasse AsposeOcr.
  • Konvertieren Sie das Bild mithilfe der Methode AsposeOcr.recognizePage(String fullPath) in Text, indem Sie den Pfad des Bilds übergeben.
  • Holen Sie sich den konvertierten Text in ein Zeichenfolgenobjekt.

Das folgende Codebeispiel zeigt, wie OCR für Bilder durchgeführt und Bilder mit Java in Text konvertiert werden.

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Der Pfad zum Dokumentenverzeichnis.
String dataDir = Utils.getSharedDataDir(PerformOCROnPage.class);

// Der Bildpfad
String imagePath = dataDir + "p3.png";

//API-Instanz erstellen
AsposeOCR api = new AsposeOCR();

// Erkennen Sie die Seite anhand des vollständigen Pfads zur Datei
try {
	String result = api.RecognizePage(imagePath);
	System.out.println("Result: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Konvertieren Sie Bilder mit einer einzelnen Textzeile

Im vorherigen Beispiel haben wir OCR an einem Bild mit mehreren Textzeilen durchgeführt. Es kann jedoch vorkommen, dass das Bild eine einzelne Textzeile enthält. Für einen solchen Fall können Sie die API entsprechend konfigurieren. Im Folgenden sind die Schritte zum Konvertieren eines Bildes mit einer einzelnen Textzeile aufgeführt.

Das folgende Codebeispiel zeigt, wie OCR für ein Bild mit einer einzelnen Textzeile mit Java durchgeführt wird.

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-ocr/Aspose.OCR-for-Java
// Der Pfad zum Dokumentenverzeichnis.
String dataDir = Utils.getSharedDataDir(RecognizeLine.class);

// Der Bildpfad
String imagePath = dataDir + "0001460985.Jpeg";

//API-Instanz erstellen
AsposeOCR api = new AsposeOCR();

try {
	String result = api.RecognizeLine(imagePath);
	System.out.println("File: " + imagePath);
	System.out.println("Result line: " + result);
} catch (IOException e) {
	e.printStackTrace();
}

Fazit

In diesem Artikel haben Sie gesehen, wie Sie PNG, JPG, BMP und GIF Bilder mithilfe der Java-OCR-API in Text konvertieren. Die Codebeispiele zeigen, wie OCR auf Bildern mit einer oder mehreren Textzeilen in Java Anwendungen durchgeführt wird. Sie können mehr über die Java-OCR-API von Aspose erfahren, indem Sie Dokumentation verwenden.

Siehe auch