Bild in DOCX OCR C++

Bilder und gescannte Dokumente können Textinformationen enthalten, die Sie möglicherweise weiterverarbeiten müssen. Möglicherweise haben Sie mit Ihrem Smartphone Bilder von Textdokumenten aufgenommen, die Sie in bearbeitbare Dokumente konvertieren möchten. Hierfür kann sich die Durchführung von OCR auf den Bildern als hilfreich erweisen. Mit OCR können Sie Bilder in durchsuchbare und bearbeitbare Word Dokumente konvertieren. Zu diesem Zweck erfahren Sie in diesem Artikel, wie Sie Bilder mit C++ in Word Dokumente konvertieren.

C++-API zum Konvertieren von Bildern in Word Dokumente

Aspose.OCR for C++ ist eine optische Zeichenerkennungs-API, die Text aus Bildern extrahieren kann. Mit der API können Sie auch Bilder in Word Dokumente wie DOC, DOCX und TXT Dateien konvertieren. Sie können die API entweder über NuGet installieren oder direkt aus dem Abschnitt Downloads herunterladen.

PM> Install-Package Aspose.OCR.Cpp

Konvertieren Sie ein Bild mit C++ in ein Word Dokument

Oft müssen Sie den Text in Bildern suchen oder bearbeiten, können dies aber nicht. Indem Sie OCR für solche Bilder durchführen und sie in Word Dokumente konvertieren, können Sie den Text nach Bedarf durchsuchen und bearbeiten. Um dies zu erreichen, folgen Sie bitte den unten angegebenen Schritten.

Der folgende Beispielcode zeigt, wie Sie ein Bild mit C++ in ein Word Dokument konvertieren:

// Quelldateipfad
std::string image_path = "SourceDirectory\\sample.png";

// Puffer für Ergebnis vorbereiten (in Symbolen, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Legen Sie die Erkennungseinstellungen fest
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Führen Sie den OCR-Vorgang durch und speichern Sie die Ausgabedatei.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Screenshot des Quellbildes und der ausgegebenen Word Datei

Screenshot des Quellbildes und der ausgegebenen Word Datei

Konvertieren Sie ein schiefes Bild mit C++ in ein Word Dokument

Bilder und gescannte Dokumente können manchmal verzerrt sein. Mit Aspose.OCR for C++ API können Sie OCR für schiefe Bilder durchführen. Im Folgenden sind die Schritte zum Konvertieren eines schiefen Bildes in ein Word Dokument aufgeführt:

Der folgende Beispielcode zeigt, wie Sie ein verzerrtes Bild mit C++ in ein Word Dokument konvertieren:

// Quelldateipfad
std::string image_path = "SourceDirectory\\skewSample.png";

// Puffer für Ergebnis vorbereiten (in Symbolen, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Schrägwinkel berechnen
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Legen Sie die Erkennungseinstellungen fest
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Führen Sie den OCR-Vorgang durch und speichern Sie die Ausgabedatei.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Screenshot des Quellbildes und der ausgegebenen Word Datei

Screenshot des Quellbildes und der ausgegebenen Word Datei

Holen Sie sich eine kostenlose Lizenz

Um die API ohne Evaluierungseinschränkungen zu testen, können Sie eine kostenlose temporäre Lizenz anfordern.

Fazit

In diesem Artikel haben Sie gelernt, wie Sie Bilder mit C++ in Word Dokumente konvertieren. Außerdem haben Sie gesehen, wie Sie den Neigungswinkel eines Bildes berechnen und verwenden, um OCR für schiefe Bilder durchzuführen. Die API bietet viele zusätzliche Funktionen, die Sie im Detail erkunden können, indem Sie die offizielle Dokumentation besuchen. Bei Fragen können Sie uns gerne in unserem kostenlosen Support-Forum erreichen.

Siehe auch