Obraz do DOCX OCR C++

Obrazy i zeskanowane dokumenty mogą zawierać informacje tekstowe, które mogą wymagać dalszego przetworzenia. Być może zrobiłeś smartfonem zdjęcia dokumentów tekstowych, które chcesz przekonwertować na dokumenty do edycji. W tym celu pomocne może okazać się wykonanie rozpoznawania OCR na obrazach. Dzięki OCR możesz konwertować obrazy na przeszukiwalne i edytowalne dokumenty Word. W tym celu w tym artykule dowiesz się, jak konwertować obrazy do dokumentów programu Word przy użyciu języka C++.

Interfejs API C++ do konwertowania obrazów na dokumenty programu Word

Aspose.OCR for C++ to interfejs API do optycznego rozpoznawania znaków, który może wydobywać tekst z obrazów. Interfejs API umożliwia także konwersję obrazów do dokumentów programu Word, takich jak pliki DOC, DOCX i TXT. Możesz zainstalować API przez NuGet lub pobrać bezpośrednio z sekcji Downloads.

PM> Install-Package Aspose.OCR.Cpp

Konwertuj obraz na dokument programu Word za pomocą C++

Często może być konieczne wyszukanie lub edycja tekstu w obrazach, ale nie można tego zrobić. Wykonując rozpoznawanie OCR na takich obrazach i konwertując je na dokumenty programu Word, możesz wyszukiwać i edytować tekst zgodnie z potrzebami. Aby to osiągnąć, wykonaj czynności podane poniżej.

Poniższy przykładowy kod pokazuje, jak przekonwertować obraz na dokument programu Word przy użyciu języka C++:

// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\sample.png";

// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Zrzut ekranu obrazu źródłowego i wyjściowego pliku programu Word

Zrzut ekranu obrazu źródłowego i wyjściowego pliku programu Word

Konwertuj przekrzywiony obraz na dokument programu Word za pomocą C++

Obrazy i zeskanowane dokumenty mogą być czasami przekrzywione. Dzięki Aspose.OCR for C++ API możesz wykonywać OCR na przekrzywionych obrazach. Poniżej przedstawiono kroki konwersji przekrzywionego obrazu na dokument programu Word:

Poniższy przykładowy kod pokazuje, jak przekonwertować przekrzywiony obraz na dokument programu Word przy użyciu języka C++:

// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\skewSample.png";

// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Oblicz kąt skosu
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Zrzut ekranu obrazu źródłowego i wyjściowego pliku programu Word

Zrzut ekranu obrazu źródłowego i wyjściowego pliku programu Word

Uzyskaj bezpłatną licencję

Aby wypróbować interfejs API bez ograniczeń ewaluacyjnych, możesz poprosić o bezpłatną licencję tymczasową.

Wniosek

W tym artykule nauczyłeś się konwertować obrazy do dokumentów programu Word przy użyciu języka C++. Ponadto wiesz, jak obliczać i wykorzystywać kąt pochylenia obrazu do wykonywania rozpoznawania OCR na przekrzywionych obrazach. Interfejs API udostępnia wiele dodatkowych funkcji, które można szczegółowo poznać, odwiedzając oficjalną dokumentację. W przypadku jakichkolwiek pytań skontaktuj się z nami na naszym darmowym forum pomocy technicznej.

Zobacz też