Obraz do PDF OCR C++

Obrazy i zeskanowane dokumenty mogą zawierać informacje tekstowe, które mogą wymagać dalszego przetworzenia. W tym celu pomocne może okazać się wykonanie operacji OCR na takich obrazach. Możesz wyodrębnić tekst z takich obrazów i zapisać go jako plik PDF z możliwością wyszukiwania. W tym celu w tym artykule dowiesz się, jak konwertować obrazy do przeszukiwalnych plików PDF za pomocą C++.

C++ API do konwertowania obrazów na przeszukiwalne pliki PDF

Aspose.OCR for C++ to interfejs API do optycznego rozpoznawania znaków, który może niezawodnie wykonywać operacje OCR na obrazach i zeskanowanych dokumentach. Interfejs API umożliwia także konwersję obrazów do przeszukiwalnych plików PDF. Możesz zainstalować API poprzez NuGet lub pobrać bezpośrednio z sekcji Downloads.

PM> Install-Package Aspose.OCR.Cpp

Konwertuj obraz na przeszukiwalny plik PDF za pomocą C++

Aspose.OCR for C++ zapewnia możliwość konwersji obrazów JPEG, BMP i PNG do przeszukiwalnych plików PDF. Aby to osiągnąć, wykonaj następujące czynności:

Poniższy przykładowy kod pokazuje, jak utworzyć przeszukiwalny plik PDF z obrazu przy użyciu języka C++:

// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\sample.png";

// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;

// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Zrzut ekranu obrazu źródłowego i wyjściowego pliku PDF

Zrzut ekranu obrazu źródłowego i wyjściowego pliku PDF

Konwertuj przekrzywiony obraz na przeszukiwalny plik PDF za pomocą C++

API zapewnia również możliwość wykonywania operacji OCR na przekrzywionych obrazach. Poniżej przedstawiono kroki konwersji przekrzywionego obrazu do pliku PDF z możliwością wyszukiwania:

Poniżej przedstawiono kroki konwersji przekrzywionego obrazu do przeszukiwalnego pliku PDF za pomocą języka C++:

// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\skewSample.png";

// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Oblicz kąt skosu
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;

// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Zrzut ekranu obrazu źródłowego i wyjściowego pliku PDF

Zrzut ekranu obrazu źródłowego i wyjściowego pliku PDF

Uzyskaj bezpłatną licencję

Aby wypróbować interfejs API bez ograniczeń ewaluacyjnych, możesz poprosić o darmową licencję tymczasową.

Wniosek

W tym artykule nauczyłeś się konwertować obrazy do przeszukiwalnych plików PDF za pomocą C++. Dzięki Aspose.OCR for C++ API możesz konwertować obrazy JPEG, BMP i PNG do formatu PDF. Interfejs API zapewnia wiele dodatkowych funkcji, które można szczegółowo poznać, odwiedzając oficjalną dokumentację. W przypadku jakichkolwiek pytań prosimy o kontakt z nami na naszym bezpłatnym forum pomocy technicznej.

Zobacz też