Obrazy i zeskanowane dokumenty mogą zawierać informacje tekstowe, które mogą wymagać dalszego przetworzenia. W tym celu pomocne może okazać się wykonanie operacji OCR na takich obrazach. Możesz wyodrębnić tekst z takich obrazów i zapisać go jako plik PDF z możliwością wyszukiwania. W tym celu w tym artykule dowiesz się, jak konwertować obrazy do przeszukiwalnych plików PDF za pomocą C++.
- C++ API do konwertowania obrazów na przeszukiwalne pliki PDF
- Konwertuj obraz na przeszukiwalny plik PDF za pomocą C++
- Konwertuj przekrzywiony obraz na przeszukiwalny plik PDF za pomocą C++
C++ API do konwertowania obrazów na przeszukiwalne pliki PDF
Aspose.OCR for C++ to interfejs API do optycznego rozpoznawania znaków, który może niezawodnie wykonywać operacje OCR na obrazach i zeskanowanych dokumentach. Interfejs API umożliwia także konwersję obrazów do przeszukiwalnych plików PDF. Możesz zainstalować API poprzez NuGet lub pobrać bezpośrednio z sekcji Downloads.
PM> Install-Package Aspose.OCR.Cpp
Konwertuj obraz na przeszukiwalny plik PDF za pomocą C++
Aspose.OCR for C++ zapewnia możliwość konwersji obrazów JPEG, BMP i PNG do przeszukiwalnych plików PDF. Aby to osiągnąć, wykonaj następujące czynności:
- Przygotuj bufor dla wyniku.
- Ustaw wartość elementu członkowskiego struktury RecognitionSettings.saveformat jako fileformat::pdf.
- Wykonaj operację OCR na obrazie i zapisz plik PDF za pomocą metody asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
Poniższy przykładowy kod pokazuje, jak utworzyć przeszukiwalny plik PDF z obrazu przy użyciu języka C++:
// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\sample.png";
// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Konwertuj przekrzywiony obraz na przeszukiwalny plik PDF za pomocą C++
API zapewnia również możliwość wykonywania operacji OCR na przekrzywionych obrazach. Poniżej przedstawiono kroki konwersji przekrzywionego obrazu do pliku PDF z możliwością wyszukiwania:
- Przygotuj bufor dla wyniku.
- Oblicz kąt pochylenia obrazu za pomocą metody asposeocrgetskew(const char \ imagepath).
- Ustaw wartość elementu członkowskiego struktury RecognitionSettings.saveformat jako fileformat::pdf.
- Określ kąt pochylenia za pomocą elementu członkowskiego struktury RecognitionSettings.skew.
- Wykonaj operację OCR na obrazie i zapisz plik PDF za pomocą metody asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
Poniżej przedstawiono kroki konwersji przekrzywionego obrazu do przeszukiwalnego pliku PDF za pomocą języka C++:
// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\skewSample.png";
// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Oblicz kąt skosu
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Uzyskaj bezpłatną licencję
Aby wypróbować interfejs API bez ograniczeń ewaluacyjnych, możesz poprosić o darmową licencję tymczasową.
Wniosek
W tym artykule nauczyłeś się konwertować obrazy do przeszukiwalnych plików PDF za pomocą C++. Dzięki Aspose.OCR for C++ API możesz konwertować obrazy JPEG, BMP i PNG do formatu PDF. Interfejs API zapewnia wiele dodatkowych funkcji, które można szczegółowo poznać, odwiedzając oficjalną dokumentację. W przypadku jakichkolwiek pytań prosimy o kontakt z nami na naszym bezpłatnym forum pomocy technicznej.