Obrázky a naskenované dokumenty mohou obsahovat textové informace, které možná budete muset dále zpracovat. K tomu se může ukázat jako užitečné provádění operací OCR na takových snímcích. Z takových obrázků můžete extrahovat text a uložit jej jako soubor PDF s možností vyhledávání. Za tímto účelem vás tento článek naučí, jak převést obrázky do souborů PDF s možností vyhledávání pomocí C++.
- C++ API pro převod obrázků na prohledávatelné soubory PDF
- Převeďte obrázek do souboru PDF s možností vyhledávání pomocí C++
- Převeďte zkosený obrázek na prohledávatelný soubor PDF pomocí C++
C++ API pro převod obrázků na prohledávatelné soubory PDF
Aspose.OCR for C++ je rozhraní API pro optické rozpoznávání znaků, které dokáže spolehlivě provádět operace OCR na obrázcích a naskenovaných dokumentech. Rozhraní API také umožňuje převádět obrázky do prohledávatelných PDF. Rozhraní API můžete nainstalovat buď prostřednictvím NuGet, nebo si jej stáhnout přímo ze sekce Downloads.
PM> Install-Package Aspose.OCR.Cpp
Převeďte obrázek do souboru PDF s možností vyhledávání pomocí C++
Aspose.OCR for C++ vám poskytuje možnost převádět obrázky JPEG, BMP a PNG na soubory PDF s možností vyhledávání. Chcete-li toho dosáhnout, postupujte podle následujících kroků:
- Připravte si pufr na výsledek.
- Nastavte hodnotu člena struktury RecognitionSettings.saveformat jako fileformat::pdf.
- Proveďte operaci OCR na obrázku a uložte soubor PDF pomocí metody asposeocrpagesave(const char \ imagepath, const char \ savepath, nastavení RecognitionSettings).
Následující ukázkový kód ukazuje, jak vytvořit prohledávatelný soubor PDF z obrázku pomocí C++:
// Cesta ke zdrojovému souboru
std::string image_path = "SourceDirectory\\sample.png";
// Připravte vyrovnávací paměť pro výsledek (v symbolech, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Nastavte nastavení rozpoznávání
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// Proveďte operaci OCR a uložte výstupní soubor.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
Převeďte zkosený obrázek na prohledávatelný soubor PDF pomocí C++
Rozhraní API také poskytuje možnost provádět operace OCR na zkreslených obrázcích. Následují kroky pro převod zkoseného obrázku na soubor PDF s možností vyhledávání:
- Připravte si pufr na výsledek.
- Vypočítejte úhel zkosení obrázku pomocí metody asposeocrgetskew(const char \ imagepath).
- Nastavte hodnotu člena struktury RecognitionSettings.saveformat jako fileformat::pdf.
- Určete úhel zkosení pomocí členu struktury RecognitionSettings.skew.
- Proveďte operaci OCR na obrázku a uložte soubor PDF pomocí metody asposeocrpagesave(const char \ imagepath, const char \ savepath, nastavení RecognitionSettings).
Níže jsou uvedeny kroky pro převod zkoseného obrázku na soubor PDF s možností vyhledávání pomocí C++:
// Cesta ke zdrojovému souboru
std::string image_path = "SourceDirectory\\skewSample.png";
// Připravte vyrovnávací paměť pro výsledek (v symbolech, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Vypočítejte úhel zkosení
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Nastavte nastavení rozpoznávání
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// Proveďte operaci OCR a uložte výstupní soubor.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
Získejte bezplatnou licenci
Abyste mohli API vyzkoušet bez omezení hodnocení, můžete požádat o bezplatnou dočasnou licenci.
Závěr
V tomto článku jste se naučili, jak převádět obrázky do souborů PDF s možností vyhledávání pomocí C++. S Aspose.OCR for C++ API můžete převádět obrázky JPEG, BMP a PNG do formátu PDF. Rozhraní API poskytuje mnoho dalších funkcí, které můžete podrobně prozkoumat návštěvou oficiální dokumentace. V případě jakýchkoli dotazů nás neváhejte kontaktovat na našem bezplatném fóru podpory.