画像やスキャンしたドキュメントには、さらに処理する必要のあるテキスト情報が含まれている場合があります。このため、このような画像に対してOCR操作を実行すると役立つ場合があります。このような画像からテキストを抽出して、検索可能なPDFファイルとして保存できます。そのために、この記事では、C++を使用して画像を検索可能なPDFファイルに変換する方法を説明します。
画像を検索可能なPDFファイルに変換するためのC++API
Aspose.OCR for C++は、画像やスキャンしたドキュメントに対してOCR操作を確実に実行できる光学式文字認識APIです。 APIを使用すると、画像を検索可能なPDFに変換することもできます。 APIは、NuGetからインストールするか、ダウンロードセクションから直接ダウンロードできます。
PM> Install-Package Aspose.OCR.Cpp
C++を使用して画像を検索可能なPDFファイルに変換する
Aspose.OCR for C++は、JPEG、BMP、およびPNG画像を検索可能なPDFファイルに変換する機能を提供します。これを実現するには、以下の手順に従ってください。
- 結果のバッファーを準備します。
- RecognitionSettings.save_format構造体メンバーの値をfile_format::pdfとして設定します。
- 画像に対してOCR操作を実行し、asposeocr_page_save(const char * image_path, const char * save_path, RecognitionSettings settings)メソッドを使用してPDFファイルを保存します。
次のサンプルコードは、C++を使用して画像から検索可能なPDFファイルを作成する方法を示しています。
// ソースファイルのパス
std::string image_path = "SourceDirectory\\sample.png";
// 結果のバッファを準備します(シンボルでは、len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// 認識設定を行う
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
// OCR操作を実行し、出力ファイルを保存します。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToPDF.pdf", settings);
C++を使用して歪んだ画像を検索可能なPDFファイルに変換する
APIは、歪んだ画像に対してOCR操作を実行する機能も提供します。歪んだ画像を検索可能なPDFファイルに変換する手順は次のとおりです。
- 結果のバッファーを準備します。
- asposeocr_get_skew(const char * image_path)メソッドを使用して、画像のスキュー角度を計算します。
- RecognitionSettings.save_format構造体メンバーの値をfile_format::pdfとして設定します。
- RecognitionSettings.skew構造体メンバーを使用してスキュー角度を指定します。
- 画像に対してOCR操作を実行し、asposeocr_page_save(const char * image_path, const char * save_path, RecognitionSettings settings)メソッドを使用してPDFファイルを保存します。
以下は、C++を使用して歪んだ画像を検索可能なPDFファイルに変換する手順です。
// ソースファイルのパス
std::string image_path = "SourceDirectory\\skewSample.png";
// 結果のバッファを準備します(シンボルでは、len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// スキュー角度を計算する
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// 認識設定を行う
RecognitionSettings settings;
settings.language_alphabet = language::eng;
settings.save_format = file_format::pdf;
settings.skew = angle;
// OCR操作を実行し、出力ファイルを保存します。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToPDF.pdf", settings);
無料ライセンスを取得する
評価制限なしでAPIを試すために、無料の一時ライセンスをリクエストできます。
結論
この記事では、C++を使用して画像を検索可能なPDFファイルに変換する方法を学習しました。 Aspose.OCR for C++ APIを使用すると、JPEG、BMP、およびPNG画像をPDF形式に変換できます。 APIは、公式ドキュメントにアクセスして詳細に調べることができる多くの追加機能を提供します。ご不明な点がございましたら、無料サポートフォーラムまでお気軽にお問い合わせください。