画像やスキャンしたドキュメントには、さらに処理する必要のあるテキスト情報が含まれている場合があります。スマートフォンを使用して、編集可能なドキュメントに変換したいテキストドキュメントの写真をキャプチャした可能性があります。このため、画像に対してOCRを実行すると役立つ場合があります。 OCRを使用すると、画像を検索および編集可能なWord文書に変換できます。そのために、この記事では、C++を使用して画像をWord文書に変換する方法を説明します。
画像をWord文書に変換するためのC++API
Aspose.OCR for C++は、画像からテキストを抽出できる光学式文字認識APIです。 APIを使用すると、画像をDOC、DOCX、TXTファイルなどのWordドキュメントに変換することもできます。 APIは、NuGetからインストールするか、ダウンロードセクションから直接ダウンロードできます。
PM> Install-Package Aspose.OCR.Cpp
C++を使用して画像をWord文書に変換する
多くの場合、画像内のテキストを検索または編集する必要がありますが、それはできません。このような画像に対してOCRを実行し、Word文書に変換することで、必要に応じてテキストを検索および編集できます。これを実現するには、以下の手順に従ってください。
- 結果のバッファーを準備します。
- RecognitionSettings.save_format構造体メンバーの値をfile\format::docxとして設定します。
- 画像に対してOCR操作を実行し、asposeocr_page_save(const char * image_path, const char * save_path, RecognitionSettings settings)メソッドを使用してWordファイルを保存します。
次のサンプルコードは、C++を使用して画像をWord文書に変換する方法を示しています。
// ソースファイルのパス
std::string image_path = "SourceDirectory\\sample.png";
// 結果のバッファを準備します(シンボルでは、len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// 認識設定を行う
RecognitionSettings settings;
settings.save_format = file_format::docx;
// OCR操作を実行し、出力ファイルを保存します。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
C++を使用して歪んだ画像をWord文書に変換する
画像やスキャンしたドキュメントが歪むことがあります。 Aspose.OCR for C++ APIを使用すると、歪んだ画像に対してOCRを実行できます。歪んだ画像をWord文書に変換する手順は次のとおりです。
- 結果のバッファーを準備します。
- asposeocr_get_skew(const char * image_path)メソッドを使用して、画像のスキュー角度を計算します。
- RecognitionSettings.save_format構造体メンバーの値をfile\format::docxとして設定します。
- RecognitionSettings.skew構造体メンバーを使用してスキュー角度を指定します。
- 画像に対してOCR操作を実行し、asposeocr_page_save(const char * image_path, const char * save_path, RecognitionSettings settings)メソッドを使用してWordファイルを保存します。
次のサンプルコードは、C++を使用して歪んだ画像をWord文書に変換する方法を示しています。
// ソースファイルのパス
std::string image_path = "SourceDirectory\\skewSample.png";
// 結果のバッファを準備します(シンボルでは、len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// スキュー角度を計算する
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// 認識設定を行う
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// OCR操作を実行し、出力ファイルを保存します。
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
無料ライセンスを取得する
評価制限なしでAPIを試すために、無料の一時ライセンスをリクエストできます。
結論
この記事では、C++を使用して画像をWord文書に変換する方法を学びました。さらに、画像のスキュー角度を計算して使用し、スキューされた画像に対してOCRを実行する方法を見てきました。 APIは、公式ドキュメントにアクセスして詳細に調べることができる多くの追加機能を提供します。ご不明な点がございましたら、無料サポートフォーラムまでお気軽にお問い合わせください。