Перетворюйте зображення у Word DOC DOCX за допомогою OCR у C++

Зображення та скановані документи можуть містити текстову інформацію, яку вам може знадобитися додатково обробити. Можливо, ви зробили зображення текстових документів за допомогою смартфона, які хочете перетворити на редаговані документи. Для цього може бути корисним розпізнавання зображень. За допомогою оптичного розпізнавання символів ви можете конвертувати зображення в документи Word, доступні для пошуку та редагування. З цією метою ця стаття навчить вас перетворювати зображення на документи Word за допомогою C++.

C++ API для перетворення зображень у документи Word
Перетворення зображення на документ Word за допомогою C++
Перетворіть перекошене зображення на документ Word за допомогою C++

C++ API для перетворення зображень у документи Word

Aspose.OCR for C++ – це API оптичного розпізнавання символів, який може витягувати текст із зображень. API також дозволяє конвертувати зображення в документи Word, як-от файли DOC, DOCX і TXT. Ви можете встановити API через NuGet або завантажити його безпосередньо з розділу Завантаження.

PM> Install-Package Aspose.OCR.Cpp

Перетворення зображення на документ Word за допомогою C++

Часто вам може знадобитися пошук або редагування тексту на зображеннях, але ви не можете це зробити. Виконуючи OCR на таких зображеннях і перетворюючи їх на документи Word, ви можете шукати та редагувати текст за потреби. Щоб досягти цього, виконайте наведені нижче дії.

Підготуйте буфер для результату.
Установіть значення члена структури RecognitionSettings.saveformat як fileformat::docx.
Виконайте операцію OCR із зображенням і збережіть файл Word за допомогою методу asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).

У наступному прикладі коду показано, як перетворити зображення на документ Word за допомогою C++:

// Шлях вихідного файлу
std::string image_path = "SourceDirectory\\sample.png";

// Підготувати буфер для результату (в символах, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Встановіть параметри розпізнавання
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Виконайте операцію OCR і збережіть вихідний файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);

Знімок екрана вихідного зображення та вихідного файлу Word

Перетворіть перекошене зображення на документ Word за допомогою C++

Зображення та скановані документи іноді можуть бути перекошеними. За допомогою API Aspose.OCR for C++ ви можете виконувати OCR на перекошених зображеннях. Нижче наведено кроки, щоб перетворити перекошене зображення на документ Word.

Підготуйте буфер для результату.
Обчисліть кут перекосу зображення за допомогою методу asposeocrgetskew(const char \ imagepath).
Установіть значення члена структури RecognitionSettings.saveformat як fileformat::docx.
Укажіть кут нахилу за допомогою члена структури RecognitionSettings.skew.
Виконайте операцію OCR із зображенням і збережіть файл Word за допомогою методу asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).

У наведеному нижче прикладі коду показано, як перетворити перекошене зображення на документ Word за допомогою C++:

// Шлях вихідного файлу
std::string image_path = "SourceDirectory\\skewSample.png";

// Підготувати буфер для результату (в символах, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Розрахувати кут нахилу
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Встановіть параметри розпізнавання
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Виконайте операцію OCR і збережіть вихідний файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);

Отримайте безкоштовну ліцензію

Щоб випробувати API без оціночних обмежень, ви можете подати запит на безкоштовну тимчасову ліцензію.

Висновок

У цій статті ви дізналися, як конвертувати зображення в документи Word за допомогою C++. Крім того, ви побачили, як обчислити та використовувати кут перекосу зображення для OCR на перекошених зображеннях. API надає багато додаткових функцій, які ви можете детально вивчити, відвідавши офіційну документацію. У разі будь-яких запитань зв’яжіться з нами на нашому безкоштовному форумі підтримки.

Дивись також

Перетворення зображення на текст за допомогою бібліотеки OCR C++

C++ API для перетворення зображень у документи Word#

Перетворення зображення на документ Word за допомогою C++#

Перетворіть перекошене зображення на документ Word за допомогою C++#

Отримайте безкоштовну ліцензію#

Висновок#

Дивись також#