Зображення в DOCX OCR C++

Зображення та скановані документи можуть містити текстову інформацію, яку вам може знадобитися додатково обробити. Можливо, ви зробили зображення текстових документів за допомогою смартфона, які хочете перетворити на редаговані документи. Для цього може бути корисним розпізнавання зображень. За допомогою оптичного розпізнавання символів ви можете конвертувати зображення в документи Word, доступні для пошуку та редагування. З цією метою ця стаття навчить вас перетворювати зображення на документи Word за допомогою C++.

C++ API для перетворення зображень у документи Word

Aspose.OCR for C++ – це API оптичного розпізнавання символів, який може витягувати текст із зображень. API також дозволяє конвертувати зображення в документи Word, як-от файли DOC, DOCX і TXT. Ви можете встановити API через NuGet або завантажити його безпосередньо з розділу Завантаження.

PM> Install-Package Aspose.OCR.Cpp

Перетворення зображення на документ Word за допомогою C++

Часто вам може знадобитися пошук або редагування тексту на зображеннях, але ви не можете це зробити. Виконуючи OCR на таких зображеннях і перетворюючи їх на документи Word, ви можете шукати та редагувати текст за потреби. Щоб досягти цього, виконайте наведені нижче дії.

У наступному прикладі коду показано, як перетворити зображення на документ Word за допомогою C++:

// Шлях вихідного файлу
std::string image_path = "SourceDirectory\\sample.png";

// Підготувати буфер для результату (в символах, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Встановіть параметри розпізнавання
RecognitionSettings settings;
settings.save_format = file_format::docx;

// Виконайте операцію OCR і збережіть вихідний файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Знімок екрана вихідного зображення та вихідного файлу Word

Знімок екрана вихідного зображення та вихідного файлу Word

Перетворіть перекошене зображення на документ Word за допомогою C++

Зображення та скановані документи іноді можуть бути перекошеними. За допомогою API Aspose.OCR for C++ ви можете виконувати OCR на перекошених зображеннях. Нижче наведено кроки, щоб перетворити перекошене зображення на документ Word.

У наведеному нижче прикладі коду показано, як перетворити перекошене зображення на документ Word за допомогою C++:

// Шлях вихідного файлу
std::string image_path = "SourceDirectory\\skewSample.png";

// Підготувати буфер для результату (в символах, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Розрахувати кут нахилу
std::double_t angle = asposeocr_get_skew(image_path.c_str());

// Встановіть параметри розпізнавання
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;

// Виконайте операцію OCR і збережіть вихідний файл.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Знімок екрана вихідного зображення та вихідного файлу Word

Знімок екрана вихідного зображення та вихідного файлу Word

Отримайте безкоштовну ліцензію

Щоб випробувати API без оціночних обмежень, ви можете подати запит на безкоштовну тимчасову ліцензію.

Висновок

У цій статті ви дізналися, як конвертувати зображення в документи Word за допомогою C++. Крім того, ви побачили, як обчислити та використовувати кут перекосу зображення для OCR на перекошених зображеннях. API надає багато додаткових функцій, які ви можете детально вивчити, відвідавши офіційну документацію. У разі будь-яких запитань зв’яжіться з нами на нашому безкоштовному форумі підтримки.

Дивись також