Obrazy i zeskanowane dokumenty mogą zawierać informacje tekstowe, które mogą wymagać dalszego przetworzenia. Być może zrobiłeś smartfonem zdjęcia dokumentów tekstowych, które chcesz przekonwertować na dokumenty do edycji. W tym celu pomocne może okazać się wykonanie rozpoznawania OCR na obrazach. Dzięki OCR możesz konwertować obrazy na przeszukiwalne i edytowalne dokumenty Word. W tym celu w tym artykule dowiesz się, jak konwertować obrazy do dokumentów programu Word przy użyciu języka C++.
- Interfejs API C++ do konwertowania obrazów na dokumenty programu Word
- Konwertuj obraz na dokument programu Word za pomocą C++
- Konwertuj przekrzywiony obraz na dokument programu Word za pomocą C++
Interfejs API C++ do konwertowania obrazów na dokumenty programu Word
Aspose.OCR for C++ to interfejs API do optycznego rozpoznawania znaków, który może wydobywać tekst z obrazów. Interfejs API umożliwia także konwersję obrazów do dokumentów programu Word, takich jak pliki DOC, DOCX i TXT. Możesz zainstalować API przez NuGet lub pobrać bezpośrednio z sekcji Downloads.
PM> Install-Package Aspose.OCR.Cpp
Konwertuj obraz na dokument programu Word za pomocą C++
Często może być konieczne wyszukanie lub edycja tekstu w obrazach, ale nie można tego zrobić. Wykonując rozpoznawanie OCR na takich obrazach i konwertując je na dokumenty programu Word, możesz wyszukiwać i edytować tekst zgodnie z potrzebami. Aby to osiągnąć, wykonaj czynności podane poniżej.
- Przygotuj bufor dla wyniku.
- Ustaw wartość elementu członkowskiego struktury RecognitionSettings.saveformat jako fileformat::docx.
- Wykonaj operację OCR na obrazie i zapisz plik Word za pomocą metody asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
Poniższy przykładowy kod pokazuje, jak przekonwertować obraz na dokument programu Word przy użyciu języka C++:
// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\sample.png";
// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.save_format = file_format::docx;
// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\ImageToDocx.Docx", settings);
Konwertuj przekrzywiony obraz na dokument programu Word za pomocą C++
Obrazy i zeskanowane dokumenty mogą być czasami przekrzywione. Dzięki Aspose.OCR for C++ API możesz wykonywać OCR na przekrzywionych obrazach. Poniżej przedstawiono kroki konwersji przekrzywionego obrazu na dokument programu Word:
- Przygotuj bufor dla wyniku.
- Oblicz kąt pochylenia obrazu za pomocą metody asposeocrgetskew(const char \ imagepath).
- Ustaw wartość elementu członkowskiego struktury RecognitionSettings.saveformat jako fileformat::docx.
- Określ kąt pochylenia za pomocą elementu członkowskiego struktury RecognitionSettings.skew.
- Wykonaj operację OCR na obrazie i zapisz plik Word za pomocą metody asposeocrpagesave(const char \ imagepath, const char \ savepath, RecognitionSettings settings).
Poniższy przykładowy kod pokazuje, jak przekonwertować przekrzywiony obraz na dokument programu Word przy użyciu języka C++:
// Ścieżka pliku źródłowego
std::string image_path = "SourceDirectory\\skewSample.png";
// Przygotuj bufor dla wyniku (w symbolach, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Oblicz kąt skosu
std::double_t angle = asposeocr_get_skew(image_path.c_str());
// Ustaw ustawienia rozpoznawania
RecognitionSettings settings;
settings.save_format = file_format::docx;
settings.skew = angle;
// Wykonaj operację OCR i zapisz plik wyjściowy.
asposeocr_page_save(image_path.c_str(), "OutputDirectory\\SkewedImageToDocx.docx", settings);
Uzyskaj bezpłatną licencję
Aby wypróbować interfejs API bez ograniczeń ewaluacyjnych, możesz poprosić o bezpłatną licencję tymczasową.
Wniosek
W tym artykule nauczyłeś się konwertować obrazy do dokumentów programu Word przy użyciu języka C++. Ponadto wiesz, jak obliczać i wykorzystywać kąt pochylenia obrazu do wykonywania rozpoznawania OCR na przekrzywionych obrazach. Interfejs API udostępnia wiele dodatkowych funkcji, które można szczegółowo poznać, odwiedzając oficjalną dokumentację. W przypadku jakichkolwiek pytań skontaktuj się z nami na naszym darmowym forum pomocy technicznej.