Konwertuj obraz na Word DOCX OCR

Obraz zawierający tekst można przekonwertować na edytowalny dokument tekstowy (DOCX) programowo przy użyciu języka C#. Na przykład musisz przekonwertować obraz przechwycony ze skanera lub aparatu fotograficznego na dokument do edycji, a następnie wykonać OCR na obrazie wejściowym. Więcej informacji można znaleźć w następujących sekcjach:

Konwerter obrazu na dokument programu Word (DOCX) w języku C# — instalacja

Aspose.OCR for .NET API może służyć do rozpoznawania tekstu z obrazów. Obsługuje konwersję obrazów do plików tekstowych lub dokumentów tekstowych (DOCX) zgodnie z Twoimi wymaganiami. Możesz łatwo skonfigurować API, pobierając plik DLL z sekcji Downloads lub przez NuGet Package Manager za pomocą następującego polecenia:

PM> Install-Package Aspose.OCR

Konwertuj obraz na dokument programu Word za pomocą OCR Programowo przy użyciu języka C#

Czasami otrzymujesz zeskanowane lub przechwycone obrazy tekstu, których nie można przeszukiwać ani edytować. Innymi słowy, możesz programowo przekonwertować obraz na edytowalny i przeszukiwalny dokument tekstowy (DOCX) za pomocą OCR. Ponadto musisz wykonać poniższe czynności, aby wykonać OCR na obrazie i zapisać wynik jako plik tekstowy DOCX:

  1. Najpierw zainicjuj instancję klasy AsposeOcr.
  2. Następnie rozpoznaj obraz wejściowy.
  3. Na koniec zapisz wynik w formacie Microsoft Word Document (DOCX).

Poniższy kod wyjaśnia, jak programowo przekonwertować obraz na dokument programu Word (DOCX) za pomocą funkcji OCR przy użyciu języka C#:

// Zainicjuj instancję AsposeOcr
AsposeOcr api = new AsposeOcr();

// Rozpoznaj obraz wejściowy
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Zapisz wynik w formacie Microsoft Word Document
result.Save("sample.docx", SaveFormat.Docx);

Konwertuj obraz na dokument Word za pomocą sprawdzania pisowni z OCR w C#

Możesz rozpoznawać tekst w różnych językach i konwertować obraz do dokumentu tekstowego. Interfejs API obsługuje wiele języków i umożliwia korzystanie ze słowników w celu maksymalizacji wydajności i autentyczności danych wyjściowych. Ponadto poniżej znajduje się lista niektórych popularnych słowników, które są obsługiwane do sprawdzania pisowni z rozpoznanym tekstem:

  • Pol: Słownik języka angielskiego
  • Deu: niemiecki słownik
  • Spa: hiszpański słownik
  • Fra: francuski słownik
  • Swe: szwedzki słownik

Ponadto możesz zapoznać się z Referencjami API, aby znaleźć pełną listę obsługiwanych dotychczas słowników.

Wykonaj poniższe czynności, aby przekonwertować obraz na dokument tekstowy (DOCX) przy użyciu sprawdzania pisowni za pomocą OCR:

  1. Najpierw utwórz instancję obiektu klasy AsposeOcr.
  2. Rozpoznaj obraz za pomocą OCR przy użyciu metody RecognizeImage().
  3. Na koniec zapisz wynik w formacie dokumentu programu Word ze sprawdzaniem pisowni.

Poniższy kod wyjaśnia, jak programowo przekonwertować tekst z obrazu na dokument tekstowy (DOCX) przy użyciu języka C#:

// Zainicjuj instancję AsposeOcr
AsposeOcr api = new AsposeOcr();

// Rozpoznaj obraz za pomocą OCR
RecognitionResult result = api.RecognizeImage("sample.png", new RecognitionSettings { });

// Zapisz wynik w formacie dokumentu programu Word ze sprawdzaniem pisowni
result.Save("Sample_SpellCheck.docx", SaveFormat.Docx, true, SpellChecker.SpellCheckLanguage.Eng);

Uzyskaj bezpłatną licencję API

Chcesz przetestować pełne możliwości interfejsu API bez ograniczeń ewaluacyjnych? Możesz poprosić o Bezpłatną licencję tymczasową.

Wniosek

Podsumowując, zbadałeś, jak przekonwertować tekst z obrazu na edytowalny lub przeszukiwalny dokument tekstowy za pomocą funkcji OCR programowo przy użyciu języka C#. Ponadto możesz zajrzeć do Dokumentacji API, aby zapoznać się z innymi funkcjami oferowanymi przez API. Ponadto prosimy o kontakt z nami na bezpłatnym forum pomocy technicznej w przypadku jakichkolwiek pytań.

Zobacz też