Format DjVu służy do przechowywania zeskanowanych dokumentów, ponieważ mogą one zawierać tekst, obrazy lub rysunki. DjVu służy do archiwizacji danych, ponieważ jest w stanie przechowywać dane przy użyciu minimalnej przestrzeni. W tym artykule opisano, jak programowo rozpoznawać tekst z obrazów DjVu za pomocą operacji OCR w języku C#.
- Rozpoznawanie tekstu z obrazu DjVu – instalacja C# API
- Rozpoznaj tekst, wykonując OCR na obrazie DjVu w C#
Rozpoznawanie tekstu z obrazu DjVu – instalacja C# API
Aspose.OCR for .NET API obsługuje optyczne rozpoznawanie znaków dla różnych typów dokumentów, takich jak JPG, PNG, PDF itp. Podobnie obsługuje również rozpoznawanie tekstu z wielostronicowych plików graficznych DjVu. Możesz łatwo skonfigurować API, pobierając plik JAR API z sekcji Downloads. Podobnie możesz uruchomić następujące polecenie instalacji NuGet, aby zainstalować bibliotekę w swoim projekcie:
PM> Install-Package Aspose.OCR
Rozpoznaj tekst, wykonując OCR na obrazie DjVu w C#
Możesz rozpoznać tekst, wykonując operacje OCR na wielostronicowych obrazach DjVu, wykonując poniższe czynności:
- Zainicjuj instancję interfejsu API przy użyciu klasy AsposeOCR.
- Utwórz obiekt klasy DocumentRecognitionSettings.
- Rozpoznaj tekst za pomocą metody RecognizeDjvu.
- Wydrukuj rozpoznany tekst.
Poniższy przykładowy kod pokazuje, jak rozpoznać tekst z obrazu DjVu, wykonując programowo OCR w języku C#:
// Wprowadź ścieżkę pliku obrazu DJVU
string imgPath = "sample1.djvu";
// Zainicjuj obiekt klasy AsposeOcr
AsposeOcr api = new AsposeOcr();
// Rozpoznaj obrazy z DJVU
DocumentRecognitionSettings set = new DocumentRecognitionSettings();
set.PagesNumber = 0;
List<Aspose.OCR.RecognitionResult> result = api.RecognizeDjvu(imgPath, set);
// Wydrukuj wynik
int pageNumber = 0;
foreach (var page in result)
{
System.Console.WriteLine($"Page: {pageNumber++} text: {page.RecognitionText}");
}
Uzyskaj bezpłatną licencję API
Możesz poprosić o Bezpłatną licencję tymczasową, aby ocenić interfejs API bez żadnych ograniczeń ewaluacyjnych.
Wniosek
Podsumowując, nauczyłeś się rozpoznawać tekst za pomocą operacji OCR na wielostronicowym obrazie DjVu. Możesz rozpoznawać tekst z możliwością określenia ustawień rozpoznawania dokumentu, w których możesz ustawić opcje automatycznego kontrastu i pochylenia obrazu wejściowego w celu zwiększenia dokładności procesu rozpoznawania tekstu. Ponadto możesz zapoznać się z różnymi innymi funkcjami obsługiwanymi przez API, przeglądając sekcję dokumentacja. Jeśli chcesz omówić swoje wątpliwości lub wymagania, napisz do nas na forum.
Zobacz też
Konwertuj obraz do programu Excel za pomocą funkcji OCR w języku C#