Zeskanowany plik PDF do programu Excel OCR

Zeskanowane pliki PDF zawierają dane w formacie obrazu i czasami możesz potrzebować informacji z takich dokumentów. W niektórych sytuacjach zeskanowany plik PDF może zawierać informacje liczbowe, które mogą wymagać manipulacji w programie Excel. Zgodnie z tym można wykonać operacje OCR i utworzyć plik Excel. W tym artykule opisano, jak programowo utworzyć zeskanowany konwerter plików PDF do formatu Excel z funkcją OCR przy użyciu języka C#.

Utwórz zeskanowany konwerter plików PDF do programu Excel z OCR — instalacja API C#

Możesz pracować z funkcjami OCR oferowanymi przez Aspose.OCR for .NET API. Możesz łatwo utworzyć zeskanowany konwerter plików PDF na Excel za pomocą OCR, pobierając plik DLL z sekcji Nowe wydania lub za pomocą poniższego polecenia instalacyjnego NuGet:

PM> Install-Package Aspose.OCR

Programowo konwertuj zeskanowany plik PDF do programu Excel w języku C#

Możesz przekonwertować zeskanowany dokument PDF do pliku Excel za pomocą OCR, wykonując poniższe czynności:

  1. Utwórz instancję obiektu klasy AsposeOcr.
  2. Określ obiekt klasy DocumentRecognitionSettings.
  3. Rozpoznaj zeskanowany plik PDF metodą RecognizePdf.
  4. Zapisz wyjściowy plik programu Excel przy użyciu metody SaveMultipageDocument.

Poniższy przykładowy kod wyjaśnia, jak przekonwertować zeskanowany plik PDF do formatu Excel przy użyciu języka C#:

// Zeskanowana ścieżka pliku PDF
string path = "Scanned.pdf";

// Zainicjuj obiekt klasy AsposeOcr
AsposeOcr api = new AsposeOcr();

// Określ ustawienia rozpoznawania pliku PDF
DocumentRecognitionSettings settings = new DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 1;

// Rozpoznaj strony z zeskanowanego pliku PDF
List<RecognitionResult> res = api.RecognizePdf(path , settings);

// Zapisz wynik wyjściowy jako plik programu Excel w formacie XLSX
AsposeOcr.SaveMultipageDocument("output.xlsx", SaveFormat.Xlsx, res);

Uzyskaj bezpłatną licencję ewaluacyjną

Możesz w pełni ocenić funkcję konwersji zeskanowanego pliku PDF do formatu Excel, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule sprawdziłeś, jak przekonwertować zeskanowany plik PDF do formatu Excel, stosując operacje OCR w celu optycznego rozpoznania tekstu. Może to być pomocne w sytuacjach, gdy plik CSV jest skanowany przez skaner i tworzony jest plik PDF. Możesz programowo przekonwertować go do pliku programu Excel przy użyciu języka C#. Ponadto możesz zapoznać się z innymi funkcjami związanymi z OCR oferowanymi przez API, przeglądając dokumentację. W przypadku jakichkolwiek pytań prosimy o kontakt na forum.

Zobacz też