Zeskanowany plik PDF do programu Excel OCR Java

Zeskanowane pliki PDF zawierają dane w formacie obrazu, ponieważ często są tworzone przez skanery. W niektórych sytuacjach możesz potrzebować informacji liczbowych z zeskanowanego pliku PDF. Możesz więc wykonywać operacje OCR w celu utworzenia pliku Excel. W tym artykule opisano, jak programowo utworzyć zeskanowany konwerter plików PDF na Excel z funkcją OCR w Javie.

Utwórz zeskanowany plik PDF do konwertera Excel z OCR – instalacja Java API

Możesz optycznie rozpoznać tekst w pliku PDF za pomocą funkcji OCR przy użyciu Aspose.OCR for Java API. Po prostu zainstaluj API, pobierając plik JAR z sekcji New Releases lub korzystając ze specyfikacji Mavena poniżej:

Magazyn:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Zależność:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>21.12</version>
</dependency>

Programowo konwertuj zeskanowany plik PDF do programu Excel w Javie

Możesz przekonwertować zeskanowany plik PDF do formatu Excel za pomocą OCR, wykonując poniższe czynności:

  1. Utwórz obiekt klasy AsposeOcr.
  2. Określ ustawienia za pomocą klasy DocumentRecognitionSettings.
  3. Rozpoznaj zeskanowany plik PDF za pomocą metody RecognizePdf.
  4. Zapisz wyjściowy wynik OCR jako plik Excel.

Poniższy fragment kodu wyjaśnia, jak programowo przekonwertować zeskanowany plik PDF na plik programu Excel w Javie:

// Zeskanowana ścieżka pliku PDF
String fullPath = "scanned.pdf";

// Zainicjuj obiekt klasy AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();

// Zainicjuj obiekt klasy DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);

// Rozpoznawanie obrazów z plików PDF           
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);

// Zapisz wynik jako plik Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);

Uzyskaj bezpłatną licencję ewaluacyjną

Możesz ocenić API do tworzenia zeskanowanych konwerterów plików PDF do Excela za pomocą operacji OCR bez żadnych ograniczeń, prosząc o bezpłatną licencję tymczasową.

Wniosek

W tym artykule zrozumiałeś, jak programowo przekonwertować zeskanowany plik PDF na plik Excel za pomocą funkcji OCR w Javie. Ponadto zapoznaj się z innymi funkcjami związanymi z OCR, odwiedzając dokumentację. Jeśli masz jakiekolwiek wątpliwości, napisz do nas na forum.

Zobacz też