Zeskanowane pliki PDF zawierają dane w formacie obrazu, ponieważ często są tworzone przez skanery. W niektórych sytuacjach możesz potrzebować informacji liczbowych z zeskanowanego pliku PDF. Możesz więc wykonywać operacje OCR w celu utworzenia pliku Excel. W tym artykule opisano, jak programowo utworzyć zeskanowany konwerter plików PDF na Excel z funkcją OCR w Javie.
- Utwórz zeskanowany plik PDF do konwertera Excel z OCR – instalacja Java API
- Programowo konwertuj zeskanowany plik PDF do programu Excel w Javie
Utwórz zeskanowany plik PDF do konwertera Excel z OCR – instalacja Java API
Możesz optycznie rozpoznać tekst w pliku PDF za pomocą funkcji OCR przy użyciu Aspose.OCR for Java API. Po prostu zainstaluj API, pobierając plik JAR z sekcji New Releases lub korzystając ze specyfikacji Mavena poniżej:
Magazyn:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
Zależność:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>21.12</version>
</dependency>
Programowo konwertuj zeskanowany plik PDF do programu Excel w Javie
Możesz przekonwertować zeskanowany plik PDF do formatu Excel za pomocą OCR, wykonując poniższe czynności:
- Utwórz obiekt klasy AsposeOcr.
- Określ ustawienia za pomocą klasy DocumentRecognitionSettings.
- Rozpoznaj zeskanowany plik PDF za pomocą metody RecognizePdf.
- Zapisz wyjściowy wynik OCR jako plik Excel.
Poniższy fragment kodu wyjaśnia, jak programowo przekonwertować zeskanowany plik PDF na plik programu Excel w Javie:
// Zeskanowana ścieżka pliku PDF
String fullPath = "scanned.pdf";
// Zainicjuj obiekt klasy AsposeOcr
AsposeOCRPdf api = new AsposeOCRPdf();
// Zainicjuj obiekt klasy DocumentRecognitionSettings
DocumentRecognitionSettings settings = new DocumentRecognitionSettings(0,1);
// Rozpoznawanie obrazów z plików PDF
ArrayList<RecognitionResult> res = api.RecognizePdf(fullPath, settings);
// Zapisz wynik jako plik Excel XLSX
AsposeOCR.SaveMultipageDocument("output.xlsx", Format.Xlsx, res);
Uzyskaj bezpłatną licencję ewaluacyjną
Możesz ocenić API do tworzenia zeskanowanych konwerterów plików PDF do Excela za pomocą operacji OCR bez żadnych ograniczeń, prosząc o bezpłatną licencję tymczasową.
Wniosek
W tym artykule zrozumiałeś, jak programowo przekonwertować zeskanowany plik PDF na plik Excel za pomocą funkcji OCR w Javie. Ponadto zapoznaj się z innymi funkcjami związanymi z OCR, odwiedzając dokumentację. Jeśli masz jakiekolwiek wątpliwości, napisz do nas na forum.