konwertuj-obraz-do-DOCX-OCR-java

Możesz przekonwertować obraz na przeszukiwalny lub edytowalny dokument tekstowy w formacie pliku DOCX oraz DOC. Popularne formaty obrazów, takie jak JPG, PNG, TIFF, BMP itp., można przekonwertować na dokument tekstowy (DOC/DOCX) z funkcją OCR w Jawa. Aby dowiedzieć się więcej, zapoznaj się z następującymi tematami:

Image to Word Document Converter – Instalacja Java API

Aspose.OCR for Java może służyć do wydajnego optycznego rozpoznawania znaków na obrazach. Możesz konwertować zeskanowane obrazy do przeszukiwalnych plików DOCX programowo przy użyciu języka Java. Pobierz plik JAR z New Releases lub skonfiguruj go w pliku pom.xml swojego projektu opartego na Maven, jak wyjaśniono poniżej:

Magazyn:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Zależność:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Konwertuj obraz na przeszukiwalny dokument programu Word (DOC/DOCX) przy użyciu języka Java

Możesz przekonwertować obraz na dokument tekstowy z możliwością wyszukiwania, wykonując poniższe czynności:

  1. Zadeklaruj instancję klasy AsposeOcr.
  2. Utwórz instancję obiektu klasy RecognitionSettings.
  3. Rozpoznaj obraz wejściowy metodą RecognizePage.
  4. Na koniec zapisz wynik w formacie Microsoft Word Document (DOC/DOCX).

Poniższy kod pokazuje, jak przekonwertować obraz na dokument tekstowy (DOC/DOCX) przy użyciu języka Java:

// Zainicjuj instancję AsposeOcr
AsposeOCR api = new AsposeOCR();

// Utwórz instancję obiektu klasy RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj obraz wejściowy metodą RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Zapisz wynik w formacie Microsoft Word Document
result.save("sample.docx", Format.Docx);

Konwertuj obraz na przeszukiwalny dokument programu Word (DOC/DOCX) ze sprawdzaniem pisowni w Javie

Możesz przekonwertować obraz na dokument tekstowy (DOCX/DOC), wykonując następujące czynności:

  1. Najpierw określ instancję klasy AsposeOcr.
  2. Zadeklaruj obiekt klasy RecognitionSettings.
  3. Rozpoznaj obraz za pomocą OCR przy użyciu metody RecognizePage.
  4. Zapisz wynik w formacie Word Document (DOC/DOCX) ze sprawdzaniem pisowni.

Poniższy kod wyjaśnia, jak przekonwertować obraz na dokument słowny z możliwością wyszukiwania ze sprawdzaniem pisowni w Javie:

// Zainicjuj instancję AsposeOcr
AsposeOCR api = new AsposeOCR();

// Utwórz instancję obiektu klasy RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Rozpoznaj obraz za pomocą OCR przy użyciu metody RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Zapisz wynik w formacie Word Document (DOC/DOCX) ze sprawdzaniem pisowni
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Uzyskaj bezpłatną licencję API

Możesz przetestować pełne możliwości interfejsu API dzięki Bezpłatnej licencji tymczasowej.

Wniosek

W tym artykule nauczyłeś się konwertować obraz do dokumentu Word (DOC/DOCX). Co więcej, możesz zwiększyć dokładność, sprawdzając pisownię w odpowiednim słowniku. Więcej informacji można znaleźć w dokumentacji interfejsu API. Ponadto zachęcamy do skontaktowania się z nami na Bezpłatnym forum wsparcia.

Zobacz też