konversi-Gambar-ke-DOCX-OCR-java

Anda dapat mengonversi gambar menjadi dokumen kata yang dapat dicari atau diedit dalam format file DOCX serta DOC. Format gambar populer seperti JPG, PNG, TIFF, BMP, dll., dapat dikonversi menjadi dokumen kata (DOC/DOCX) dengan OCR di Jawa. Silakan merujuk ke topik berikut untuk mempelajari lebih lanjut:

Image to Word Document Converter – Instalasi Java API

Aspose.OCR for Java dapat digunakan untuk pengenalan karakter optik yang efisien pada gambar. Anda dapat mengonversi gambar yang dipindai menjadi file DOCX yang dapat dicari secara terprogram menggunakan Java. Silakan unduh file JAR dari Rilis Baru atau konfigurasikan di file pom.xml proyek berbasis Maven Anda seperti yang dijelaskan di bawah:

Gudang:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

Ketergantungan:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

Konversi Gambar ke Dokumen Word yang Dapat Dicari (DOC/DOCX) menggunakan Java

Anda dapat mengonversi gambar menjadi dokumen kata yang dapat dicari dengan langkah-langkah di bawah ini:

  1. Deklarasikan turunan dari kelas AsposeOcr.
  2. Membuat instance objek kelas RecognitionSettings.
  3. Kenali gambar input dengan metode RecognizePage.
  4. Terakhir, simpan hasilnya dalam format Microsoft Word Document (DOC/DOCX).

Kode berikut menunjukkan cara mengonversi gambar ke dokumen kata (DOC/DOCX) menggunakan Java:

// Inisialisasi instance AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instansiasi objek kelas RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Kenali gambar masukan dengan metode RecognizePage
RecognitionResult result = api.RecognizePage("sample.png", settings);

// Simpan hasilnya dalam format Dokumen Microsoft Word
result.save("sample.docx", Format.Docx);

Konversi Gambar ke Dokumen Word yang Dapat Ditelusur (DOC/DOCX) dengan Pemeriksaan Ejaan di Java

Anda dapat mengonversi gambar menjadi dokumen kata (DOCX/DOC) dengan langkah-langkah berikut:

  1. Pertama, tentukan instance dari kelas AsposeOcr.
  2. Deklarasikan objek kelas PengaturanPengenalan.
  3. Kenali gambar dengan OCR menggunakan metode RecognizePage.
  4. Simpan hasilnya dalam format Word Document (DOC/DOCX) dengan spellcheck.

Kode di bawah ini menjelaskan cara mengonversi gambar menjadi dokumen kata yang dapat dicari dengan pemeriksa ejaan di Java:

// Inisialisasi instance AsposeOcr
AsposeOCR api = new AsposeOCR();

// Instansiasi objek kelas RecognitionSettings
RecognitionSettings settings = new RecognitionSettings();

// Kenali gambar dengan OCR menggunakan metode RecognizePage
com.aspose.ocr.RecognitionResult result = api.RecognizePage("sample.png", settings);

// Simpan hasilnya dalam format Word Document (DOC/DOCX) dengan spellcheck
result.saveSpellCheckCorrectedText("Sample_SpellCheck.docx", Format.Docx, SpellCheckLanguage.Eng);

Dapatkan Lisensi API Gratis

Anda dapat menguji API dalam kapasitas penuhnya dengan Lisensi Sementara Gratis.

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengubah gambar menjadi dokumen kata (DOC/DOCX). Selain itu, Anda dapat meningkatkan akurasi dengan memeriksa ejaan dengan kamus masing-masing. Silakan lihat API dokumentasi untuk informasi lebih lanjut. Selanjutnya, jangan ragu untuk menghubungi kami di Forum Dukungan Gratis.

Lihat juga