Ekstrak Teks atau Gambar dari Dokumen OneNote menggunakan Java

Kita dapat mengumpulkan dan mengatur catatan berupa teks, gambar, kliping layar, dan komentar audio dalam dokumen OneNote. Kami terkadang perlu mengekstrak teks atau gambar dari dokumen OneNote secara terprogram dalam aplikasi Java. Ekstraksi tersebut memungkinkan kita untuk menggunakan kembali teks atau gambar yang diekstraksi secara terpisah. Pada artikel ini, kita akan mempelajari cara mengekstrak teks atau gambar dari dokumen OneNote menggunakan Java.

Topik-topik berikut akan dibahas dalam artikel ini:

Java API untuk Mengekstrak Teks atau Gambar dari OneNote

Untuk mengekstrak teks dan gambar dari dokumen OneNote, kita akan menggunakan API Aspose.Note for Java. Itu memungkinkan membuat, membaca, dan mengonversi dokumen OneNote secara terprogram tanpa menggunakan MS OneNote. Harap unduh JAR API atau tambahkan konfigurasi pom.xml berikut dalam aplikasi Java berbasis Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-note</artifactId>
    <version>22.1</version>
    <classifier>jdk17</classifier>
</dependency>

Ekstrak Semua Teks dari Dokumen OneNote menggunakan Java

Kami dapat dengan mudah mengekstrak semua teks dari dokumen OneNote dengan mengikuti langkah-langkah yang diberikan di bawah ini:

  1. Pertama, muat file OneNote menggunakan kelas Document.
  2. Setelah itu, panggil metode GetChildNodes dengan RichText.class sebagai argumen untuk mengekstrak teks.
  3. Terakhir, tampilkan teks yang diekstraksi.

Contoh kode berikut menunjukkan cara mengekstrak semua teks dari file OneNote menggunakan Java.

// Contoh kode ini menunjukkan cara mengekstrak semua teks dari dokumen OneNode.
// Muat dokumen ke Aspose.Note.
Document oneFile = new Document("D:\\Files\\Note\\Sample1.one");

// Ambil teks
List<RichText> textNodes = (List<RichText>) oneFile.getChildNodes(RichText.class);

for (RichText richText : textNodes) {
  if(!richText.getText().isBlank())
    System.out.println(richText.getText().toString());
}
Ekstrak Semua Teks dari Dokumen OneNote menggunakan Java

Ekstrak Semua Teks dari Dokumen OneNote menggunakan Java

Dapatkan Teks dari Halaman Tertentu Dokumen OneNote di Java

Kami dapat mengekstrak teks dari halaman tertentu dari dokumen OneNote dengan mengikuti langkah-langkah yang diberikan di bawah ini:

  1. Pertama, muat file OneNote menggunakan kelas Document.
  2. Selanjutnya, panggil metode GetChildNodes dengan Page.class sebagai argumen untuk mengekstrak halaman.
  3. Kemudian, dapatkan halaman tertentu dengan indeksnya dari daftar halaman.
  4. Setelah itu, dapatkan daftar item teks untuk halaman menggunakan metode GetChildNodes dengan RichText.class sebagai argumen.
  5. Terakhir, tampilkan teks yang diekstraksi.

Contoh kode berikut menunjukkan cara mengekstrak teks dari halaman tertentu file OneNote menggunakan Java.

// Contoh kode ini menunjukkan cara mengekstrak teks dari halaman tertentu dari dokumen OneNode.
// Muat dokumen ke Aspose.Note
Document doc = new Document("D:\\Files\\Note\\Sample1.one");

// Dapatkan daftar node halaman
List<Page> pages = doc.getChildNodes(Page.class);

// Dapatkan halaman demi indeks
Page page = pages.get(0);

// Dapatkan teks halaman
List<RichText> textNodes = (List<RichText>) page.getChildNodes(RichText.class);

// Tampilkan teks
for (RichText richText : textNodes) {
  if(!richText.getText().isBlank())
    System.out.println(richText.getText().toString());
}

Kami dapat mengulangi semua halaman satu per satu dan mengekstrak teks untuk setiap halaman seperti yang ditunjukkan pada contoh kode yang diberikan di bawah ini:

// Contoh kode ini menunjukkan cara mengekstrak teks dari halaman dokumen OneNode.
// Muat dokumen ke Aspose.Note.
Document doc = new Document("D:\\Files\\Note\\Sample1.one");

// Dapatkan daftar node halaman
List<Page> pages = doc.getChildNodes(Page.class);

for (Page p : pages) {
  System.out.println("---- Page Started Here ----");

  List<RichText> textNodes = (List<RichText>) p.getChildNodes(RichText.class);

 for (RichText richText : textNodes) {
    if(!richText.getText().isBlank())
      System.out.println(richText.getText().toString());
  }

  System.out.println("---- Page Ended Here ----");
  System.out.println();
}
Dapatkan Teks dari Halaman Tertentu Dokumen OneNote di Java

Dapatkan Teks dari semua Halaman satu per satu di Jawa

Ekstrak Gambar dari Dokumen OneNote menggunakan Java

Kami juga dapat mengekstrak gambar dari dokumen OneNote dengan mengikuti langkah-langkah berikut:

  1. Pertama, muat file OneNote menggunakan kelas Document.
  2. Setelah itu, dapatkan daftar gambar menggunakan metode GetChildNodes dengan Image.class sebagai argumen.
  3. Terakhir, tampilkan properti gambar dan simpan ke disk lokal.

Contoh kode berikut menunjukkan cara mengekstrak gambar dari file OneNote menggunakan Java.

// Contoh kode ini menunjukkan cara mengekstrak gambar dari dokumen OneNode.
// Muat dokumen ke Aspose.Note
Document doc = new Document("D:\\Files\\Note\\Sample1.one");

// Dapatkan semua gambar
List<Image> list = doc.getChildNodes(Image.class);
System.out.printf("Total Images: %s\n\n", list.size());

// Lintasi daftar
for (int i = 0; i < list.size(); i++) {
  Image image = list.get(i);

  // Tampilkan properti gambar
  System.out.println("Width: " + image.getWidth());
  System.out.println("Height: " + image.getHeight());
  System.out.println("OriginalWidth: " + image.getOriginalWidth());
  System.out.println("OriginalHeight: " + image.getOriginalHeight());
  System.out.println("FileName: " + image.getFileName());
  System.out.println("LastModifiedTime: " + image.getLastModifiedTime());

  String outputFile = "ExtractImages_out" + i + "_" + image.getFileName();

  // Simpan gambar
  byte[] buffer = image.getBytes();
  Files.write(Paths.get("D:\\Files\\Note\\Images\\" + outputFile), buffer);
  System.out.printf("File saved: %s\n", outputFile);
}
Ekstrak Gambar dari Dokumen OneNote menggunakan Java

Ekstrak Gambar dari Dokumen OneNote menggunakan Java

Dapatkan Lisensi Gratis

Anda bisa mendapatkan lisensi sementara gratis untuk mencoba perpustakaan tanpa batasan evaluasi.

Kesimpulan

Di artikel ini, kami telah mempelajari cara mengekstrak teks dari seluruh dokumen OneNote atau dari halaman tertentu di dokumen. Kami juga telah melihat cara mengekstrak gambar dari dokumen OneNote secara terprogram. Selain itu, Anda dapat mempelajari lebih lanjut tentang Aspose.Note for Java API menggunakan dokumentasi. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum.

Lihat juga