Java를 사용하여 OneNote 문서에서 텍스트 또는 이미지 추출

OneNote 문서에서 텍스트, 그림, 화면 캡처 및 오디오 해설 형식의 메모를 수집하고 구성할 수 있습니다. Java 응용 프로그램에서 프로그래밍 방식으로 OneNote 문서에서 텍스트나 이미지를 추출해야 하는 경우가 있습니다. 이러한 추출을 통해 추출된 텍스트나 이미지를 별도로 재사용할 수 있습니다. 이 기사에서는 Java를 사용하여 OneNote 문서에서 텍스트 또는 이미지를 추출하는 방법을 배웁니다.

이 기사에서는 다음 주제를 다룹니다.

OneNote에서 텍스트 또는 이미지를 추출하는 Java API

OneNote 문서에서 텍스트와 이미지를 추출하기 위해 Aspose.Note for Java API를 사용할 것입니다. MS OneNote를 사용하지 않고 프로그래밍 방식으로 OneNote 문서를 만들고, 읽고, 변환할 수 있습니다. API의 JAR을 다운로드하거나 Maven 기반 Java 애플리케이션에서 다음 pom.xml 구성을 추가하십시오.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-note</artifactId>
    <version>22.1</version>
    <classifier>jdk17</classifier>
</dependency>

Java를 사용하여 OneNote 문서에서 모든 텍스트 추출

아래 단계에 따라 OneNote 문서에서 모든 텍스트를 쉽게 추출할 수 있습니다.

  1. 먼저 Document 클래스를 사용하여 OneNote 파일을 로드합니다.
  2. 그런 다음 RichText.class을 인수로 사용하여 GetChildNodes 메서드를 호출하여 텍스트를 추출합니다.
  3. 마지막으로 추출된 텍스트를 표시합니다.

다음 코드 샘플은 Java를 사용하여 OneNote 파일에서 모든 텍스트를 추출하는 방법을 보여줍니다.

// 이 코드 예제는 OneNode 문서에서 모든 텍스트를 추출하는 방법을 보여줍니다.
// 문서를 Aspose.Note에 로드합니다.
Document oneFile = new Document("D:\\Files\\Note\\Sample1.one");

// 텍스트 검색
List<RichText> textNodes = (List<RichText>) oneFile.getChildNodes(RichText.class);

for (RichText richText : textNodes) {
  if(!richText.getText().isBlank())
    System.out.println(richText.getText().toString());
}
Java를 사용하여 OneNote 문서에서 모든 텍스트 추출

Java를 사용하여 OneNote 문서에서 모든 텍스트 추출

Java에서 OneNote 문서의 특정 페이지에서 텍스트 가져오기

다음 단계에 따라 OneNote 문서의 특정 페이지에서 텍스트를 추출할 수 있습니다.

  1. 먼저 Document 클래스를 사용하여 OneNote 파일을 로드합니다.
  2. 그런 다음 Page.class를 인수로 사용하여 GetChildNodes 메서드를 호출하여 페이지를 추출합니다.
  3. 그런 다음 페이지 목록에서 인덱스별로 특정 페이지를 가져옵니다.
  4. 그런 다음 RichText.class을 인수로 사용하여 GetChildNodes 메서드를 사용하여 페이지의 텍스트 항목 목록을 가져옵니다.
  5. 마지막으로 추출된 텍스트를 표시합니다.

다음 코드 샘플은 Java를 사용하여 OneNote 파일의 특정 페이지에서 텍스트를 추출하는 방법을 보여줍니다.

// 이 코드 예제는 OneNode 문서의 특정 페이지에서 텍스트를 추출하는 방법을 보여줍니다.
// 문서를 Aspose.Note에 로드합니다.
Document doc = new Document("D:\\Files\\Note\\Sample1.one");

// 페이지 노드 목록 가져오기
List<Page> pages = doc.getChildNodes(Page.class);

// 인덱스별로 페이지 가져오기
Page page = pages.get(0);

// 페이지의 텍스트 가져오기
List<RichText> textNodes = (List<RichText>) page.getChildNodes(RichText.class);

// 텍스트 표시
for (RichText richText : textNodes) {
  if(!richText.getText().isBlank())
    System.out.println(richText.getText().toString());
}
Extract Text from a Specific Page of OneNote Document in Java

Extract Text from a Specific Page of OneNote Document in Java

모든 페이지를 하나씩 반복하고 아래에 제공된 코드 샘플과 같이 각 페이지의 텍스트를 추출할 수 있습니다.

// 이 코드 예제는 OneNode 문서의 페이지에서 텍스트를 추출하는 방법을 보여줍니다.
// 문서를 Aspose.Note에 로드합니다.
Document doc = new Document("D:\\Files\\Note\\Sample1.one");

// 페이지 노드 목록 가져오기
List<Page> pages = doc.getChildNodes(Page.class);

for (Page p : pages) {
  System.out.println("---- Page Started Here ----");

  List<RichText> textNodes = (List<RichText>) p.getChildNodes(RichText.class);

  for (RichText richText : textNodes) {
    if(!richText.getText().isBlank())
      System.out.println(richText.getText().toString());
  }

  System.out.println("---- Page Ended Here ----");
  System.out.println();
}
Java에서 OneNote 문서의 특정 페이지에서 텍스트 가져오기

Java의 모든 페이지에서 하나씩 텍스트 가져오기

Java를 사용하여 OneNote 문서에서 이미지 추출

아래 단계에 따라 OneNote 문서에서 이미지를 추출할 수도 있습니다.

  1. 먼저 Document 클래스를 사용하여 OneNote 파일을 로드합니다.
  2. 그런 다음 Image.class를 인수로 하여 GetChildNodes 메서드를 사용하여 이미지 목록을 가져옵니다.
  3. 마지막으로 이미지 속성을 표시하고 로컬 디스크에 저장합니다.

다음 코드 샘플은 Java를 사용하여 OneNote 파일에서 이미지를 추출하는 방법을 보여줍니다.

// 이 코드 예제는 OneNode 문서에서 이미지를 추출하는 방법을 보여줍니다.
// 문서를 Aspose.Note에 로드합니다.
Document doc = new Document("D:\\Files\\Note\\Sample1.one");

// 모든 이미지 가져오기
List<Image> list = doc.getChildNodes(Image.class);
System.out.printf("Total Images: %s\n\n", list.size());

// 목록 순회
for (int i = 0; i < list.size(); i++) {
  Image image = list.get(i);

  // 이미지 속성 표시
  System.out.println("Width: " + image.getWidth());
  System.out.println("Height: " + image.getHeight());
  System.out.println("OriginalWidth: " + image.getOriginalWidth());
  System.out.println("OriginalHeight: " + image.getOriginalHeight());
  System.out.println("FileName: " + image.getFileName());
  System.out.println("LastModifiedTime: " + image.getLastModifiedTime());

  String outputFile = "ExtractImages_out" + i + "_" + image.getFileName();

  // 이미지 저장
  byte[] buffer = image.getBytes();
  Files.write(Paths.get("D:\\Files\\Note\\Images\\" + outputFile), buffer);
  System.out.printf("File saved: %s\n", outputFile);
}
Java를 사용하여 OneNote 문서에서 이미지 추출

Java를 사용하여 OneNote 문서에서 이미지 추출

무료 라이선스 받기

평가 제한 없이 라이브러리를 사용해 보려면 무료 임시 라이센스를 얻으십시오.

결론

이 문서에서는 전체 OneNote 문서 또는 문서의 특정 페이지에서 텍스트를 추출하는 방법을 배웠습니다. 프로그래밍 방식으로 OneNote 문서에서 이미지를 추출하는 방법도 살펴보았습니다. 또한 문서를 사용하여 Aspose.Note for Java API에 대해 자세히 알아볼 수 있습니다. 모호한 부분이 있는 경우 포럼을 통해 언제든지 문의해 주십시오.

또한보십시오