다양한 경우에 HTML 콘텐츠를 Word 문서로 변환해야 할 수도 있습니다. 예를 들어, WYSIWYG HTML 편집기에서 문서를 생성하거나 웹 페이지를 DOCX 또는 DOC 형식으로 변환합니다. 이 변환을 프로그래밍 방식으로 수행하기 위해 이 기사에서는 HTML 파일을 Word DOCX, DOC, DOCM 또는 Java의 기타 형식으로 변환하는 방법을 다룹니다.
HTML을 Word로 변환하는 Java 라이브러리
HTML을 DOCX, DOC, DOT, DOCM 및 기타 Word 형식으로 변환하려면 Aspose.Words for Java를 사용합니다. 프로그래밍 방식으로 Word 문서를 만들고 조작하는 강력한 라이브러리입니다. 또한 워드 프로세싱 문서에 대한 충실도 높은 변환을 제공하는 내장 문서 변환기를 제공합니다. 다운로드 섹션에서 API의 JAR을 다운로드하거나 pom.xml에서 다음 Maven 구성을 사용하여 설치할 수 있습니다.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Java에서 HTML을 DOCX/DOC/DOCM으로 변환
Java용 Aspose.Words를 사용하면 HTML 파일을 Word 형식으로 변환하는 몇 가지 단계를 수행할 수 있습니다.
- Document 클래스를 사용하여 HTML 파일을 로드합니다.
- Document.save(string, SaveFormat) 메소드를 사용하여 HTML 파일을 Word 문서로 저장합니다.
Document.save() 메서드의 SaveFormat 열거형은 HTML 파일을 변환할 형식을 지정합니다. 다음 코드 샘플은 Java의 HTML에서 Word 문서를 생성하는 방법을 보여줍니다.
// Document 클래스를 사용하여 HTML 파일 로드
Document document = new Document("template.html");
// HTML 파일을 Word DOCX 형식으로 변환
document.save("output.docx", SaveFormat.DOCX);
Java에서 URL을 사용하여 웹 페이지를 Word로 변환
웹 페이지를 URL에서 직접 Word 문서로 변환할 수도 있습니다. 다음은 Java에서 URL을 사용하여 HTML을 DOCX로 변환하는 단계입니다.
- URL 클래스의 인스턴스를 생성하고 원하는 URL로 초기화합니다.
- InputStream 객체로 URL을 엽니다.
- HtmlLoadOptions 클래스의 인스턴스를 만듭니다.
- Document 클래스의 인스턴스를 만들고 InputStream 및 HtmlLoadOptions 개체로 초기화합니다.
- Document.save(string, SaveFormat) 메서드를 사용하여 웹 페이지를 Word 문서로 저장합니다.
다음 코드 샘플은 URL을 사용하여 웹 페이지를 Word 문서로 변환하는 방법을 보여줍니다.
// URL 생성 및 초기화
URL oracleURL = new URL("https://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html");
// 웹 페이지를 입력 스트림으로 가져오기
InputStream is = oracleURL.openStream();
// HTML 로드 옵션 초기화
HtmlLoadOptions htmloptions = new HtmlLoadOptions();
// 문서 객체에 스트림 로드
Document doc = new Document(is, htmloptions);
// DOCX로 저장
doc.save("output.docx", SaveFormat.DOCX);
Java를 사용하여 HTML 문자열을 Word로 변환
Aspose.Words for Java를 사용하면 HTML 문자열에서 동적으로 Word 문서를 생성할 수도 있습니다. 다음은 이 작업을 수행하는 단계입니다.
- Document 클래스의 인스턴스를 만듭니다.
- DocumentBuilder 클래스의 인스턴스를 생성하고 Document 객체로 초기화합니다.
- DocumentBuilder.InsertHtml(string) 메서드를 사용하여 문서에 HTML을 삽입합니다.
- Document.save(string, SaveFormat) 메서드를 사용하여 Word 문서를 저장합니다.
다음 코드 샘플은 Java를 사용하여 HTML 문자열을 DOCX 파일로 변환하는 방법을 보여줍니다.
// 새 문서 만들기
Document doc = new Document();
// 문서 빌더 만들기
DocumentBuilder builder = new DocumentBuilder(doc);
// HTML 삽입
builder.insertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// DOCX로 저장
doc.save("html-string-to-word.docx", SaveFormat.DOCX);
무료 API 라이선스 받기
무료 임시 라이선스를 얻으면 평가 제한 없이 Java용 Aspose.Words를 사용할 수 있습니다.
결론
이 기사에서는 Java를 사용하여 프로그래밍 방식으로 HTML 파일을 Word DOCX, DOC, DOCM 또는 기타 형식으로 변환하는 방법을 배웠습니다. 또한 HTML 문자열이나 웹 페이지를 URL에서 Word 문서로 동적으로 변환하는 방법을 살펴보았습니다. Java용 Aspose.Words를 설치하고 제공된 코드를 사용하여 HTML을 Word로 변환하는 변환기를 빌드하기만 하면 됩니다. 또한 문서를 방문하여 Java용 Aspose.Words에 대해 자세히 알아볼 수 있습니다. 또한 포럼에서 질문을 공유할 수 있습니다.
또한보십시오
정보: PowerPoint 프레젠테이션에서 Word 문서를 가져와야 하는 경우 Aspose Presentation to Word Document 변환기를 사용할 수 있습니다.