Convert PDF to Word

이 기사에서는 PDF를 DOC로, PDF를 DOCX 형식으로 변환하는 것을 포함하여 PDF를 Word 문서로 정확하고 손쉽게 변환하는 방법을 설명하겠습니다. 이전 버전의 Microsoft Word에서는 확장자가 .doc인 바이너리 형식으로 문서를 저장했습니다. Office 2007이 출시되면서 Microsoft는 ZIP 아카이브로 결합된 XML과 바이너리 파일의 조합을 기반으로 하는 OOXML(Office Open XML)을 채택했습니다. MS Word는 이제 .docx를 문서 저장을 위한 기본 확장자로 사용합니다.

PDF에서 DOC로, PDF에서 DOCX로의 변환은 다양한 시나리오에서 필요할 수 있습니다. 예를 들어 PDF를 편집 가능하게 만들거나 PDF의 내용을 원래 서식을 유지한 Word 문서에 다시 입력하지 않으려는 경우가 있습니다. 또 다른 사용 사례는 전문 소프트웨어 없이 대량 PDF를 DOC 또는 DOCX로 변환하는 것입니다. 이러한 시나리오를 주시하면서 이 문서에서는 C#에서 프로그래밍 방식으로 다음 PDF를 Word로 변환하는 방법을 다룹니다.

  • C#에서 PDF를 DOC로 변환
  • C#에서 PDF를 DOCX로 변환
  • 추가 설정으로 PDF를 DOC로 변환

C# PDF에서 Word DOC 또는 DOCX 변환기

Aspose.PDF for .NET은 몇 줄의 코드로 .NET 응용 프로그램에서 PDF를 Word 문서로 변환할 수 있는 강력한 PDF to DOC 또는 DOCX 변환기 API를 소유하고 있습니다. API는 WinForms, ASP.NET, 웹 서비스 또는 .NET 기반 응용 프로그램에서 사용할 수 있습니다. API를 다운로드하거나 프로젝트에서 NuGet 패키지 관리자를 사용하여 설치할 수 있습니다.

C#에서 PDF를 DOC로 변환

다음은 .NET용 Aspose.PDF를 사용하여 PDF를 DOC로 변환하는 단계입니다.

  • Document 클래스를 사용하여 PDF 문서를 로드합니다.
  • Document.Save(string) 메서드를 사용하여 문서를 .doc 확장자로 저장합니다.

다음 코드 샘플은 C#을 사용하여 PDF를 Word DOC로 변환하는 방법을 보여줍니다.

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-pdf/Aspose.PDF-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// 원본 PDF 문서 열기
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// 파일을 MS 문서 형식으로 저장
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

C#에서 PDF를 DOCX로 변환

PDF에서 DOCX로 변환은 앞에서 설명한 PDF에서 DOC로의 변환과 유사합니다. API에는 문서 형식을 DOCX로 설정할 수 있는 DocSaveOptions 클래스가 있습니다. 다음은 PDF를 DOCX로 변환하는 단계입니다.

  • Document 클래스를 사용하여 PDF 문서를 로드합니다.
  • DocSaveOptions 클래스를 사용하여 출력 문서 형식을 DOCX로 설정합니다.
  • Document.Save(string) 메서드를 사용하여 문서를 .docx 확장자로 저장합니다.

다음 코드 샘플은 C#에서 PDF를 Word DOCX로 변환하는 방법을 보여줍니다.

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-pdf/Aspose.PDF-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// 원본 PDF 문서 열기
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// DocSaveOptions 개체 인스턴스화
DocSaveOptions saveOptions = new DocSaveOptions();
// 출력 형식을 DOCX로 지정
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// 문서를 docx 형식으로 저장
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

추가 옵션을 사용하여 PDF를 DOC로 변환

.NET용 Aspose.PDF는 PDF에서 DOC 또는 DOCX로의 변환을 사용자 정의하기 위한 다양한 기타 옵션을 제공합니다. DocSaveOptions 클래스는 이미지 해상도, 줄 사이의 거리 등과 같은 PDF를 DOC로 변환하는 속성을 노출합니다. 다음 코드는 C#에서 PDF를 DOC로 변환할 때 추가 속성을 설정하는 방법을 보여줍니다. .

// 전체 예제 및 데이터 파일을 보려면 https://github.com/aspose-pdf/Aspose.PDF-for-.NET으로 이동하십시오.
// 문서 디렉토리의 경로입니다.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// 원본 PDF 문서 열기
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// 저장 옵션을 사용하여 저장
// DocSaveOptions 개체 만들기
DocSaveOptions saveOptions = new DocSaveOptions();

// 인식 모드를 Flow로 설정
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// 수평 근접도를 2.5로 설정
saveOptions.RelativeHorizontalProximity = 2.5f;

// 변환 과정에서 글머리 기호를 인식하는 값 활성화
saveOptions.RecognizeBullets = true;

// 결과 DOC 파일 저장
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

결론

이 기사에서는 C#을 사용하여 PDF를 DOC로, PDF를 DOCX로 변환하는 몇 가지 간단한 방법을 배웠습니다. .NET용 Aspose.PDF의 강력한 변환 기능에 대해 더 알고 싶다면 API 문서 섹션 PDF를 다른 형식으로 변환을 참조하십시오. Aspose.PDF for .NET의 무료 사본을 다운로드하고 API 설명서에 따라 즉시 시작할 수 있습니다. 문의 사항이 있으면 Aspose.PDF 포럼에 자유롭게 게시하십시오. 귀하의 문의사항 및 문의사항에 대해 기꺼이 도와드리겠습니다.

또한보십시오