Chuyển đổi PDF sang Word

Trong bài viết này, tôi sẽ trình bày cách chuyển đổi tài liệu PDF sang Word một cách chính xác và dễ dàng, bao gồm chuyển đổi định dạng PDF sang DOC và PDF sang DOCX. Các phiên bản trước của Microsoft Word đã lưu tài liệu ở định dạng nhị phân với phần mở rộng .doc. Với việc phát hành Office 2007, Microsoft đã sử dụng Office Open XML (OOXML) dựa trên sự kết hợp giữa tệp XML và tệp nhị phân được kết hợp với nhau thành tệp lưu trữ ZIP. MS Word hiện sử dụng .docx làm tiện ích mở rộng mặc định để lưu tài liệu.

Việc chuyển đổi PDF sang DOC và PDF sang DOCX có thể được yêu cầu trong nhiều trường hợp khác nhau. Ví dụ: bạn có thể muốn làm cho tệp PDF có thể chỉnh sửa được hoặc bạn muốn tránh nhập lại nội dung của tệp PDF vào tài liệu Word giữ nguyên định dạng ban đầu. Một trường hợp sử dụng khác có thể là chuyển đổi hàng loạt PDF sang DOC hoặc DOCX mà không cần bất kỳ phần mềm chuyên dụng nào. Theo dõi tình huống như vậy, bài viết này đề cập đến chuyển đổi PDF sang Word sau đây theo chương trình trong C#:

  • Chuyển đổi PDF sang DOC trong C#
  • Chuyển đổi PDF sang DOCX trong C#
  • Chuyển đổi PDF sang DOC với các cài đặt bổ sung

Trình chuyển đổi C# PDF sang Word DOC hoặc DOCX

Aspose.PDF for .NET sở hữu API chuyển đổi PDF sang DOC hoặc DOCX mạnh mẽ cho phép bạn chuyển đổi tài liệu PDF sang tài liệu Word trong các ứng dụng .NET của mình chỉ bằng một vài dòng mã. API có thể được sử dụng trong WinForms, ASP.NET, dịch vụ web hoặc bất kỳ ứng dụng dựa trên .NET nào. Bạn có thể tải xuống API hoặc cài đặt nó bằng Trình quản lý gói NuGet trong dự án của mình.

Chuyển đổi PDF sang DOC trong C#

Sau đây là các bước để chuyển đổi PDF sang DOC bằng Aspose.PDF for .NET.

Mẫu mã sau đây cho biết cách chuyển đổi PDF sang Word DOC bằng C#.

// Để biết các ví dụ đầy đủ và tệp dữ liệu, vui lòng truy cập https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Đường dẫn đến thư mục tài liệu.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Mở tài liệu PDF nguồn
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Lưu tệp vào định dạng tài liệu MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Chuyển đổi PDF sang DOCX trong C#

Chuyển đổi PDF sang DOCX tương tự như chuyển đổi PDF sang DOC như đã trình bày trước đó. API có lớp DocSaveOptions cho phép bạn đặt định dạng tài liệu thành DOCX. Sau đây là các bước để chuyển đổi PDF sang DOCX:

  • Tải tài liệu PDF bằng lớp Document.
  • Đặt định dạng tài liệu đầu ra là DOCX bằng lớp DocSaveOptions.
  • Lưu tài liệu với phần mở rộng .docx bằng phương thức Document.Save(string).

Mẫu mã sau đây cho biết cách chuyển đổi PDF sang Word DOCX trong C#.

// Để biết các ví dụ đầy đủ và tệp dữ liệu, vui lòng truy cập https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Đường dẫn đến thư mục tài liệu.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Mở tài liệu PDF nguồn
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Khởi tạo đối tượng DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Chỉ định định dạng đầu ra là DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Lưu tài liệu ở định dạng docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Chuyển đổi PDF sang DOC với các tùy chọn bổ sung

Aspose.PDF for .NET cung cấp nhiều tùy chọn khác để tùy chỉnh chuyển đổi PDF sang DOC hoặc DOCX. Lớp DocSaveOptions hiển thị các thuộc tính để cải thiện hoặc nâng cao quá trình chuyển đổi PDF sang DOC, chẳng hạn như độ phân giải hình ảnh, khoảng cách giữa các dòng, v.v. Đoạn mã sau cho biết cách đặt các thuộc tính bổ sung khi chuyển đổi PDF sang DOC trong C# .

// Để biết các ví dụ đầy đủ và tệp dữ liệu, vui lòng truy cập https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Đường dẫn đến thư mục tài liệu.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Mở tài liệu PDF nguồn
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Lưu bằng các tùy chọn lưu
// Tạo đối tượng DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Đặt chế độ nhận dạng là Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Đặt khoảng cách ngang là 2,5
saveOptions.RelativeHorizontalProximity = 2.5f;

// Bật giá trị để nhận dạng dấu đầu dòng trong quá trình chuyển đổi
saveOptions.RecognizeBullets = true;

// Lưu tệp DOC kết quả
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Sự kết luận

Trong bài viết này, bạn đã học được một số cách đơn giản để chuyển đổi PDF sang DOC và PDF sang DOCX bằng C#. Nếu bạn muốn biết thêm về các tính năng chuyển đổi mạnh mẽ của Aspose.PDF for .NET thì bạn có thể xem phần tài liệu API, Chuyển đổi PDF sang các định dạng khác. Tải xuống bản sao miễn phí của Aspose.PDF for .NET và bạn có thể bắt đầu ngay lập tức bằng cách làm theo tài liệu API. Nếu bạn có bất kỳ câu hỏi nào, vui lòng đăng lên Diễn đàn Aspose.PDF. Chúng tôi rất vui được hỗ trợ bạn với các câu hỏi và thắc mắc của bạn.

Xem thêm