Trong nhiều trường hợp, khi làm việc với tài liệu PDF, bạn cần thay đổi nó: sao chép, dán, kéo và thả nội dung PDF cụ thể như văn bản, hình ảnh, bảng biểu và sơ đồ. Bạn có thể thực hiện các tùy chọn này theo cách thủ công bên trong cùng một tệp PDF miễn là bạn muốn làm việc với các phần nhỏ của tài liệu. Nhưng nếu bạn muốn thực hiện các tùy chọn chỉnh sửa trong các tình huống phức tạp hơn, chẳng hạn như tạo chữ ký điện tử, hợp nhất nhiều tài liệu PDF hoặc xử lý lại tất cả văn bản trong tệp PDF thì sao?

Aspose.Words trả lời câu hỏi bằng một công cụ nhanh và chính xác cho phép bạn tải, chỉnh sửa và chuyển đổi PDF sang bất kỳ định dạng tệp được hỗ trợ nào, chẳng hạn như DOCX, HTML, Markdown và các định dạng khác. Bài viết này sẽ hướng dẫn bạn cách sử dụng các tùy chọn này cả về lập trình bằng C# và trực tuyến.

Các tính năng của việc tải tài liệu PDF bằng C#

Thông thường, các tệp PDF chỉ được sử dụng để xem, nhưng đôi khi bạn có thể cần chỉnh sửa hoặc thêm nội dung mới vào tài liệu PDF hiện có.

Aspose.Words cung cấp các tùy chọn bổ sung để làm việc với các tài liệu PDF như:

  • Chuyển đổi PDF sang nhiều định dạng và trích xuất dữ liệu.
  • In tài liệu PDF with a variety of printing options.
  • Mã hóa và giải mã PDF cũng như sửa đổi mật khẩu và những thứ khác.

Ngoài việc tải tài liệu PDF, bạn có thể tạo tài liệu PDF theo chương trình trong C# và quản lý nội dung PDF, chẳng hạn như:

  • Thêm, cập nhật, xóa văn bản và hình ảnh.
  • Chèn văn bản và hình ảnh vào đầu trang và chân trang.
  • Thao tác, xuất và nhập chú thích.
  • Thêm, sửa đổi và xóa dấu trang.
  • Thêm bảng, đối tượng đồ thị trong quá trình tạo PDF và các đối tượng khác.

Chuyển đổi từ PDF sang Định dạng mong muốn bằng C#

Một trong những tính năng chính của Aspose.Words là khả năng chuyển đổi tài liệu từ định dạng tệp này sang tệp khác một cách dễ dàng và đáng tin cậy. Trong Aspose.Words, chuyển đổi định dạng tài liệu PDF sang định dạng khác, chẳng hạn như DOCX, là một quá trình rất đơn giản và có thể được thực hiện với một vài dòng mã. Bạn có thể chuyển đổi PDF sang DOCX theo chương trình trong C# bằng cách thực hiện các bước chuyển đổi sau:

  1. Tải tài liệu PDF.
  2. Lưu kết quả vào định dạng tệp đích.
Note: You can apply some additional options when loading or saving a document.

Hãy mô tả quá trình chuyển đổi tài liệu PDF thành định dạng tệp DOCX trong C# bằng cách thực hiện các bước trước đó với tất cả các chi tiết lập trình cần thiết.

Tải tài liệu PDF

Hầu hết các tác vụ mà bạn muốn thực hiện với Aspose.Words sẽ yêu cầu bạn tải tài liệu như bước đầu tiên của quy trình chuyển đổi. Khi bạn tải tài liệu PDF vào Aspose.Words, nó sẽ xây dựng DOM (Mô hình đối tượng tài liệu) và tất cả các thành phần tài liệu cũng như định dạng được tải vào bộ nhớ một cách đơn giản. Sử dụng một trong các trình tạo tài liệu để tạo tài liệu trống hoặc tải tài liệu PDF của bạn. Bạn có thể tạo một tài liệu trống với bất kỳ nội dung cần thiết nào hoặc tải tài liệu của bạn từ một luồng, như được giải thích trong bài viết ‘Tạo hoặc tải tài liệu’.

Ví dụ sau đây cho thấy cách tải tài liệu PDF từ tệp trong C#:

// Load your PDF document into a Document object using one of its constructors
// and the path to your file.
Document doc = new Document(@"C:\\DocumentName.pdf");

Lưu tài liệu ở bất kỳ định dạng được hỗ trợ nào

Hầu hết các tác vụ mà bạn muốn thực hiện với Aspose.Words sẽ yêu cầu bạn lưu tài liệu ở bước cuối cùng. Aspose.Words hỗ trợ nhiều định dạng lưu hoặc xuất khác nhau được liệt kê trong bảng liệt kê SaveFormat. Sử dụng một trong các phương pháp Save để lưu kết quả vào tệp cục bộ, chẳng hạn như ở định dạng tệp DOCX.

Để đạt được điều đó theo cách lập trình trong C#, hãy gọi phương thức Document.Save trên đối tượng Tài liệu và chỉ định định dạng đầu ra mong muốn là DOCX bằng cách nhập tên tệp của bạn với phần mở rộng “.docx”:

// Save your document as a DOCX file.
doc.Save(dataDir + "DocumentName.docx");

Xin chúc mừng, bạn đã chuyển đổi thành công tệp PDF của mình sang DOCX.

Áp dụng tùy chọn bổ sung

Bạn có thể áp dụng Tùy chọn lưu PDF hoặc Tùy chọn tải PDF khác nhau và đây là một vài ví dụ, chẳng hạn như chữ ký điện tử, phạm vi trang và mật khẩu mở tài liệu. Hãy cùng tìm hiểu thêm về chúng.

Thêm và xác minh chữ ký số

Aspose.Words cho phép bạn ký tài liệu PDF bằng thuộc tính tùy chọn lưu PDF DigitalSignatureDetails. Bạn cần tải chứng chỉ kỹ thuật số lên từ đĩa hoặc từ kho lưu trữ chứng chỉ và chuyển chứng chỉ đó sang phiên bản mới của lớp X509Certificate2.

Mẫu mã sau đây cho biết cách ký tài liệu PDF trong C#:

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_LoadingAndSaving();

// Create a simple document from scratch.
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);

// Load the certificate from disk.
// The other constructor overloads can be used to load certificates from different locations.
X509Certificate2 cert = new X509Certificate2(dataDir + "signature.pfx", "signature");

// Pass the certificate and details to the save options class to sign with.
PdfSaveOptions options = new PdfSaveOptions();
options.DigitalSignatureDetails = new PdfDigitalSignatureDetails();
dataDir = dataDir + "Document.Signed_out.pdf";

// Save the document as PDF.
doc.Save(dataDir, options);

Đặt phạm vi trang

Để đặt phạm vi trang tải tài liệu PDF của bạn, bạn sẽ cần sử dụng thuộc tính PageIndex để chỉ định chỉ mục của trang bắt đầu và thuộc tính tùy chọn tải PDF PageCount để đặt tổng số các trang để tải bắt đầu từ chỉ mục được chỉ định:

var loadOptions = new PdfLoadOptions { PageIndex = 2, PageCount = 4 };  
var doc = new Document("YourDocumentName.pdf", loadOptions);

Mở tệp PDF được bảo vệ bằng mật khẩu

Bạn có thể mở tài liệu PDF được mã hóa bằng cách chỉ định trực tiếp giá trị mật khẩu trong các tùy chọn tải PDF:

var loadOptions = new PdfLoadOptions { Password = "123456" };  
var doc = new Document("YourDocumentName.pdf", loadOptions);

Trình chuyển đổi trực tuyến PDF

Nếu bạn không phải là lập trình viên, tốt hơn hết bạn nên sử dụng trình chuyển đổi PDF trực tuyến. Bước đầu tiên, tất cả những gì bạn phải làm để chuyển đổi PDF trực tuyến là trỏ trình duyệt Web của bạn đến trang sau trên Trang web Aspose tại công cụ chuyển đổi tệp.

Hãy hướng dẫn bạn qua quy trình chuyển đổi trực tuyến theo từng bước:

  1. Kéo và thả hoặc chọn tệp PDF để tải lên bằng cách nhấp vào nút “Drop or Upload your files” như minh họa trong hình bên dưới.
    Tải lên tệp PDF
  2. Chọn định dạng tệp DOCX từ danh sách thả xuống hoặc chọn một định dạng tệp khác.
  3. Nhấp vào nút “Chuyển đổi” để chuyển đổi tệp PDF của bạn như trong hình bên dưới.
    Chuyển đổi PDF của bạn
  4. Nhấp vào nút “TẢI XUỐNG NGAY” để tải xuống kết quả chuyển đổi dưới dạng tệp DOCX. Ngoài ra, bạn có thể xem kết quả chuyển đổi trên Aspose File Viewer bằng cách bấm vào nút “XEM KẾT QUẢ” như trong hình bên dưới.
    Xem Kết quả
  5. Xin chúc mừng, bạn đã thành công trong việc tải, chuyển đổi và lưu tệp PDF của mình sang DOCX bằng trình chuyển đổi tệp trực tuyến của chúng tôi.

Xem thêm

Nếu bạn muốn đạt được hướng ngược lại và tải tài liệu Word sang PDF thì bạn có thể đọc bài viết sau: Chuyển đổi tài liệu Word sang PDF theo chương trình trong C# .NET – Hướng dẫn đầy đủ.