Trích xuất hình ảnh từ tài liệu word bằng C#

Hình ảnh đóng một vai trò quan trọng để minh họa các thông tin chính trong tài liệu Word. Hơn nữa, chúng làm cho tài liệu hấp dẫn hơn và cải thiện cách trình bày của nó. Là một lập trình viên, bạn có thể nhận được công việc trích xuất các hình ảnh được nhúng trong tài liệu Word DOCX hoặc DOC. Để đạt được điều đó, bài viết này trình bày cách trích xuất hình ảnh từ tài liệu Word theo cách lập trình bằng C#. Hơn nữa, bạn sẽ thấy cách lưu các hình ảnh đã trích xuất vào vị trí mong muốn.

API C# để trích xuất hình ảnh từ tài liệu Word

Để trích xuất hình ảnh từ tài liệu MS Word DOCX / DOC, chúng tôi sẽ sử dụng Aspose.Words for .NET. Nó là một API mạnh mẽ và được sử dụng rộng rãi để tạo và thao tác các tài liệu Word. Bạn có thể tải xuống DLL của API và thêm tham chiếu của nó vào ứng dụng của bạn. Ngoài ra, bạn có thể cài đặt nó trực tiếp từ NuGet bằng bảng điều khiển trình quản lý gói.

PM> Install-Package Aspose.Words

Trích xuất hình ảnh từ tài liệu Word trong C#

Trong tài liệu Word, hình ảnh được biểu diễn dưới dạng hình dạng. Do đó, để trích xuất hình ảnh, bạn sẽ phải xử lý tất cả các hình dạng trong tài liệu. Sau đây là các bước để trích xuất hình ảnh từ tài liệu Word DOCX theo chương trình trong C#.

Mẫu mã sau đây cho thấy cách trích xuất hình ảnh từ tài liệu Word trong C#.

// Tải tài liệu Word.
Document doc = new Document("Document.docx");

// Các nút hình dạng có bộ cờ "HasImage" chứa và hiển thị hình ảnh.
IEnumerable<Shape> shapes = doc.GetChildNodes(NodeType.Shape, true)
  .OfType<Shape>().Where(s => s.HasImage);
int imageIndex = 0;

// Lặp qua các hình dạng.
foreach (Shape shape in shapes)
{
  // Lưu hình ảnh.
  string imageFileName =
    $"Image_{imageIndex}{FileFormatUtil.ImageTypeToExtension(shape.ImageData.ImageType)}";
  shape.ImageData.Save(imageFileName);
  imageIndex++;
}

Dùng thử miễn phí Aspose. AdWords for .NET

Bạn có thể nhận được giấy phép tạm thời miễn phí để dùng thử Aspose.Words for .NET mà không có bất kỳ giới hạn nào. Nhận giấy phép tạm thời của bạn ngay bây giờ.

Sự kết luận

Hình ảnh đã trở thành một phần không thể thiếu trong văn bản Word, giúp nội dung trở nên hấp dẫn hơn. Do đó, Aspose. AdWords for .NET cung cấp một loạt các tính năng để thêm hoặc thao tác hình ảnh trong tài liệu Word.

Bài viết này đặc biệt đề cập đến việc trích xuất hình ảnh từ tài liệu Word. Với sự trợ giúp của mẫu mã, bạn đã học cách trích xuất từng hình ảnh trong tệp Word DOCX / DOC theo cách lập trình bằng C#. Hơn nữa, bạn đã thấy làm thế nào để lưu các hình ảnh trích xuất vào vị trí mong muốn của bạn. Bạn có thể đọc thêm về Aspose. AdWords for .NET bằng cách sử dụng tài liệu. Trong trường hợp bạn có bất kỳ câu hỏi nào, vui lòng cho chúng tôi biết qua diễn đàn của chúng tôi.

Xem thêm

Mẹo: Nếu bạn cần lấy tài liệu Word từ bản trình bày PowerPoint, bạn có thể sử dụng trình chuyển đổi Aspose Bản trình bày sang tài liệu Word.