Trích xuất văn bản cho tệp PowerPoint bằng C ++

Bạn có thể thấy mình trong các tình huống mà bạn phải lưu văn bản của tệp PowerPoint vào cơ sở dữ liệu hoặc một số tệp. Thực hiện công việc này theo cách thủ công sẽ tốn thời gian và kém hiệu quả hơn. Cách tốt hơn là thực hiện trích xuất theo chương trình. Để kết thúc, bài viết này sẽ hướng dẫn bạn cách trích xuất văn bản từ tệp PowerPoint bằng C ++.

API C ++ để trích xuất văn bản từ tệp PowerPoint

Aspose.Slides for C ++ là một thư viện C ++ gốc giúp bạn tự động hóa các tác vụ liên quan đến PowerPoint của mình. API hỗ trợ tạo, đọc và sửa đổi các bản trình bày PowerPoint. Hơn nữa, API cũng cung cấp cho bạn khả năng trích xuất văn bản từ các tệp PowerPoint của bạn. Bạn có thể cài đặt API thông qua NuGet hoặc tải xuống trực tiếp từ phần Tải xuống.

PM> Install-Package Aspose.Slides.Cpp

Trích xuất Văn bản từ Trang chiếu PowerPoint bằng C ++

Sau đây là các bước để trích xuất văn bản từ một trang chiếu PowerPoint.

Sau đây là mã mẫu để trích xuất văn bản từ slide PowerPoint bằng C ++.

// Đường dẫn tệp mẫu
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";

// Tải tệp bản trình bày
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);

// Nhận một mảng các đối tượng ITextFrame từ trang chiếu đầu tiên
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesSlideOne = SlideUtil::GetAllTextBoxes(presentation->get_Slides()->idx_get(0));

// Vòng qua Mảng TextFrames
for (int i = 0; i < textFramesSlideOne->get_Length(); i++)
{
	// Lặp qua các đoạn trong ITextFrame hiện tại
	for (SharedPtr<IParagraph> paragraph : textFramesSlideOne[i]->get_Paragraphs())
	{
		// Lặp qua các phần trong IParagraph hiện tại
		for (SharedPtr<IPortion> portion : paragraph->get_Portions())
		{
			// Hiển thị văn bản
			Console::WriteLine(portion->get_Text());
		}
	}
}

Trích xuất văn bản từ bản trình bày PowerPoint bằng C ++

Sau đây là các bước để trích xuất văn bản từ bản trình bày PowerPoint.

Sau đây là mã mẫu để trích xuất văn bản từ bản trình bày PowerPoint bằng C ++.

// Đường dẫn tệp mẫu
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";

// Tải tệp bản trình bày
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);

// Nhận một Mảng các đối tượng ITextFrame từ tất cả các trang chiếu trong Bản trình bày
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesPresentation = SlideUtil::GetAllTextFrames(presentation, true);

// Vòng qua Mảng TextFrames
for (int i = 0; i < textFramesPresentation->get_Length(); i++)
{
	// Lặp qua các đoạn trong ITextFrame hiện tại
	for (SharedPtr<IParagraph> paragraph : textFramesPresentation[i]->get_Paragraphs())
	{
		// Lặp qua các phần trong IParagraph hiện tại
		for (SharedPtr<IPortion> portion : paragraph->get_Portions())
		{
			// Hiển thị văn bản
			Console::WriteLine(portion->get_Text());
		}
	}
}

Nhận giấy phép miễn phí

Bạn có thể yêu cầu giấy phép tạm thời miễn phí để dùng thử API mà không có giới hạn đánh giá.

Sự kết luận

Trong bài này, bạn đã học cách trích xuất văn bản từ tệp PowerPoint bằng C ++. Cụ thể, bạn đã học cách trích xuất văn bản từ một trang chiếu PowerPoint cụ thể hoặc toàn bộ bản trình bày PowerPoint. Aspose.Slides for C ++ cung cấp một loạt các tính năng bổ sung để làm việc với các bài thuyết trình. Bạn có thể khám phá API chi tiết bằng cách truy cập tài liệu chính thức. Trong trường hợp có bất kỳ câu hỏi nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí.

Xem thêm