Bạn có thể thấy mình trong các tình huống mà bạn phải lưu văn bản của tệp PowerPoint vào cơ sở dữ liệu hoặc một số tệp. Thực hiện công việc này theo cách thủ công sẽ tốn thời gian và kém hiệu quả hơn. Cách tốt hơn là thực hiện trích xuất theo chương trình. Để kết thúc, bài viết này sẽ hướng dẫn bạn cách trích xuất văn bản từ tệp PowerPoint bằng C ++.
- API C ++ để trích xuất văn bản từ tệp PowerPoint
- Trích xuất Văn bản từ Trang chiếu PowerPoint bằng C ++
- Trích xuất văn bản từ bản trình bày PowerPoint bằng C ++
- Nhận giấy phép miễn phí
API C ++ để trích xuất văn bản từ tệp PowerPoint
Aspose.Slides for C ++ là một thư viện C ++ gốc giúp bạn tự động hóa các tác vụ liên quan đến PowerPoint của mình. API hỗ trợ tạo, đọc và sửa đổi các bản trình bày PowerPoint. Hơn nữa, API cũng cung cấp cho bạn khả năng trích xuất văn bản từ các tệp PowerPoint của bạn. Bạn có thể cài đặt API thông qua NuGet hoặc tải xuống trực tiếp từ phần Tải xuống.
PM> Install-Package Aspose.Slides.Cpp
Trích xuất Văn bản từ Trang chiếu PowerPoint bằng C ++
Sau đây là các bước để trích xuất văn bản từ một trang chiếu PowerPoint.
- Đầu tiên, tải bản trình bày PowerPoint bằng lớp Trình bày.
- Lấy các khung văn bản từ trang chiếu bằng SlideUtil :: GetAllTextBoxes (System :: SharedPtr slide) phương pháp.
- Lặp qua các khung văn bản.
- Trong vòng lặp, truy cập các đoạn bằng phương thức ITextFrame-> getParagraphs().
- Lặp qua các đoạn và truy cập các phần bằng phương thức IParagraph-> getPortions().
- Lấy văn bản từ từng phần bằng phương thức IPortion-> getText().
Sau đây là mã mẫu để trích xuất văn bản từ slide PowerPoint bằng C ++.
// Đường dẫn tệp mẫu
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";
// Tải tệp bản trình bày
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);
// Nhận một mảng các đối tượng ITextFrame từ trang chiếu đầu tiên
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesSlideOne = SlideUtil::GetAllTextBoxes(presentation->get_Slides()->idx_get(0));
// Vòng qua Mảng TextFrames
for (int i = 0; i < textFramesSlideOne->get_Length(); i++)
{
// Lặp qua các đoạn trong ITextFrame hiện tại
for (SharedPtr<IParagraph> paragraph : textFramesSlideOne[i]->get_Paragraphs())
{
// Lặp qua các phần trong IParagraph hiện tại
for (SharedPtr<IPortion> portion : paragraph->get_Portions())
{
// Hiển thị văn bản
Console::WriteLine(portion->get_Text());
}
}
}
Trích xuất văn bản từ bản trình bày PowerPoint bằng C ++
Sau đây là các bước để trích xuất văn bản từ bản trình bày PowerPoint.
- Đầu tiên, tải bản trình bày PowerPoint bằng lớp Trình bày.
- Lấy các khung văn bản từ toàn bộ bản trình bày bằng SlideUtil :: GetAllTextFrames (System :: SharedPtr phương pháp pres, bool withMasters).
- Lặp qua các khung văn bản.
- Trong vòng lặp, truy cập các đoạn bằng phương thức ITextFrame-> getParagraphs().
- Lặp qua các đoạn và truy cập các phần bằng phương thức IParagraph-> getPortions().
- Lấy văn bản từ từng phần bằng phương thức IPortion-> getText().
Sau đây là mã mẫu để trích xuất văn bản từ bản trình bày PowerPoint bằng C ++.
// Đường dẫn tệp mẫu
const String sourceFilePath = u"SourceDirectory\\SamplePresentation.pptx";
// Tải tệp bản trình bày
SharedPtr<Presentation> presentation = MakeObject<Presentation>(sourceFilePath);
// Nhận một Mảng các đối tượng ITextFrame từ tất cả các trang chiếu trong Bản trình bày
System::ArrayPtr<SharedPtr<ITextFrame>> textFramesPresentation = SlideUtil::GetAllTextFrames(presentation, true);
// Vòng qua Mảng TextFrames
for (int i = 0; i < textFramesPresentation->get_Length(); i++)
{
// Lặp qua các đoạn trong ITextFrame hiện tại
for (SharedPtr<IParagraph> paragraph : textFramesPresentation[i]->get_Paragraphs())
{
// Lặp qua các phần trong IParagraph hiện tại
for (SharedPtr<IPortion> portion : paragraph->get_Portions())
{
// Hiển thị văn bản
Console::WriteLine(portion->get_Text());
}
}
}
Nhận giấy phép miễn phí
Bạn có thể yêu cầu giấy phép tạm thời miễn phí để dùng thử API mà không có giới hạn đánh giá.
Sự kết luận
Trong bài này, bạn đã học cách trích xuất văn bản từ tệp PowerPoint bằng C ++. Cụ thể, bạn đã học cách trích xuất văn bản từ một trang chiếu PowerPoint cụ thể hoặc toàn bộ bản trình bày PowerPoint. Aspose.Slides for C ++ cung cấp một loạt các tính năng bổ sung để làm việc với các bài thuyết trình. Bạn có thể khám phá API chi tiết bằng cách truy cập tài liệu chính thức. Trong trường hợp có bất kỳ câu hỏi nào, vui lòng liên hệ với chúng tôi trên diễn đàn hỗ trợ miễn phí.