แปลง PDF เป็น HTML โดยใช้ C++

PDF เป็นรูปแบบเอกสารมาตรฐานที่ใช้กันอย่างแพร่หลายในการแลกเปลี่ยนเอกสารระหว่างบุคคลและองค์กรต่างๆ แม้ว่าจะเป็นที่นิยม แต่อาจไม่ใช่ตัวเลือกที่เหมาะสำหรับการแสดงเนื้อหาเสมอไป ตัวอย่างเช่น บนหน้าเว็บ HTML เป็นตัวเลือกที่ดีกว่าสำหรับประสบการณ์ผู้ใช้ที่น่าพึงพอใจยิ่งขึ้น หากคุณต้องการแสดงเนื้อหา PDF บนเว็บไซต์ การแปลงเป็น HTML อาจเป็นประโยชน์ ด้วยเหตุนี้ บทความนี้จะสอนวิธีแปลงเอกสาร PDF เป็นรูปแบบ HTML โดยใช้ C++

C ++ API สำหรับการแปลงเอกสาร PDF เป็นรูปแบบ HTML

Aspose.PDF for C++ คือไลบรารี C++ ที่ให้คุณสร้าง อ่าน และอัปเดตเอกสาร PDF นอกจากนี้ API ยังรองรับการแปลงไฟล์ PDF เป็นรูปแบบ HTML คุณสามารถติดตั้ง API ผ่าน NuGet หรือดาวน์โหลดโดยตรงจากส่วน ดาวน์โหลด

PM> Install-Package Aspose.PDF.Cpp

แปลงเอกสาร PDF เป็นรูปแบบ HTML โดยใช้ C++

การแปลงเอกสาร PDF เป็นรูปแบบ HTML เป็นเรื่องง่ายด้วย Aspose.PDF for C++ API คุณสามารถดำเนินการแปลงด้วยโค้ดเพียงสองบรรทัด หากต้องการแปลงเอกสาร PDF เป็นรูปแบบ HTML โปรดทำตามขั้นตอนด้านล่าง

โค้ดตัวอย่างต่อไปนี้แสดงวิธีการแปลงเอกสาร PDF เป็นรูปแบบ HTML โดยใช้ C++

// เปิดเอกสาร PDF ต้นทาง
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// บันทึกไฟล์ HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

ไฟล์ PDF ที่มา

ไฟล์ PDF ต้นทางที่ใช้ในโค้ดตัวอย่าง

เอาต์พุตไฟล์ HTML

ไฟล์ HTML เอาต์พุตที่สร้างโดยโค้ดตัวอย่าง

แปลงเอกสาร PDF เป็นรูปแบบ HTML ด้วยตัวเลือกเพิ่มเติมโดยใช้ C ++

Aspose.PDF for C++ API ช่วยให้คุณสามารถปรับแต่ง HTML ที่สร้างโดยกระบวนการแปลง สำหรับสิ่งนี้ API มีคลาส HtmlSaveOptions ต่อไปนี้คือตัวเลือกบางส่วนที่มีให้โดยคลาส HtmlSaveOptions

  • FontSavingMode: ใช้เพื่อตั้งค่าโหมดบันทึกแบบอักษรที่ใช้ระหว่างการแปลง enum FontSavingModes ใช้เพื่อตั้งค่า
  • RasterImagesSavingMode: ใช้เพื่อกำหนดวิธีจัดการภาพแรสเตอร์ระหว่างการแปลง enum RasterImagesSavingModes ใช้เพื่อตั้งค่า
  • LettersPositioningMethod: กำหนดตำแหน่งของตัวอักษรในคำต่างๆ LettersPositioningMethods enum ใช้เพื่อตั้งค่า
  • SpecialFolderForAllImages: ใช้เพื่อกำหนดเส้นทางที่จะบันทึกภาพ
  • SplitIntoPages: กำหนดว่าแต่ละหน้าของ PDF ควรแปลงเป็นหน้า HTML แยกต่างหาก หรือควรแปลงทั้งเอกสารเป็นไฟล์ HTML ไฟล์เดียว
  • SplitCssIntoPages: เมื่อตั้งค่า SplitIntoPages เป็นจริง SplitCssIntoPages จะตั้งค่าว่าควรบันทึก CSS เป็นไฟล์เดียวหรือเป็นไฟล์แยกต่างหากสำหรับแต่ละหน้า HTML

ต่อไปนี้เป็นขั้นตอนในการแปลงเอกสาร PDF เป็นรูปแบบ HTML พร้อมตัวเลือกเพิ่มเติม

ต่อไปนี้คือโค้ดตัวอย่าง C++ ที่สาธิตการใช้คลาส HtmlSaveOptions เพื่อปรับแต่งเอาต์พุต HTML

// เปิดเอกสาร PDF ต้นทาง
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// สร้างอินสแตนซ์ของคลาส HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// ตั้งค่าตัวเลือกที่ต้องการ
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// บันทึกไฟล์ HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

รับใบอนุญาตฟรี

คุณสามารถลองใช้ API ได้โดยไม่มีข้อจำกัดในการประเมินโดยขอ ใบอนุญาตชั่วคราวฟรี

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแปลงเอกสาร PDF เป็นรูปแบบ HTML โดยใช้ C++ นอกจากนี้ คุณได้เรียนรู้วิธีใช้ตัวเลือกเพิ่มเติมที่มีให้โดย Aspose.PDF for C++ API เพื่อปรับแต่ง HTML ที่สร้างขึ้น API มีคุณสมบัติเพิ่มเติมมากมายสำหรับการทำงานที่เกี่ยวข้องกับ PDF ของคุณโดยอัตโนมัติ คุณสามารถสำรวจ API โดยละเอียดได้โดยใช้ เอกสารอย่างเป็นทางการ หากคุณมีคำถามใดๆ โปรดติดต่อเราได้ที่ ฟอรัมสนับสนุนฟรี

ดูสิ่งนี้ด้วย