تحويل ملفات PDF إلى HTML باستخدام C ++

PDF هو تنسيق مستند قياسي يُستخدم على نطاق واسع لتبادل المستندات بين الأفراد والمنظمات المختلفة. على الرغم من أنه شائع ، فقد لا يكون دائمًا الخيار المثالي لعرض المحتوى. على سبيل المثال ، على صفحات الويب ، يعد HTML الخيار الأفضل لتجربة مستخدم أكثر إرضاءً. إذا كنت ترغب في عرض محتوى PDF على موقع ويب ، فإن تحويله إلى HTML قد يكون مفيدًا. في ضوء ذلك ، ستعلمك هذه المقالة كيفية تحويل مستندات PDF إلى تنسيق HTML باستخدام C ++.

واجهة برمجة تطبيقات C ++ لتحويل مستندات PDF إلى تنسيق HTML

Aspose.PDF for C ++ هي مكتبة C ++ تتيح لك إنشاء مستندات PDF وقراءتها وتحديثها. علاوة على ذلك ، تدعم واجهة برمجة التطبيقات تحويل ملفات PDF إلى تنسيق HTML. يمكنك إما تثبيت API من خلال NuGet أو تنزيلها مباشرة من قسم التنزيلات.

PM> Install-Package Aspose.PDF.Cpp

قم بتحويل مستندات PDF إلى تنسيق HTML باستخدام C ++

يعد تحويل مستند PDF إلى تنسيق HTML أمرًا سهلاً باستخدام Aspose.PDF for C ++ API. يمكنك إجراء التحويل باستخدام سطرين فقط من التعليمات البرمجية. لتحويل مستند PDF إلى تنسيق HTML ، يرجى اتباع الخطوات الواردة أدناه.

يوضح نموذج التعليمات البرمجية التالي كيفية تحويل مستندات PDF إلى تنسيق HTML باستخدام C ++.

// افتح مستند PDF المصدر
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// احفظ ملف HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

مصدر ملف PDF

ملف PDF المصدر المستخدم في نموذج التعليمات البرمجية.

إخراج ملف HTML

ملف HTML الناتج الذي تم إنشاؤه بواسطة نموذج التعليمات البرمجية

قم بتحويل مستندات PDF إلى تنسيق HTML مع خيارات إضافية باستخدام C ++

يوفر لك Aspose.PDF for C ++ API القدرة على تخصيص HTML الناتج عن عملية التحويل. لهذا ، تقدم API فئة HtmlSaveOptions. فيما يلي بعض الخيارات التي توفرها فئة HtmlSaveOptions.

  • FontSavingMode: يتم استخدامه لضبط وضع حفظ الخط المستخدم أثناء التحويل. يتم استخدام تعداد FontSavingModes لتعيين قيمته.
  • RasterImagesSavingMode: يتم استخدامه لتعيين كيفية معالجة الصور النقطية أثناء التحويل. يتم استخدام تعداد RasterImagesSavingModes لتعيين قيمته.
  • LettersPositioningMethod: يضبط موضع الحروف في الكلمات. يتم استخدام تعداد LettersPositioningMethods لتعيين قيمته.
  • SpecialFolderForAllImages: يستخدم لضبط المسار حيث سيتم حفظ الصور.
  • SplitIntoPages: يحدد ما إذا كان يجب تحويل كل صفحة من صفحات PDF كصفحة HTML منفصلة أو يجب تحويل المستند بأكمله إلى ملف HTML واحد.
  • SplitCssIntoPages: عند تعيين SplitIntoPages على “صحيح” ، يحدد SplitCssIntoPages ما إذا كان يجب حفظ CSS كملف واحد أو كملف منفصل لكل صفحة HTML.

فيما يلي خطوات تحويل مستند PDF إلى تنسيق HTML بخيارات إضافية.

ما يلي هو نموذج التعليمات البرمجية لـ C ++ الذي يوضح استخدام فئة HtmlSaveOptions لتخصيص إخراج HTML.

// افتح مستند PDF المصدر
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// قم بإنشاء مثيل لفئة HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// اضبط الخيارات المطلوبة
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// احفظ ملف HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

احصل على رخصة مجانية

يمكنك تجربة واجهة برمجة التطبيقات بدون قيود تقييمية عن طريق طلب ترخيص مجاني مؤقت.

استنتاج

في هذه المقالة ، تعلمت كيفية تحويل مستندات PDF إلى تنسيق HTML باستخدام C ++. علاوة على ذلك ، تعلمت كيفية استخدام الخيارات الإضافية التي يوفرها Aspose.PDF لواجهة برمجة تطبيقات C ++ لتخصيص HTML الذي تم إنشاؤه. توفر API العديد من الميزات الإضافية لأتمتة المهام المتعلقة بـ PDF. يمكنك استكشاف API بالتفصيل باستخدام الوثائق الرسمية. إذا كان لديك أي أسئلة ، فلا تتردد في الاتصال بنا على منتدى الدعم المجاني.

أنظر أيضا