ورد به HTML پایتون

تبدیل کلمه به HTML در موارد مختلف، مانند جاسازی محتوای سند در صفحات وب، مورد نیاز است. در این مقاله، نحوه تبدیل اسناد MS Word DOCX یا DOC به HTML با استفاده از پایتون را خواهید آموخت. علاوه بر این، شما یاد خواهید گرفت که چگونه با استفاده از گزینه های مختلف، تبدیل Word به HTML را به صورت پویا کنترل کنید.

API تبدیل ورد به HTML پایتون

برای تبدیل اسناد Word به HTML، از Aspose.Words for Python استفاده می کنیم. این یک API قدرتمند و غنی برای ایجاد و دستکاری اسناد Word است. همچنین، تبدیل اسناد Word به فرمت های دیگر را با دقت بالا فراهم می کند. Aspose.Words برای Python در PyPI موجود است و می توانید آن را با استفاده از دستور pip زیر نصب کنید.

pip install aspose-words 

تبدیل یک سند Word به HTML در پایتون

در زیر مراحل تبدیل یک سند Word به یک فایل HTML با استفاده از Python آورده شده است.

  • سند Word را با استفاده از کلاس Document بارگیری کنید.
  • یک شی از کلاس HtmlSaveOptions ایجاد کنید.
  • صادرات منابع فونت را با استفاده از ویژگی HtmlSaveOptions.exportfontresources فعال کنید.
  • با استفاده از متد ()Document.save سند Word را به HTML تبدیل کنید.

نمونه کد زیر نحوه تبدیل فایل DOCX به HTML در پایتون را نشان می دهد.

import aspose.words as aw

# سند را از دیسک بارگیری کنید
doc = aw.Document("Document.docx")

# فعال کردن صادرات فونت
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
  
# سند را به صورت HTML ذخیره کنید
doc.save("Document.html", options)

تبدیل Word به HTML را در پایتون سفارشی کنید

Aspose.Words برای Python همچنین گزینه های مختلفی را برای سفارشی کردن تبدیل Word به HTML ارائه می دهد. به عنوان مثال، می توانید اسناد را با اطلاعات رفت و برگشت تبدیل کنید، پوشه ذخیره فایل های منبع را مشخص کنید و غیره.

تبدیل یک سند Word با اطلاعات رفت و برگشت

HTML از تمام ویژگی‌های ارائه شده توسط MS Word پشتیبانی نمی‌کند، بنابراین، برای تقلید از سند Word در HTML، باید اطلاعات بیشتری را که به عنوان اطلاعات رفت و برگشت نامیده می‌شوند، ذخیره کنیم. مراحل زیر برای فعال کردن صادرات اطلاعات رفت و برگشت در تبدیل Word به HTML آمده است.

  • سند Word را با استفاده از کلاس Document بارگیری کنید.
  • یک شی از کلاس HtmlSaveOptions ایجاد کنید و ویژگی HtmlSaveOptions.exportroundtripinformation را روی true تنظیم کنید.
  • سند Word را با استفاده از روش Document.save() به HTML تبدیل کنید و نام فایل HTML و HtmlSaveOptions را به عنوان پارامتر ارسال کنید.

نمونه کد زیر نحوه صادرات اطلاعات رفت و برگشت در تبدیل Word به HTML را نشان می دهد.

import aspose.words as aw

# سند را از دیسک بارگیری کنید
doc = aw.Document("Document.docx")

# فعال کردن اطلاعات رفت و برگشت
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True 

# سند را به صورت HTML ذخیره کنید
doc.save("Document.html", saveOptions)

Word to HTML: یک پوشه برای منابع مشخص کنید

همچنین می‌توانید پوشه‌ای را مشخص کنید که می‌خواهید تمام منابع مانند تصاویر، فایل‌های CSS و فونت‌ها را در آن ذخیره کنید. برای این کار، می توانید از ویژگی HtmlSaveOptions.exportfontresources استفاده کنید. همچنین می توانید با استفاده از HtmlSaveOptions.fontsfolder و HtmlSaveOptions.imagesfolder پوشه های جداگانه ای را برای فونت ها و تصاویر مشخص کنید. در زیر مراحل استفاده از یک پوشه جداگانه برای ذخیره منابع در تبدیل Word به HTML آمده است.

  • سند Word را با استفاده از کلاس Document بارگیری کنید.
  • یک شی از کلاس HtmlSaveOptions ایجاد کنید و ویژگی HtmlSaveOptions.exportfontresources را روی true تنظیم کنید.
  • نام پوشه منبع را با استفاده از ویژگی HtmlSaveOptions.resourcefolder مشخص کنید.
  • سند Word را با استفاده از روش Document.save() به HTML تبدیل کنید و نام فایل HTML و HtmlSaveOptions را به عنوان پارامتر ارسال کنید.

نمونه کد زیر نحوه تعیین یک پوشه منبع در تبدیل Word به HTML را نشان می دهد.

import aspose.words as aw

# سند را از دیسک بارگیری کنید
doc = aw.Document("Document.docx")

# پوشه منبع را مشخص کنید
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"

# سند را به صورت HTML ذخیره کنید
doc.save("Document.html", saveOptions)

مجوز API رایگان دریافت کنید

برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، می توانید یک مجوز موقت دریافت کنید.

نتیجه

در این مقاله نحوه تبدیل اسناد Word به HTML با استفاده از پایتون را یاد گرفتید. علاوه بر این، نحوه سفارشی سازی تبدیل Word به HTML را به صورت پویا دیده اید. علاوه بر این، می‌توانید سایر ویژگی‌های Aspose.Words برای پایتون را با استفاده از مستندات کاوش کنید. همچنین، می‌توانید سؤالات خود را از طریق [تالار گفتمان11 ما بپرسید.

همچنین ببینید

اطلاعات: ممکن است به یکی دیگر از APIهای Python (Aspose.Slides for Python via NET) علاقه داشته باشید که به شما امکان می‌دهد تبدیل ارائه‌ها به تصاویر و [وارد کردن تصاویر به ارائه9.