تبدیل کلمه به HTML در موارد مختلف، مانند جاسازی محتوای سند در صفحات وب، مورد نیاز است. در این مقاله، نحوه تبدیل اسناد MS Word DOCX یا DOC به HTML با استفاده از پایتون را خواهید آموخت. علاوه بر این، شما یاد خواهید گرفت که چگونه با استفاده از گزینه های مختلف، تبدیل Word به HTML را به صورت پویا کنترل کنید.
API تبدیل ورد به HTML پایتون
برای تبدیل اسناد Word به HTML، از Aspose.Words for Python استفاده می کنیم. این یک API قدرتمند و غنی برای ایجاد و دستکاری اسناد Word است. همچنین، تبدیل اسناد Word به فرمت های دیگر را با دقت بالا فراهم می کند. Aspose.Words برای Python در PyPI موجود است و می توانید آن را با استفاده از دستور pip زیر نصب کنید.
pip install aspose-words
تبدیل یک سند Word به HTML در پایتون
در زیر مراحل تبدیل یک سند Word به یک فایل HTML با استفاده از Python آورده شده است.
- سند Word را با استفاده از کلاس Document بارگیری کنید.
- یک شی از کلاس HtmlSaveOptions ایجاد کنید.
- صادرات منابع فونت را با استفاده از ویژگی HtmlSaveOptions.exportfontresources فعال کنید.
- با استفاده از متد ()Document.save سند Word را به HTML تبدیل کنید.
نمونه کد زیر نحوه تبدیل فایل DOCX به HTML در پایتون را نشان می دهد.
import aspose.words as aw
# سند را از دیسک بارگیری کنید
doc = aw.Document("Document.docx")
# فعال کردن صادرات فونت
options = aw.saving.HtmlSaveOptions()
options.export_font_resources = True
# سند را به صورت HTML ذخیره کنید
doc.save("Document.html", options)
تبدیل Word به HTML را در پایتون سفارشی کنید
Aspose.Words برای Python همچنین گزینه های مختلفی را برای سفارشی کردن تبدیل Word به HTML ارائه می دهد. به عنوان مثال، می توانید اسناد را با اطلاعات رفت و برگشت تبدیل کنید، پوشه ذخیره فایل های منبع را مشخص کنید و غیره.
تبدیل یک سند Word با اطلاعات رفت و برگشت
HTML از تمام ویژگیهای ارائه شده توسط MS Word پشتیبانی نمیکند، بنابراین، برای تقلید از سند Word در HTML، باید اطلاعات بیشتری را که به عنوان اطلاعات رفت و برگشت نامیده میشوند، ذخیره کنیم. مراحل زیر برای فعال کردن صادرات اطلاعات رفت و برگشت در تبدیل Word به HTML آمده است.
- سند Word را با استفاده از کلاس Document بارگیری کنید.
- یک شی از کلاس HtmlSaveOptions ایجاد کنید و ویژگی HtmlSaveOptions.exportroundtripinformation را روی true تنظیم کنید.
- سند Word را با استفاده از روش Document.save() به HTML تبدیل کنید و نام فایل HTML و HtmlSaveOptions را به عنوان پارامتر ارسال کنید.
نمونه کد زیر نحوه صادرات اطلاعات رفت و برگشت در تبدیل Word به HTML را نشان می دهد.
import aspose.words as aw
# سند را از دیسک بارگیری کنید
doc = aw.Document("Document.docx")
# فعال کردن اطلاعات رفت و برگشت
saveOptions = aw.saving.HtmlSaveOptions()
saveOptions.export_roundtrip_information = True
# سند را به صورت HTML ذخیره کنید
doc.save("Document.html", saveOptions)
Word to HTML: یک پوشه برای منابع مشخص کنید
همچنین میتوانید پوشهای را مشخص کنید که میخواهید تمام منابع مانند تصاویر، فایلهای CSS و فونتها را در آن ذخیره کنید. برای این کار، می توانید از ویژگی HtmlSaveOptions.exportfontresources استفاده کنید. همچنین می توانید با استفاده از HtmlSaveOptions.fontsfolder و HtmlSaveOptions.imagesfolder پوشه های جداگانه ای را برای فونت ها و تصاویر مشخص کنید. در زیر مراحل استفاده از یک پوشه جداگانه برای ذخیره منابع در تبدیل Word به HTML آمده است.
- سند Word را با استفاده از کلاس Document بارگیری کنید.
- یک شی از کلاس HtmlSaveOptions ایجاد کنید و ویژگی HtmlSaveOptions.exportfontresources را روی true تنظیم کنید.
- نام پوشه منبع را با استفاده از ویژگی HtmlSaveOptions.resourcefolder مشخص کنید.
- سند Word را با استفاده از روش Document.save() به HTML تبدیل کنید و نام فایل HTML و HtmlSaveOptions را به عنوان پارامتر ارسال کنید.
نمونه کد زیر نحوه تعیین یک پوشه منبع در تبدیل Word به HTML را نشان می دهد.
import aspose.words as aw
# سند را از دیسک بارگیری کنید
doc = aw.Document("Document.docx")
# پوشه منبع را مشخص کنید
saveOptions.export_font_resources = True
saveOptions.resource_folder = docs_base.artifacts_dir + "Resources"
saveOptions.resource_folder_alias = "http:#example.com/resources"
# سند را به صورت HTML ذخیره کنید
doc.save("Document.html", saveOptions)
مجوز API رایگان دریافت کنید
برای استفاده از Aspose.Words برای Python بدون محدودیت ارزیابی، می توانید یک مجوز موقت دریافت کنید.
نتیجه
در این مقاله نحوه تبدیل اسناد Word به HTML با استفاده از پایتون را یاد گرفتید. علاوه بر این، نحوه سفارشی سازی تبدیل Word به HTML را به صورت پویا دیده اید. علاوه بر این، میتوانید سایر ویژگیهای Aspose.Words برای پایتون را با استفاده از مستندات کاوش کنید. همچنین، میتوانید سؤالات خود را از طریق [تالار گفتمان11 ما بپرسید.
همچنین ببینید
اطلاعات: ممکن است به یکی دیگر از APIهای Python (Aspose.Slides for Python via NET) علاقه داشته باشید که به شما امکان میدهد تبدیل ارائهها به تصاویر و [وارد کردن تصاویر به ارائه9.