برای جاسازی محتوای اسناد Word در برنامه های خود، ممکن است نیاز به انجام تبدیل داشته باشید. بیشترین گزینه تبدیل در چنین مواردی عبارتند از Word به HTML یا Word به Image. مطابق با آن، این مقاله نحوه تبدیل فایل های Word DOCX یا DOC را به HTML با استفاده از جاوا را پوشش می دهد. همچنین، نحوه نگهداری فایل های منبع را در یک پوشه جداگانه بحث خواهیم کرد.
- Java API برای تبدیل Word به HTML
- تبدیل یک سند Word به HTML
- پوشه منبع را در تبدیل Word به HTML مشخص کنید
Java API برای تبدیل Word به HTML
برای تبدیل DOCX/DOC به HTML، از Aspose.Words برای جاوا استفاده خواهیم کرد. این یک API قدرتمند برای پیاده سازی ویژگی های پردازش کلمه از داخل برنامه های جاوا است. علاوه بر این، API تبدیل اسناد Word را با دقت بالا به HTML و فرمتهای دیگر فراهم میکند. میتوانید API را دانلود یا از Maven نصب کنید.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.10</version>
<type>pom</type>
</dependency>
تبدیل یک سند Word به HTML در جاوا
برای تبدیل یک سند Word به HTML، فقط باید سند را بارگیری کنید و آن را به عنوان یک فایل HTML ذخیره کنید. در زیر مراحل تبدیل فایل Word DOCX به HTML با استفاده از جاوا آمده است.
- سند Word را با استفاده از کلاس Document بارگیری کنید.
- با استفاده از روش Document.save(string, SaveFormat) سند Word را به HTML تبدیل کنید.
نمونه کد زیر نحوه تبدیل یک سند Word به HTML را با استفاده از جاوا نشان می دهد.
// سند را از دیسک بارگیری کنید
Document doc = new Document("document.docx");
// سند را به صورت HTML ذخیره کنید
doc.save("Document_out.html", SaveFormat.HTML);
پوشه منبع را در تبدیل Word به HTML مشخص کنید
همچنین می توانید API را برای ذخیره فایل های منبع در یک پوشه جداگانه پیکربندی کنید. علاوه بر این، می توانید فونت ها و تصاویر را به طور جداگانه در پوشه های مختلف نگه دارید. مراحل زیر برای تعیین پوشه منبع آمده است.
- سند Word را با استفاده از کلاس Document بارگیری کنید.
- یک شی از کلاس HtmlSaveOptions ایجاد کنید.
- پوشه منبع را با استفاده از روش HtmlSaveOptions.setResourceFolder تنظیم کنید.
- با استفاده از روش Document.save(string, HtmlSaveOptions) سند Word را به HTML تبدیل کنید.
نمونه کد زیر فایل های منبع را در یک پوشه جداگانه در تبدیل Word به HTML نگه می دارد.
// بارگذاری سند
Document doc = new Document("Document.docx");
// پوشه منبع را مشخص کنید
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder("\\Resources");
// تبدیل سند Word به HTML
doc.save("ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);
میتوانید درباره کار با پوشههای منابع در تبدیل Word به HTML بیشتر بخوانید.
یک مجوز API رایگان دریافت کنید
با دریافت یک [مجوز موقت] رایگان می توانید از Aspose.Words برای جاوا بدون محدودیت ارزیابی استفاده کنید.
نتیجه
در این مقاله یاد گرفتید که چگونه با استفاده از جاوا، فایل های Word DOCX یا DOC را به صورت برنامه نویسی به HTML تبدیل کنید. علاوه بر این، نحوه ذخیره فایل های منبع را به طور جداگانه در تبدیل Word به HTML مشاهده کرده اید. علاوه بر این، میتوانید با استفاده از مستندات درباره Aspose.Words برای جاوا اطلاعات بیشتری کسب کنید. علاوه بر این، می توانید سوالات خود را در [فروم 17 ما با ما در میان بگذارید.