فرمت های فایل مایکروسافت ورد DOC/DOCX به این دلیل معروف هستند که واژه پرداز از ویژگی های مختلفی برای سازماندهی و توضیح اطلاعات پشتیبانی می کند. به همین ترتیب، فرمت فایل HTML برای نمایش اطلاعات در برنامه های کاربردی وب مفید است. در این مقاله شما با استفاده از جاوا فایل های Word (DOC/DOCX) به HTML یا HTML5 را یاد می گیرید. موارد زیر موارد استفاده ای است که در اینجا بررسی خواهید کرد:

تبدیل جاوا DOCX به HTML یا HTML5 - نصب

اول از همه، می توانید به راحتی Aspose.Words را برای Java API در برنامه های خود پیکربندی کنید. می‌توانید فایل JAR را از بخش انتشارات جدید دانلود کنید، جایی که همه APIها تقریباً هر ماه به‌روزرسانی می‌شوند. علاوه بر این، تمام API های جاوا، ارائه شده توسط Aspose، بر روی مخزن Maven میزبانی می شوند. به همین ترتیب، Aspose.Words برای وابستگی جاوا می تواند در پروژه Maven شما با تنظیمات زیر تعریف شود:

مخزن:

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.com/repo/</url>
    </repository>
</repositories>

وابستگی:

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>jdk17</classifier>
    </dependency>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>javadoc</classifier>
    </dependency>
</dependencies>

اکنون همه ما برای تبدیل DOCX به HTML در یک برنامه جاوا آماده ایم.

تبدیل Word (DOC/DOCX) به HTML با استفاده از جاوا

با انجام مراحل زیر می توانید Word را به HTML تبدیل کنید:

  1. فایل ورد منبع را با پسوند DOC یا DOCX بارگیری کنید
  2. فایل را به عنوان خروجی HTML ذخیره کنید

نمونه کد زیر نحوه تبدیل DOCX به HTML با استفاده از جاوا را نشان می دهد:

// سند را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "TestFile.docx");
// سند را در HTML ذخیره کنید.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

پیش نمایش فایل DOCX را وارد کنید

کلمه به HTML در جاوا

خروجی پیش نمایش فایل HTML

DOCX به HTML در جاوا

بنابراین می توانید با این اسکرین شات ها به وفاداری بالای رندر اسناد پی ببرید. API قادر به تبدیل متن، تصاویر، جداول و موارد دیگر است.

تبدیل DOCX به HTML5 با استفاده از جاوا

HTML5 آخرین نسخه HTML است. درخواست‌های مکرر برای پشتیبانی از HTML5 در Aspose.Words API را یادداشت کرده‌ایم. بنابراین، تبدیل DOCX به HTML5 پشتیبانی می شود و می توانید فایل ها را با مراحل زیر تبدیل کنید:

  1. ابتدا فایل DOCX ورودی را بارگیری کنید
  2. هنگام تنظیم SaveFormat، HtmlSaveOptions را تنظیم کنید
  3. مقدار شمارش HtmlVersion.HTML5 را تنظیم کنید
  4. ذخیره فایل خروجی

قطعه کد زیر نحوه تبدیل DOCX به HTML5 در جاوا را نشان می دهد:

// سند را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);        
doc.save(dataDir + "TestFile.html", opts);

با استفاده از جاوا فایل Word محافظت شده با رمز عبور را به HTML تبدیل کنید

فایل‌های DOC یا DOCX گاهی اوقات با رمز محافظت می‌شوند یا با استفاده از رمز عبور رمزگذاری می‌شوند. شما همچنین می توانید چنین فایل هایی را به HTML تبدیل کنید. با این حال، هنگام بارگذاری فایل word به رمز عبور نیاز خواهید داشت. برای تبدیل DOCX به HTML می توانید مراحل زیر را دنبال کنید:

  1. ابتدا یک شی از کلاس LoadOptions را مقداردهی اولیه کنید
  2. رمز عبور را تنظیم کنید
  3. فایل DOCX رمزگذاری شده را بارگیری کنید
  4. DOCX را به HTML تبدیل کنید

به همین ترتیب، نمونه کد زیر نحوه تبدیل فایل DOCX محافظت شده با رمز عبور را به HTML با استفاده از جاوا نشان می دهد:

LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// سند را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "TestFile.docx" , options); 
//سند را با فرمت HTML ذخیره کنید.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);

تبدیل Word به MHTML با استفاده از جاوا

فایل های MHTML فایل های تکی هستند که حاوی محتویات و رسانه های جاسازی شده هستند. با مراحل زیر می توانید فایل های word (DOC/DOCX) را به MHTML تبدیل کنید:

  1. فایل ورودی DOCX را بارگیری کنید
  2. فایل MHTML خروجی را با استفاده از SaveFormat.MHTML ذخیره کنید

قطعه کد زیر بر اساس این مراحل است. بنابراین، نحوه تبدیل DOCX به MHML با جاوا را نشان می دهد:

// سند word را از دیسک بارگیری کنید.
Document doc = new Document(dataDir + "TestFile.docx");
// سند را در MHTML ذخیره کنید.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);

نتیجه

در پایان، ما تبدیل اسناد word را بدون نیاز به Microsoft Word یاد گرفتیم. به عنوان مثال، DOCX به HTML، MHTML، یا HTML5 بر اساس نیاز شما. به همین ترتیب، با اسکرین شات مشاهده کرده ایم که تبدیل با وفاداری بالا و سازگاری بین فرمت های فایل انجام می شود. بنابراین می توانید API را در محیط جاوا خود امتحان کنید. با این حال، اگر هنگام راه‌اندازی یا آزمایش API با مشکلی مواجه شدید، می‌توانید از طریق تالارهای پشتیبانی رایگان با ما در تماس باشید!

همچنین ببینید