تنسيقات ملفات Microsoft Word DOC / DOCX مشهورة لأن معالج الكلمات يدعم مجموعة متنوعة من الميزات لتنظيم المعلومات وشرحها. وبالمثل ، فإن تنسيق ملف HTML مفيد لإظهار المعلومات في تطبيقات الويب. في هذه المقالة ، ستتعلم ملفات Word (DOC / DOCX) إلى تحويل HTML أو HTML5 باستخدام Java. فيما يلي حالات الاستخدام التي ستستكشفها هنا:

Java DOCX to HTML أو HTML5 Converter - التثبيت

أول الأشياء أولاً ، يمكنك بسهولة تكوين Aspose.Words لواجهة برمجة تطبيقات Java في تطبيقاتك. يمكنك تنزيل ملف JAR من [قسم الإصدارات] الجديد حيث يتم تحديث جميع واجهات برمجة التطبيقات كل شهر تقريبًا. علاوة على ذلك ، يتم استضافة جميع واجهات برمجة تطبيقات Java ، التي تقدمها Aspose ، على مستودع Maven. وبالمثل ، يمكن تعريف تبعية Aspose.Words for Java في مشروع Maven الخاص بك بالتكوينات التالية:

مخزن:

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.com/repo/</url>
    </repository>
</repositories>

الاعتماد:

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>jdk17</classifier>
    </dependency>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words</artifactId>
        <version>20.6</version>
        <classifier>javadoc</classifier>
    </dependency>
</dependencies>

الآن نحن جاهزون لتحويل DOCX إلى HTML في تطبيق Java.

تحويل Word (DOC / DOCX) إلى HTML باستخدام Java

يمكنك تحويل Word إلى HTML باتباع الخطوات التالية:

  1. قم بتحميل ملف Word المصدر بامتداد DOC أو DOCX
  2. احفظ الملف كمخرج HTML

يوضح نموذج التعليمات البرمجية أدناه كيفية تحويل DOCX إلى HTML باستخدام Java:

// قم بتحميل المستند من القرص.
Document doc = new Document(dataDir + "TestFile.docx");
// احفظ المستند في HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

معاينة ملف الإدخال DOCX

Word to HTML في Java

معاينة ملف HTML الناتج

DOCX إلى HTML بجافا

لذلك يمكنك ملاحظة الدقة العالية لعرض المستندات باستخدام لقطات الشاشة هذه. واجهة برمجة التطبيقات قادرة على تحويل النصوص والصور والجداول وغير ذلك الكثير.

تحويل DOCX إلى HTML5 باستخدام Java

HTML5 هو أحدث إصدار من HTML. لقد لاحظنا الطلبات المتكررة لدعم HTML5 في Aspose.Words API. لذلك ، يتم دعم تحويل DOCX إلى HTML5 ويمكنك تحويل الملفات باتباع الخطوات التالية:

  1. أولاً ، قم بتحميل ملف DOCX للإدخال
  2. قم بتعيين HtmlSaveOptions أثناء تعيين SaveFormat
  3. قم بتعيين قيمة التعداد لـ HtmlVersion.HTML5
  4. حفظ ملف الإخراج

يوضح مقتطف الشفرة أدناه كيفية تحويل DOCX إلى HTML5 في Java:

// قم بتحميل المستند من القرص.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);        
doc.save(dataDir + "TestFile.html", opts);

تحويل ملف Word المحمي بكلمة مرور إلى HTML باستخدام Java

أحيانًا تكون ملفات DOC أو DOCX محمية بكلمة مرور أو مشفرة باستخدام كلمة مرور. يمكنك أيضًا تحويل هذه الملفات إلى HTML. ومع ذلك ، سوف تحتاج إلى كلمة المرور أثناء تحميل ملف word. يمكنك اتباع الخطوات أدناه لتحويل DOCX إلى HTML:

  1. أولاً ، قم بتهيئة كائن من فئة LoadOptions
  2. قم بتعيين كلمة المرور
  3. قم بتحميل ملف DOCX المشفر
  4. تحويل DOCX إلى HTML

وبالمثل ، يوضح نموذج التعليمات البرمجية التالي كيفية تحويل ملف DOCX المحمي بكلمة مرور إلى HTML باستخدام Java:

LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// قم بتحميل المستند من القرص.
Document doc = new Document(dataDir + "TestFile.docx" , options); 
//احفظ المستند بتنسيق HTML.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);

تحويل Word إلى MHTML باستخدام Java

ملفات MHTML هي ملفات فردية تحتوي على محتويات ووسائط مضمنة. يمكنك تحويل ملفات الكلمات (DOC / DOCX) إلى MHTML باتباع الخطوات التالية:

  1. قم بتحميل ملف DOCX للإدخال
  2. احفظ ملف MHTML الناتج باستخدام SaveFormat.MHTML

يعتمد مقتطف الشفرة أدناه على هذه الخطوات. لذلك ، يوضح كيفية تحويل DOCX إلى MHML باستخدام Java:

// تحميل مستند Word من القرص.
Document doc = new Document(dataDir + "TestFile.docx");
// احفظ المستند في MHTML.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);

استنتاج

في الختام ، تعلمنا تحويل مستندات Word دون الحاجة إلى Microsoft Word. على سبيل المثال ، DOCX إلى HTML أو MHTML أو HTML5 وفقًا لمتطلباتك. وبالمثل ، لاحظنا من خلال لقطات الشاشة أن التحويل يتم بدقة عالية وتوافق بين تنسيقات الملفات. لذلك يمكنك تجربة API في بيئة Java الخاصة بك. ومع ذلك ، إذا واجهت أي مشكلة أثناء إعداد واجهة برمجة التطبيقات أو اختبارها ، فيمكنك الاتصال بنا عبر منتديات الدعم المجاني!

أنظر أيضا