يعد PDF أحد أكثر التنسيقات استخدامًا لإرسال المستند إلى جهات خارجية. السبب وراء هذه الشعبية هو توافق PDF عبر منصات متعددة بغض النظر عن متطلبات الأجهزة / البرامج. ومع ذلك ، في بعض الحالات ، قد ترغب في تحويل مستند PDF إلى تنسيق مستند قابل للتحرير. يمكن أن يكون تنسيق PDF إلى DOC أو DOCX هو خيار التحويل ذي الأولوية في مثل هذه الحالات. من أجل أتمتة عملية التحويل ، تعرض هذه المقالة كيفية تحويل PDF إلى Word DOC و DOCX برمجيًا في Java.
لذلك في هذه المقالة ، ستتعرف على كيفية:
- قم بتحويل ملفات PDF إلى DOC باستخدام Java.
- تحويل PDF إلى تنسيق DOCX باستخدام Java.
- تخصيص تحويل PDF إلى Word (DOC / DOCX).
مكتبة محول Java PDF إلى Word DOC
بفضل Aspose.PDF for Java - واجهة برمجة تطبيقات Java لمعالجة ملفات PDF التي توفر طرقًا سهلة لتحويل ملفات PDF إلى مجموعة متنوعة من التنسيقات الأخرى بما في ذلك PDF إلى DOC و PDF إلى DOCX. يمكنك تنزيل وإضافة ملف JAR الخاص بواجهة برمجة التطبيقات إلى مشروعك أو الرجوع إليه باستخدام تكوينات Maven التالية:
مخزن:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
الاعتماد:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>19.12</version>
</dependency>
تحويل PDF إلى DOC في Java
بمجرد الإشارة إلى Aspose.PDF for Java في التطبيق الخاص بك ، يمكنك تحويل أي مستند PDF إلى تنسيق DOC في سطرين من التعليمات البرمجية. فيما يلي الخطوات المطلوبة لإجراء هذا التحويل.
- قم بإنشاء مثيل لفئة Document وتهيئته باستخدام مسار ملف PDF للإدخال.
- قم باستدعاء أسلوب Document.save() مع اسم ملف DOC الناتج و SaveFormat.Doc وسيطات.
يوضح نموذج التعليمات البرمجية التالي كيفية تحويل PDF إلى DOC في Java.
// قم بتحميل ملف PDF المصدر
Document doc = new Document("input.pdf");
// حفظ ملف DOC الناتج
doc.save("output.doc", SaveFormat.Doc);
إدخال مستند PDF
إخراج مستند Word
تحويل ملفات PDF إلى DOCX بجافا
DOCX هو تنسيق معروف لمستندات Word وعلى عكس تنسيق DOC ، استند هيكل DOCX إلى الملفات الثنائية وكذلك ملفات XML. في حالة رغبتك في تحويل PDF إلى تنسيق DOCX ، يمكنك إخبار API بالقيام بذلك باستخدام الوسيطة SaveFormat.DocX في طريقة Document.save().
يوضح نموذج التعليمات البرمجية التالي كيفية تحويل PDF إلى DOCX في Java.
// قم بتحميل ملف PDF المصدر
Document doc = new Document("input.pdf");
// حفظ ملف DOCX الناتج
doc.save("output.docx", SaveFormat.DocX);
جافا PDF إلى Word مع خيارات إضافية
يوفر Aspose.PDF for Java أيضًا بعض الخيارات الإضافية التي يمكنك استخدامها في تحويل PDF إلى Word ، مثل تنسيق الإخراج ودقة الصورة والمسافة بين سطور النص وما إلى ذلك. يتم استخدام فئة DocSaveOptions لهذا الغرض ، وفيما يلي قائمة بالخيارات التي يمكنك استخدامها:
- setFormat (قيمة int) - To set the output format (Doc, Docx, etc.).
- setAddReturnToLineEnd (قيمة منطقية) - To add the paragraph or line breaks.
- setImageResolutionX (قيمة int) - To set the X resolution for the images.
- setImageResolutionY (قيمة int) - To set the Y resolution for the images.
- setMaxDistanceBetweenTextLines (قيمة عائمة) - To group text lines into paragraphs.
- setMode (قيمة int) - To set recognition mode.
- setRecognizeBullets (قيمة منطقية) - To switch the recognition of bullets on.
- setRelativeHorizontalProximity (قيمة عائمة) - To set the width of space between different text elements in the input PDF file.
يوضح نموذج التعليمات البرمجية التالي كيفية استخدام فئة DocSaveOptions في تحويل PDF إلى DOCX باستخدام Java.
// قم بتحميل ملف PDF المصدر
Document doc = new Document("input.pdf");
// إنشاء مثيل DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// تعيين تنسيق الإخراج
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// اضبط وضع التعرف على تدفق
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// اضبط القرب الأفقي على 2.5
saveOptions.setRelativeHorizontalProximity(2.5f);
// تمكين التعرف على الرموز النقطية أثناء عملية التحويل
saveOptions.setRecognizeBullets(true);
// حفظ ملف DOCX الناتج
doc.save("resultant.docx", saveOptions);
استنتاج
في هذه المقالة ، تعلمت مدى سهولة تحويل مستندات PDF إلى Word DOC و DOCX في Java. يمكنك إما تحويل PDF إلى DOC أو PDF إلى DOCX بناءً على متطلباتك. علاوة على ذلك ، تمت أيضًا مناقشة ميزات إضافية لتخصيص PDF لتحويل Word DOC / DOCX. يمكنك معرفة المزيد حول تحويل PDF إلى تنسيقات أخرى من التوثيق.