PDF یکی از رایجترین فرمتهای مورد استفاده برای ارسال سند به اشخاص ثالث است. دلیل این محبوبیت، سازگاری PDF در چندین پلتفرم بدون توجه به نیازهای سخت افزاری/نرم افزاری است. با این حال، در برخی موارد، شما می خواهید سند PDF را به یک قالب سند قابل ویرایش تبدیل کنید. فرمت PDF به DOC یا DOCX می تواند گزینه تبدیل اولویت در چنین مواردی باشد. به منظور خودکار کردن فرآیند تبدیل، این مقاله نحوه تبدیل PDF به Word DOC و DOCX را به صورت برنامهنویسی در جاوا نشان میدهد.
بنابراین در این مقاله با روش های زیر آشنا خواهید شد:
- تبدیل PDF به DOC با استفاده از جاوا.
- تبدیل PDF به فرمت DOCX با استفاده از جاوا.
- تبدیل PDF به Word (DOC/DOCX) را سفارشی کنید.
کتابخانه مبدل جاوا PDF به Word DOC
با تشکر از Aspose.PDF for Java - یک API جاوا دستکاری PDF که راه های آسانی برای تبدیل فایل های PDF به انواع فرمت های دیگر از جمله PDF به DOC و PDF به DOCX ارائه می دهد. میتوانید 3 را دانلود کنید و فایل JAR API را به پروژه خود اضافه کنید یا با استفاده از تنظیمات Maven زیر به آن ارجاع دهید:
مخزن:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
وابستگی:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>19.12</version>
</dependency>
تبدیل PDF به DOC در جاوا
هنگامی که در برنامه خود به Aspose.PDF برای جاوا اشاره کردید، می توانید هر سند PDF را در چند خط کد به فرمت DOC تبدیل کنید. مراحل زیر برای انجام این تبدیل لازم است.
- یک نمونه از کلاس Document ایجاد کنید و آن را با مسیر فایل PDF ورودی مقداردهی کنید.
- متد Document.save() را با نام فایل DOC خروجی و آرگومانهای SaveFormat.Doc فراخوانی کنید.
نمونه کد زیر نحوه تبدیل PDF به DOC در جاوا را نشان می دهد.
// فایل PDF منبع را بارگیری کنید
Document doc = new Document("input.pdf");
// فایل DOC حاصل را ذخیره کنید
doc.save("output.doc", SaveFormat.Doc);
سند PDF را وارد کنید
خروجی سند Word
تبدیل PDF به DOCX در جاوا
DOCX یک فرمت شناخته شده برای اسناد Word است و بر خلاف فرمت DOC، ساختار DOCX بر اساس فایل های باینری و همچنین XML است. در صورتی که می خواهید PDF را به فرمت DOCX تبدیل کنید، می توانید به API بگویید که این کار را با استفاده از آرگومان SaveFormat.DocX در متد Document.save() انجام دهد.
نمونه کد زیر نحوه تبدیل PDF به DOCX در جاوا را نشان می دهد.
// فایل PDF منبع را بارگیری کنید
Document doc = new Document("input.pdf");
// فایل DOCX حاصل را ذخیره کنید
doc.save("output.docx", SaveFormat.DocX);
جاوا PDF به Word با گزینه های اضافی
Aspose.PDF برای جاوا همچنین برخی از گزینه های اضافی را ارائه می دهد که می توانید از آنها در تبدیل PDF به Word استفاده کنید، مانند فرمت خروجی، وضوح تصویر، فاصله بین خطوط متن و غیره. کلاس DocSaveOptions برای این منظور استفاده می شود و لیست گزینه هایی که می توانید استفاده کنید در زیر آمده است:
- setFormat (مقدار int) - To set the output format (Doc, Docx, etc.).
- setAddReturnToLineEnd (مقدار بولی) - To add the paragraph or line breaks.
- setImageResolutionX (مقدار int) - To set the X resolution for the images.
- setImageResolutionY (مقدار int) - To set the Y resolution for the images.
- setMaxDistanceBetweenTextLines (مقدار شناور) - To group text lines into paragraphs.
- setMode (مقدار int) - To set recognition mode.
- setRecognizeBullets (مقدار بولی) - To switch the recognition of bullets on.
- setRelativeHorizontalProximity (مقدار شناور) - To set the width of space between different text elements in the input PDF file.
نمونه کد زیر نحوه استفاده از کلاس DocSaveOptions را در تبدیل PDF به DOCX با استفاده از جاوا نشان می دهد.
// فایل PDF منبع را بارگیری کنید
Document doc = new Document("input.pdf");
// نمونه DocSaveOptions را Instantiate کنید
DocSaveOptions saveOptions = new DocSaveOptions();
// تنظیم فرمت خروجی
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// حالت تشخیص را به صورت Flow تنظیم کنید
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// مجاورت افقی را 2.5 تنظیم کنید
saveOptions.setRelativeHorizontalProximity(2.5f);
// فعال کردن شناسایی گلوله ها در طول فرآیند تبدیل
saveOptions.setRecognizeBullets(true);
// فایل DOCX حاصل را ذخیره کنید
doc.save("resultant.docx", saveOptions);
نتیجه
در این مقاله یاد گرفتید که تبدیل اسناد PDF به Word DOC و DOCX در جاوا چقدر آسان است. بر اساس نیاز خود می توانید PDF را به DOC یا PDF را به DOCX تبدیل کنید. علاوه بر این، ویژگی های اضافی برای سفارشی کردن تبدیل PDF به Word DOC/DOCX نیز مورد بحث قرار گرفته است. می توانید در مورد تبدیل PDF به فرمت های دیگر از مستندات اطلاعات بیشتری کسب کنید.