У цій статті ви дізнаєтесь про найпростіший, але високоякісний і швидкісний метод конвертації файлів PDF у формат Word у Java. Виконуйте безкоштовне перетворення PDF у Word із програм Java без будь-яких обмежень.
PDF є одним із найпоширеніших форматів для надсилання документів третім особам. Причиною такої популярності є сумісність PDF-файлів на багатьох платформах незалежно від будь-яких вимог до апаратного чи програмного забезпечення. Однак у деяких випадках вам потрібно перетворити PDF-документ у формат документа, який можна редагувати.
Отже, у цій статті ви дізнаєтеся, як:
- Бібліотека конвертера Java PDF у Word DOC
- Перетворіть PDF у DOC за допомогою Java
- Перетворіть PDF у формат DOCX за допомогою Java
- Налаштуйте перетворення PDF у Word (DOC/DOCX).
Конвертер Java PDF в Word DOC
Завдяки Aspose.PDF for Java — Java API для роботи з PDF-файлами, який забезпечує прості способи конвертації PDF-файлів у низку інших форматів, зокрема PDF у DOC і PDF у DOCX. Ви можете завантажити і додати JAR-файл API до свого проекту або посилатися на нього за допомогою таких конфігурацій Maven:
Репозиторій:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Залежність:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>22.11</version>
</dependency>
Як конвертувати PDF у DOC на Java
Після того, як ви посилаєтеся на Aspose.PDF for Java у своїй програмі, ви можете конвертувати будь-який документ PDF у формат DOC за допомогою кількох рядків коду. Нижче наведено кроки, необхідні для виконання цього перетворення.
- Створіть екземпляр класу Document та ініціалізуйте його шляхом до вхідного файлу PDF.
- Викличте метод Document.save() із назвою вихідного файлу DOC та аргументами SaveFormat.Doc.
У наведеному нижче прикладі коду показано, як конвертувати PDF у DOC у Java.
// Завантажити вихідний файл PDF
Document doc = new Document("input.pdf");
// Збережіть отриманий файл DOC
doc.save("output.doc", SaveFormat.Doc);
Вхідний документ PDF
Вихідний документ Word
Збережіть PDF як Word DOCX у Java
DOCX є добре відомим форматом для документів Word і, на відміну від формату DOC, структура DOCX базується на двійкових і XML-файлах. Якщо ви хочете перетворити PDF у формат DOCX, ви можете наказати API зробити це за допомогою аргументу SaveFormat.DocX у методі Document.save().
У наведеному нижче прикладі коду показано, як конвертувати PDF у DOCX у Java.
// Завантажити вихідний файл PDF
Document doc = new Document("input.pdf");
// Збережіть отриманий файл DOCX
doc.save("output.docx", SaveFormat.DocX);
Експортувати PDF у Word у Java – додаткові параметри
Aspose.PDF for Java також надає деякі додаткові параметри, які можна використовувати під час перетворення PDF у Word, як-от вихідний формат, роздільна здатність зображення, відстань між рядками тексту тощо. Для цієї мети використовується клас DocSaveOptions, і нижче наведено список параметрів, які можна використовувати:
- setFormat(значення int) - To set the output format (Doc, Docx, etc.).
- setAddReturnToLineEnd(логічне значення) - To add the paragraph or line breaks.
- setImageResolutionX(значення int) - To set the X resolution for the images.
- setImageResolutionY(значення int) - To set the Y resolution for the images.
- setMaxDistanceBetweenTextLines(плаваюче значення) - To group text lines into paragraphs.
- setMode(значення int) - To set recognition mode.
- setRecognizeBullets(логічне значення) - To switch the recognition of bullets on.
- setRelativeHorizontalProximity(плаваюче значення) - To set the width of space between different text elements in the input PDF file.
У наведеному нижче прикладі коду показано, як використовувати клас DocSaveOptions у конвертації PDF у DOCX за допомогою Java.
// Завантажити вихідний файл PDF
Document doc = new Document("input.pdf");
// Створення екземпляра DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Встановити вихідний формат
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// Встановіть режим розпізнавання як Flow
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Встановіть горизонтальну близькість як 2,5
saveOptions.setRelativeHorizontalProximity(2.5f);
// Увімкнути розпізнавання маркерів під час процесу перетворення
saveOptions.setRecognizeBullets(true);
// Збережіть отриманий файл DOCX
doc.save("resultant.docx", saveOptions);
Безкоштовний конвертер PDF у Word Java
Ви можете отримати безкоштовну тимчасову ліцензію, щоб конвертувати PDF-файли у формати Word без оціночних обмежень.
Конвертер PDF у Word – докладніше
Ви можете дізнатися більше про перетворення PDF в інші формати з документації.
Підведення підсумків
У цій статті ви дізналися, як легко конвертувати файли PDF у формат Word у Java. Ви можете конвертувати PDF у DOC або PDF у DOCX відповідно до ваших вимог. Крім того, обговорювалися додаткові функції для налаштування перетворення PDF у Word.