Преобразование Word в PDF на Java

Преобразование Word в PDF обычно используется до публикации документов. Доступны различные онлайн-конвертеры Word в PDF, которые позволяют конвертировать один или ограниченное количество документов Word. Однако с появлением новых решений для автоматизации MS Word и создания отчетов автоматическое преобразование Word в PDF стало неотъемлемой частью систем. Кроме того, пакетное преобразование DOC/DOCX в PDF должно выполняться автоматически, чтобы свести к минимуму время и усилия. Следя за такими сценариями, я покажу вам, как автоматизировать процесс преобразования документов Word DOC или DOCX в PDF программным способом на Java.

Сценарии преобразования Java Word в PDF

В этой статье вы узнаете о следующих преобразованиях Word (DOC/DOCX) в PDF.

API преобразования Java Word в PDF

Для преобразования Word DOCX/DOC в PDF мы будем использовать Aspose.Words for Java, который представляет собой мощный API автоматизации Word для работы с популярными форматами обработки текста. Вы можете либо скачать Aspose.Words for Java, либо установить его в свое приложение на основе Maven, используя следующие конфигурации.

Репозиторий:

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>

Зависимость:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>20.1</version>
    <classifier>jdk17</classifier>
</dependency>

Преобразование Word DOC/DOCX в PDF на Java

Чтобы преобразовать документ Word в PDF, вам просто нужно загрузить документ Word и сохранить его с расширением «.pdf». Ниже приведены шаги для преобразования DOCX/DOC в PDF в Java.

  • Загрузите документ Word, используя класс Document.
  • Сохраните документ в формате PDF, используя метод Document.save().

В следующем примере кода показано, как преобразовать Word DOC в PDF на Java.

// Загрузите документ Word с диска
Document doc = new Document("word.docx");
// Сохранить как PDF
doc.save("output.pdf");

Документ Word

DOC DOCX в PDF на Java

PDF-документ

DOCX в PDF

Преобразование выбранных страниц Word DOC/DOCX в PDF на Java

Если вы хотите преобразовать только отдельные страницы Word в PDF, вы можете сделать это с помощью класса PdfSaveOptions. Вы можете преобразовать либо первые N страниц, либо диапазон страниц, указав индекс начальной страницы.

Ниже приведены шаги для преобразования выбранных страниц Word DOCX/DOC в PDF на Java.

  • Загрузите документ Word, используя класс Document.
  • Создайте экземпляр класса PdfSaveOptions.
  • Установите индекс начальной страницы и количество страниц для преобразования.
  • Сохраните документ Word в формате PDF, используя метод Document.save().

В следующем примере кода показано, как преобразовать выбранные страницы Word DOC/DOCX в PDF на Java.

// Загрузите документ Word с диска
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Преобразование 3 страниц, начиная с индекса 1, где 0 — индекс первой страницы. 
options.setPageIndex(1);
options.setPageCount(3);
// Сохранить Word как PDF
doc.save("output.pdf", options);

Преобразование Word DOC/DOCX в конкретный стандарт PDF на Java

Существуют различные стандарты PDF, которым может соответствовать PDF-документ, например PDF/A-1a, PDF 1.5 и т. д. Если вы хотите преобразовать документ Word в определенный стандарт PDF, вы можете указать его с помощью PdfCompliance. .

В следующем примере кода показано, как преобразовать Word DOCX в PDF с помощью определенного стандарта PDF на Java.

// Загрузите документ Word с диска
Document doc = new Document("word.docx");
// Установите для параметра PDFSaveOption значение PDF15.
PdfSaveOptions options = new PdfSaveOptions();
options.setCompliance(PdfCompliance.PDF_15);
// Преобразование Word в PDF
doc.save("output.pdf", options);

Преобразование Word в PDF со сжатием текста или изображения в Java

Вы также можете уменьшить размер результирующего документа PDF, сжав текст или изображение в документе Word. Вы можете применять следующие способы сжатия при преобразовании Word в PDF с помощью Aspose.Words for Java.

Параметры сжатия текста

Aspose.Words for Java предоставляет класс PdfTextCompression со следующими параметрами сжатия текста:

  • Нет: без сжатия текста.
  • Flate: сжатие Flate (ZIP).

Сжатие изображения

Параметры сжатия изображений доступны в классе PdfImageCompression.

  • Авто: наиболее подходящее сжатие для каждого изображения выбирается автоматически.
  • Jpeg: изображения конвертируются в формат JPEG (не поддерживает прозрачность).

В следующем примере кода показано, как преобразовать Word DOCX в PDF, применив сжатие текста и изображений в Java.

// Загрузите документ Word с диска
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Сжатие текста и изображений
options.setTextCompression(PdfTextCompression.FLATE);
options.setImageCompression(PdfImageCompression.AUTO);
// Сохранить Word как PDF
doc.save("output.pdf", options);

Преобразование Word в PDF с качеством JPEG в Java

Вы также можете настраивать и контролировать качество JPEG при преобразовании Word в PDF. PdfSaveOptions.setJpegQuality используется для установки качества JPEG, которое может быть от 0 (наихудшее качество с максимальным сжатием) до 100 (наилучшее качество с минимальным сжатием).

В следующем примере кода показано, как указать качество JPEG при преобразовании Word DOCX в PDF на Java.

// Загрузите документ Word с диска
Document doc = new Document("word.docx");
// Установить качество JPEG
PdfSaveOptions options = new PdfSaveOptions();
options.setJpegQuality(100);
// Преобразование Word в PDF
doc.save("output.pdf", options);

Попробуйте Aspose.Words для Java бесплатно

Вы можете получить бесплатную временную лицензию, чтобы попробовать использовать Aspose.Words for Java.

Вывод

В этой статье вы узнали, как преобразовать Word DOCX или DOC в PDF с помощью Java. Кроме того, вы увидели, как настроить преобразование Word в PDF в различных сценариях. Вы можете узнать больше об Aspose.Words для Java, используя документацию.

Статьи по Теме

Информация: Aspose предоставляет бесплатное онлайн-приложение, которое позволяет просматривать PDF-файлы в Интернете, другое позволяет конвертировать PDF-файлы в видео и одно позволяет редактировать PDF-файлы онлайн. ].

Информация: вас может заинтересовать другой Java API, особенно тот, который позволяет разработчикам и приложениям преобразовывать PowerPoint в PDF – Aspose.Slides for Python. И вы также можете попробовать Aspose конвертер PowerPoint в PDF, потому что это живая реализация процесса преобразования документа PowerPoint в PDF.