Преобразование Word в PDF обычно используется до публикации документов. Доступны различные онлайн-конвертеры Word в PDF, которые позволяют конвертировать один или ограниченное количество документов Word. Однако с появлением новых решений для автоматизации MS Word и создания отчетов автоматическое преобразование Word в PDF стало неотъемлемой частью систем. Кроме того, пакетное преобразование DOC/DOCX в PDF должно выполняться автоматически, чтобы свести к минимуму время и усилия. Следя за такими сценариями, я покажу вам, как автоматизировать процесс преобразования документов Word DOC или DOCX в PDF программным способом на Java.
Сценарии преобразования Java Word в PDF
В этой статье вы узнаете о следующих преобразованиях Word (DOC/DOCX) в PDF.
- Преобразование Word в PDF на Java
- Преобразование выбранных страниц Word DOC/DOCX в PDF на Java
- Преобразование Word в PDF с помощью определенного стандарта PDF, такого как PDF 1.5, PDF/A-1a и т. д.
- Преобразование Word в PDF со сжатием изображения/текста в Java
- Преобразование Word в PDF с настроенным качеством JPEG для изображений в Java
API преобразования Java Word в PDF
Для преобразования Word DOCX/DOC в PDF мы будем использовать Aspose.Words for Java, который представляет собой мощный API автоматизации Word для работы с популярными форматами обработки текста. Вы можете либо скачать Aspose.Words for Java, либо установить его в свое приложение на основе Maven, используя следующие конфигурации.
Репозиторий:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Зависимость:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>20.1</version>
<classifier>jdk17</classifier>
</dependency>
Преобразование Word DOC/DOCX в PDF на Java
Чтобы преобразовать документ Word в PDF, вам просто нужно загрузить документ Word и сохранить его с расширением «.pdf». Ниже приведены шаги для преобразования DOCX/DOC в PDF в Java.
- Загрузите документ Word, используя класс Document.
- Сохраните документ в формате PDF, используя метод Document.save().
В следующем примере кода показано, как преобразовать Word DOC в PDF на Java.
// Загрузите документ Word с диска
Document doc = new Document("word.docx");
// Сохранить как PDF
doc.save("output.pdf");
Документ Word
PDF-документ
Преобразование выбранных страниц Word DOC/DOCX в PDF на Java
Если вы хотите преобразовать только отдельные страницы Word в PDF, вы можете сделать это с помощью класса PdfSaveOptions. Вы можете преобразовать либо первые N страниц, либо диапазон страниц, указав индекс начальной страницы.
Ниже приведены шаги для преобразования выбранных страниц Word DOCX/DOC в PDF на Java.
- Загрузите документ Word, используя класс Document.
- Создайте экземпляр класса PdfSaveOptions.
- Установите индекс начальной страницы и количество страниц для преобразования.
- Сохраните документ Word в формате PDF, используя метод Document.save().
В следующем примере кода показано, как преобразовать выбранные страницы Word DOC/DOCX в PDF на Java.
// Загрузите документ Word с диска
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Преобразование 3 страниц, начиная с индекса 1, где 0 — индекс первой страницы.
options.setPageIndex(1);
options.setPageCount(3);
// Сохранить Word как PDF
doc.save("output.pdf", options);
Преобразование Word DOC/DOCX в конкретный стандарт PDF на Java
Существуют различные стандарты PDF, которым может соответствовать PDF-документ, например PDF/A-1a, PDF 1.5 и т. д. Если вы хотите преобразовать документ Word в определенный стандарт PDF, вы можете указать его с помощью PdfCompliance. .
В следующем примере кода показано, как преобразовать Word DOCX в PDF с помощью определенного стандарта PDF на Java.
// Загрузите документ Word с диска
Document doc = new Document("word.docx");
// Установите для параметра PDFSaveOption значение PDF15.
PdfSaveOptions options = new PdfSaveOptions();
options.setCompliance(PdfCompliance.PDF_15);
// Преобразование Word в PDF
doc.save("output.pdf", options);
Преобразование Word в PDF со сжатием текста или изображения в Java
Вы также можете уменьшить размер результирующего документа PDF, сжав текст или изображение в документе Word. Вы можете применять следующие способы сжатия при преобразовании Word в PDF с помощью Aspose.Words for Java.
Параметры сжатия текста
Aspose.Words for Java предоставляет класс PdfTextCompression со следующими параметрами сжатия текста:
- Нет: без сжатия текста.
- Flate: сжатие Flate (ZIP).
Сжатие изображения
Параметры сжатия изображений доступны в классе PdfImageCompression.
- Авто: наиболее подходящее сжатие для каждого изображения выбирается автоматически.
- Jpeg: изображения конвертируются в формат JPEG (не поддерживает прозрачность).
В следующем примере кода показано, как преобразовать Word DOCX в PDF, применив сжатие текста и изображений в Java.
// Загрузите документ Word с диска
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Сжатие текста и изображений
options.setTextCompression(PdfTextCompression.FLATE);
options.setImageCompression(PdfImageCompression.AUTO);
// Сохранить Word как PDF
doc.save("output.pdf", options);
Преобразование Word в PDF с качеством JPEG в Java
Вы также можете настраивать и контролировать качество JPEG при преобразовании Word в PDF. PdfSaveOptions.setJpegQuality используется для установки качества JPEG, которое может быть от 0 (наихудшее качество с максимальным сжатием) до 100 (наилучшее качество с минимальным сжатием).
В следующем примере кода показано, как указать качество JPEG при преобразовании Word DOCX в PDF на Java.
// Загрузите документ Word с диска
Document doc = new Document("word.docx");
// Установить качество JPEG
PdfSaveOptions options = new PdfSaveOptions();
options.setJpegQuality(100);
// Преобразование Word в PDF
doc.save("output.pdf", options);
Попробуйте Aspose.Words для Java бесплатно
Вы можете получить бесплатную временную лицензию, чтобы попробовать использовать Aspose.Words for Java.
Вывод
В этой статье вы узнали, как преобразовать Word DOCX или DOC в PDF с помощью Java. Кроме того, вы увидели, как настроить преобразование Word в PDF в различных сценариях. Вы можете узнать больше об Aspose.Words для Java, используя документацию.
Статьи по Теме
- Преобразование Word DOC/DOCX в PDF на C#
- Преобразование PDF в Excel на C#
- Преобразование PDF в документы MS Word на Java
- Преобразование Word в Markdown в Java
- Преобразование Word в EPUB в Java
- Преобразование HTML в Word в Java
- Преобразование файлов TXT в PDF в Java
Информация: Aspose предоставляет бесплатное онлайн-приложение, которое позволяет просматривать PDF-файлы в Интернете, другое позволяет конвертировать PDF-файлы в видео и одно позволяет редактировать PDF-файлы онлайн. ].
Информация: вас может заинтересовать другой Java API, особенно тот, который позволяет разработчикам и приложениям преобразовывать PowerPoint в PDF – Aspose.Slides for Python. И вы также можете попробовать Aspose конвертер PowerPoint в PDF, потому что это живая реализация процесса преобразования документа PowerPoint в PDF.