PDF to jeden z najczęściej używanych formatów do wysyłania dokumentów stronom trzecim. Powodem tej popularności jest kompatybilność plików PDF na wielu platformach, niezależnie od wymagań sprzętowych/programowych. Jednak w niektórych przypadkach chciałbyś przekonwertować dokument PDF na edytowalny format dokumentu. Format PDF do DOC lub DOCX może być w takich przypadkach priorytetową opcją konwersji. Aby zautomatyzować proces konwersji, w tym artykule pokazano, jak programowo przekonwertować pliki PDF na Word DOC i DOCX w Javie.
Dlatego w tym artykule dowiesz się, jak:
- Konwertuj PDF na DOC za pomocą Java.
- Konwertuj pliki PDF na format DOCX za pomocą języka Java.
- Dostosuj konwersję PDF do Word (DOC/DOCX).
Biblioteka Java PDF do Word DOC Converter
Dzięki Aspose.PDF for Java — interfejsowi API języka Java do manipulacji plikami PDF, który zapewnia łatwe sposoby konwersji plików PDF do różnych innych formatów, w tym PDF do DOC i PDF do DOCX. Możesz pobrać i dodać plik JAR API do swojego projektu lub odwołać się do niego przy użyciu następujących konfiguracji Mavena:
Magazyn:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Zależność:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>19.12</version>
</dependency>
Konwertuj PDF na DOC w Javie
Po odwołaniu się do Aspose.PDF for Java w swojej aplikacji, możesz przekonwertować dowolny dokument PDF do formatu DOC w kilku liniach kodu. Poniżej przedstawiono kroki wymagane do wykonania tej konwersji.
- Utwórz instancję klasy Document i zainicjuj ją ścieżką wejściowego pliku PDF.
- Wywołaj metodę Document.save() z nazwą wyjściowego pliku DOC i argumentami SaveFormat.Doc.
Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na DOC w Javie.
// Załaduj źródłowy plik PDF
Document doc = new Document("input.pdf");
// Zapisz wynikowy plik DOC
doc.save("output.doc", SaveFormat.Doc);
Wprowadź dokument PDF
Wyjściowy dokument Word
Konwertuj PDF na DOCX w Javie
DOCX jest dobrze znanym formatem dokumentów Word iw przeciwieństwie do formatu DOC, struktura DOCX została oparta zarówno na plikach binarnych, jak i XML. Jeśli chcesz przekonwertować plik PDF na format DOCX, możesz zlecić to API za pomocą argumentu SaveFormat.DocX w metodzie Document.save().
Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na DOCX w Javie.
// Załaduj źródłowy plik PDF
Document doc = new Document("input.pdf");
// Zapisz wynikowy plik DOCX
doc.save("output.docx", SaveFormat.DocX);
Java PDF do Word z dodatkowymi opcjami
Aspose.PDF for Java zapewnia również dodatkowe opcje, których można użyć w konwersji plików PDF na Word, takie jak format wyjściowy, rozdzielczość obrazu, odległość między wierszami tekstu i tak dalej. W tym celu używana jest klasa DocSaveOptions, a poniżej znajduje się lista opcji, których możesz użyć:
- setFormat(wartość int) - To set the output format (Doc, Docx, etc.).
- setAddReturnToLineEnd(wartość logiczna) - To add the paragraph or line breaks.
- setImageResolutionX(wartość int) - To set the X resolution for the images.
- setImageResolutionY(wartość int) - To set the Y resolution for the images.
- setMaxDistanceBetweenTextLines(wartość zmiennoprzecinkowa) - To group text lines into paragraphs.
- setMode(wartość int) - To set recognition mode.
- setRecognizeBullets(wartość logiczna) - To switch the recognition of bullets on.
- setRelativeHorizontalProximity(wartość zmiennoprzecinkowa) - To set the width of space between different text elements in the input PDF file.
Poniższy przykładowy kod pokazuje, jak używać klasy DocSaveOptions w konwersji plików PDF na DOCX przy użyciu języka Java.
// Załaduj źródłowy plik PDF
Document doc = new Document("input.pdf");
// Utwórz instancję DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Ustaw format wyjściowy
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// Ustaw tryb rozpoznawania na Flow
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Ustaw odległość poziomą na 2,5
saveOptions.setRelativeHorizontalProximity(2.5f);
// Włącz rozpoznawanie punktorów podczas procesu konwersji
saveOptions.setRecognizeBullets(true);
// Zapisz wynikowy plik DOCX
doc.save("resultant.docx", saveOptions);
Wniosek
W tym artykule dowiedziałeś się, jak łatwo jest konwertować dokumenty PDF do formatu Word DOC i DOCX w Javie. Możesz przekonwertować plik PDF na DOC lub PDF na DOCX w zależności od wymagań. Ponadto omówiono również dodatkowe funkcje umożliwiające dostosowanie konwersji PDF do Word DOC/DOCX. Możesz dowiedzieć się więcej o konwersji plików PDF do innych formatów z dokumentacji.