PDF ist eines der am häufigsten verwendeten Formate zum Versenden des Dokuments an Dritte. Der Grund für diese Popularität ist die Kompatibilität von PDF über mehrere Plattformen hinweg, unabhängig von Hardware-/Softwareanforderungen. In einigen Fällen möchten Sie das PDF Dokument jedoch in ein bearbeitbares Dokument format konvertieren. PDF in das DOC oder DOCX Format könnte in solchen Fällen die bevorzugte Konvertierungsoption sein. Um den Konvertierungsprozess zu automatisieren, zeigt dieser Artikel, wie Sie PDF in Word DOC und DOCX programmgesteuert in Java konvertieren.
In diesem Artikel erfahren Sie also, wie Sie:
- Konvertieren Sie PDF in DOC mit Java.
- Konvertieren Sie PDF in das DOCX Format mit Java.
- Passen Sie die PDF zu Word-Konvertierung (DOC/DOCX) an.
Java PDF zu Word DOC Konverter bibliothek
Dank Aspose.PDF for Java – einer PDF-Manipulations-Java-API, die einfache Möglichkeiten zum Konvertieren von PDF Dateien in eine Vielzahl anderer Formate bietet, darunter PDF in DOC und PDF in DOCX. Sie können die JAR Datei der API herunterladen und Ihrem Projekt hinzufügen oder sie mit den folgenden Maven konfigurationen referenzieren:
Repository:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
Abhängigkeit:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>19.12</version>
</dependency>
Konvertieren Sie PDF in DOC in Java
Sobald Sie Aspose.PDF for Java in Ihrer Anwendung referenziert haben, können Sie jedes PDF Dokument in wenigen Codezeilen in das DOC Format konvertieren. Die folgenden Schritte sind erforderlich, um diese Konvertierung durchzuführen.
- Erstellen Sie eine Instanz der Klasse Document und initialisieren Sie sie mit dem Pfad der PDF-Eingabedatei.
- Rufen Sie die Methode Document.save() mit dem Namen der Ausgabe-DOC Datei und den Argumenten SaveFormat.Doc auf.
Das folgende Codebeispiel zeigt, wie Sie PDF in DOC in Java konvertieren.
// Quell-PDF Datei laden
Document doc = new Document("input.pdf");
// Speichern Sie die resultierende DOC Datei
doc.save("output.doc", SaveFormat.Doc);
PDF Dokument eingeben
Word Dokument ausgeben
Konvertieren Sie PDF in DOCX in Java
DOCX ist ein bekanntes Format für Word Dokumente und im Gegensatz zum DOC Format basierte die Struktur von DOCX sowohl auf den Binär- als auch auf den XML Dateien. Falls Sie PDF in das DOCX Format konvertieren möchten, können Sie dies der API mit dem Argument SaveFormat.DocX in der Methode Document.save() mitteilen.
Das folgende Codebeispiel zeigt, wie Sie PDF in DOCX in Java konvertieren.
// Quell-PDF Datei laden
Document doc = new Document("input.pdf");
// Speichern Sie die resultierende DOCX Datei
doc.save("output.docx", SaveFormat.DocX);
Java PDF to Word mit zusätzlichen Optionen
Aspose.PDF for Java bietet auch einige zusätzliche Optionen, die Sie bei der PDF zu Word-Konvertierung verwenden können, wie z. B. Ausgabeformat, Bildauflösung, Abstand zwischen Textzeilen und so weiter. Die Klasse DocSaveOptions wird zu diesem Zweck verwendet, und im Folgenden finden Sie eine Liste der Optionen, die Sie verwenden können:
- setFormat(int-Wert) - To set the output format (Doc, Docx, etc.).
- setAddReturnToLineEnd(boolescher Wert) - To add the paragraph or line breaks.
- setImageResolutionX (int-Wert) - To set the X resolution for the images.
- setImageResolutionY(int-Wert) - To set the Y resolution for the images.
- setMaxDistanceBetweenTextLines(Float-Wert) - To group text lines into paragraphs.
- setMode(int-Wert) - To set recognition mode.
- setRecognizeBullets(boolescher Wert) - To switch the recognition of bullets on.
- setRelativeHorizontalProximity(Float-Wert) - To set the width of space between different text elements in the input PDF file.
Das folgende Codebeispiel zeigt, wie die Klasse DocSaveOptions bei der PDF zu DOCX Konvertierung mit Java verwendet wird.
// Quell-PDF Datei laden
Document doc = new Document("input.pdf");
// Instanziieren Sie die DocSaveOptions-Instanz
DocSaveOptions saveOptions = new DocSaveOptions();
// Ausgabeformat einstellen
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
// Stellen Sie den Erkennungsmodus auf Flow ein
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Stellen Sie die horizontale Nähe auf 2,5 ein
saveOptions.setRelativeHorizontalProximity(2.5f);
// Aktivieren Sie die Aufzählungszeichenerkennung während des Konvertierungsprozesses
saveOptions.setRecognizeBullets(true);
// Speichern Sie die resultierende DOCX Datei
doc.save("resultant.docx", saveOptions);
Fazit
In diesem Artikel haben Sie erfahren, wie einfach es ist, PDF Dokumente in Word DOC und DOCX in Java zu konvertieren. Sie können je nach Ihren Anforderungen entweder PDF in DOC oder PDF in DOCX konvertieren. Darüber hinaus wurden zusätzliche Funktionen zum Anpassen der PDF zu Word-DOC/DOCX Konvertierung besprochen. Weitere Informationen zum Konvertieren von PDF in andere Formate finden Sie in der Dokumentation.