Möglicherweise müssen Sie eine PDF Datei häufig in HTML konvertieren, um sie in eine Webseite einzubetten. Um diese Konvertierung programmgesteuert durchzuführen, beschreibt dieser Artikel, wie Sie eine PDF Datei mit Java in HTML konvertieren. Außerdem erfahren Sie, wie Sie zusätzliche Optionen verwenden, um die PDF zu HTML-Konvertierung anzupassen.
- Java API für die PDF zu HTML-Konvertierung
- Konvertieren Sie PDF Dateien in HTML
- PDF zu HTML mit zusätzlichen Optionen
Java API für die PDF zu HTML-Konvertierung
Um PDF Dateien in HTML zu konvertieren, verwenden wir Aspose.PDF for Java. Es ist eine funktionsreiche PDF-Manipulations-API, mit der Sie PDF Dateien generieren, ändern und konvertieren können. Darüber hinaus bietet es benutzerfreundliche Methoden zum Konvertieren von PDF- in HTML-Seiten. Sie können die API entweder herunterladen oder sie mit den folgenden Maven konfigurationen installieren.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Konvertieren Sie PDF in HTML in Java
Im Folgenden sind die Schritte zum Konvertieren einer PDF Datei in HTML mit Java aufgeführt.
- Laden Sie das PDF Dokument mit der Klasse Document.
- Konvertieren Sie PDF mit der methode Document.save(“pdf-to-html.html”, SaveFormat.Html) in HTML.
Das folgende Codebeispiel zeigt, wie PDF Dateien in HTML konvertiert werden.
// Laden Sie das Quell-PDF Dokument
Document pdfDocument = new Document("PDFToHTML.pdf");
// Speichern Sie die PDF Datei als HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);
Java PDF to HTML mit zusätzlichen Optionen
Aspose.PDF for Java bietet auch zusätzliche Optionen zum Anpassen der PDF zu HTML-Konvertierung. Sie können beispielsweise die Bilder komprimieren, die Ausgabe in mehrere HTML-Seiten aufteilen, Ordner für Bilder angeben usw. Im Folgenden finden Sie die Schritte zum Festlegen zusätzlicher Optionen für die PDF zu HTML-Konvertierung.
- Laden Sie das PDF Dokument mit der Klasse Document.
- Erstellen Sie eine Instanz der Klasse HtmlSaveOptions.
- Legen Sie die gewünschten Optionen wie HtmlOptions.setSplitIntoPages(true) fest, um den HTML-Inhalt auf mehrere Seiten aufzuteilen.
- Konvertieren Sie PDF mit der methode Document.save(“pdf-to-html.html”, HtmlSaveOptions) in HTML.
Das folgende Codebeispiel zeigt, wie die PDF zu HTML-Konvertierung angepasst wird.
// Laden Sie das Quell-PDF Dokument
Document pdfDocument = new Document("PDFToHTML.pdf");
// Instanziieren Sie HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();
// Teilen Sie die Ausgabe in mehrere Seiten auf
htmlOptions.setSplitIntoPages(true);
// Speichern Sie die PDF Datei als HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);
Über die folgenden Dokumentationslinks können Sie weitere Optionen erkunden.
- Vermeiden Sie das Speichern von Bildern im SVG-Format
- Komprimieren von SVG Bildern während der Konvertierung
- Geben Sie den Bildordner an
- Erstellen Sie nachfolgende Dateien nur mit Inhalt
- Transparente Textwiedergabe
- Rendern von PDF Dokumentebenen
- Schriftressourcen ausschließen
Holen Sie sich eine kostenlose Lizenz
Mit der temporären Lizenz können Sie Aspose.PDF for Java ohne Evaluierungseinschränkungen verwenden. Holen Sie sich jetzt.
Fazit
In diesem Artikel haben Sie gelernt, wie Sie PDF Dateien mit Java in HTML konvertieren. Außerdem haben Sie gesehen, wie Sie verschiedene Optionen zum Anpassen der PDF zu HTML-Konvertierung verwenden können. Weitere Informationen zur API finden Sie in der Dokumentation. Darüber hinaus können Sie Ihre Fragen in unserem Forum posten.