Potrebbe essere necessario convertire spesso un file PDF in HTML per incorporarlo in una pagina web. Per eseguire questa conversione a livello di codice, questo articolo illustra come convertire un file PDF in HTML utilizzando Java. Inoltre, imparerai come utilizzare opzioni aggiuntive per personalizzare la conversione da PDF a HTML.
- API Java per la conversione da PDF a HTML
- Converti file PDF in HTML
- PDF in HTML con opzioni aggiuntive
API Java per la conversione da PDF a HTML
Per convertire i file PDF in HTML, utilizzeremo Aspose.PDF per Java. È un’API di manipolazione PDF ricca di funzionalità che consente di generare, modificare e convertire file PDF. Inoltre, fornisce metodi facili da usare per convertire PDF in pagine HTML. Puoi scaricare l’API o installarla utilizzando le seguenti configurazioni Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Converti PDF in HTML in Java
Di seguito sono riportati i passaggi per convertire un file PDF in HTML utilizzando Java.
- Carica il documento PDF utilizzando la classe Document.
- Converti PDF in HTML utilizzando il metodo Document.save(“pdf-to-html.html”, SaveFormat.Html).
L’esempio di codice seguente mostra come convertire i file PDF in HTML.
// Carica il documento PDF di origine
Document pdfDocument = new Document("PDFToHTML.pdf");
// Salva il file PDF come HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);
Java PDF in HTML con opzioni aggiuntive
Aspose.PDF per Java fornisce anche opzioni aggiuntive per personalizzare la conversione da PDF a HTML. Ad esempio, puoi comprimere le immagini, dividere l’output in più pagine HTML, specificare la cartella per le immagini, ecc. Di seguito sono riportati i passaggi per specificare opzioni aggiuntive per la conversione da PDF a HTML.
- Carica il documento PDF utilizzando la classe Document.
- Crea un’istanza della classe HtmlSaveOptions.
- Imposta le opzioni desiderate come HtmlOptions.setSplitIntoPages(true) per dividere il contenuto HTML in più pagine.
- Converti PDF in HTML utilizzando il metodo Document.save(“pdf-to-html.html”, HtmlSaveOptions).
L’esempio di codice seguente mostra come personalizzare la conversione da PDF a HTML.
// Carica il documento PDF di origine
Document pdfDocument = new Document("PDFToHTML.pdf");
// Istanziare HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();
// Dividi l'output in più pagine
htmlOptions.setSplitIntoPages(true);
// Salva il file PDF come HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);
È possibile esplorare altre opzioni utilizzando i seguenti collegamenti alla documentazione.
- Evita di salvare le immagini in formato SVG
- Compressione di immagini SVG durante la conversione
- Specifica la cartella delle immagini
- Crea file successivi solo con il contenuto del corpo
- Rendering di testo trasparente
- Rendering di livelli di documenti PDF
- Escludi risorse font
Ottieni una licenza gratuita
È possibile utilizzare Aspose.PDF per Java senza limitazioni di valutazione utilizzando la licenza temporanea. Prendi il tuo ora.
Conclusione
In questo articolo hai imparato come convertire i file PDF in HTML usando Java. Inoltre, hai visto come utilizzare diverse opzioni per personalizzare la conversione da PDF a HTML. Puoi esplorare di più sull’API utilizzando la documentazione. Inoltre, puoi inviare le tue domande al nostro forum.