Muitas vezes, você pode precisar converter um arquivo PDF em HTML para incorporá-lo em uma página da web. Para realizar essa conversão programaticamente, este artigo aborda como converter um arquivo PDF em HTML usando Java. Além disso, você aprenderá a usar opções adicionais para personalizar a conversão de PDF para HTML.
- API Java para conversão de PDF para HTML
- Converter arquivos PDF para HTML
- PDF para HTML com opções adicionais
API Java para conversão de PDF para HTML
Para converter arquivos PDF em HTML, usaremos Aspose.PDF for Java. É uma API de manipulação de PDF rica em recursos que permite gerar, modificar e converter arquivos PDF. Além disso, fornece métodos fáceis de usar para converter PDF em páginas HTML. Você pode baixar a API ou instalá-la usando as seguintes configurações do Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>21.5</version>
</dependency>
Converter PDF para HTML em Java
A seguir estão as etapas para converter um arquivo PDF em HTML usando Java.
- Carregue o documento PDF usando a classe Document.
- Converta PDF para HTML usando o método Document.save(“pdf-to-html.html”, SaveFormat.Html).
O exemplo de código a seguir mostra como converter arquivos PDF em HTML.
// Carregar o documento PDF de origem
Document pdfDocument = new Document("PDFToHTML.pdf");
// Salve o arquivo PDF como HTML
pdfDocument.save("pdf-to-html.html", SaveFormat.Html);
Java PDF para HTML com opções adicionais
O Aspose.PDF para Java também oferece opções adicionais para personalizar a conversão de PDF para HTML. Como, você pode compactar as imagens, dividir a saída em várias páginas HTML, especificar pasta para imagens, etc. A seguir estão as etapas para especificar opções adicionais para conversão de PDF para HTML.
- Carregue o documento PDF usando a classe Document.
- Crie uma instância da classe HtmlSaveOptions.
- Defina as opções desejadas, como HtmlOptions.setSplitIntoPages(true) para dividir o conteúdo HTML em várias páginas.
- Converta PDF para HTML usando o método Document.save(“pdf-to-html.html”, HtmlSaveOptions).
O exemplo de código a seguir mostra como personalizar a conversão de PDF para HTML.
// Carregar o documento PDF de origem
Document pdfDocument = new Document("PDFToHTML.pdf");
// Instanciar HTMLSaveOptions
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();
// Divida a saída em várias páginas
htmlOptions.setSplitIntoPages(true);
// Salve o arquivo PDF como HTML
pdfDocument.save("pdf-to-html.html", htmlOptions);
Você pode explorar outras opções usando os links de documentação a seguir.
- Evite salvar imagens no formato SVG
- Como compactar imagens SVG durante a conversão
- Especificar pasta de imagens
- Criar arquivos subsequentes apenas com conteúdo do corpo
- Renderização de texto transparente
- Renderização de camadas de documentos PDF
- Excluir recursos de fonte
Obtenha uma licença gratuita
Você pode usar o Aspose.PDF para Java sem limitações de avaliação usando a licença temporária. Adquira o seu agora.
Conclusão
Neste artigo, você aprendeu como converter arquivos PDF em HTML usando Java. Além disso, você viu como usar diferentes opções para personalizar a conversão de PDF para HTML. Você pode explorar mais sobre a API usando a documentação. Além disso, você pode postar suas dúvidas em nosso fórum.