PDF para HTML A conversão é uma função amplamente utilizada que pode ser alcançada através de diferentes meios, por exemplo, software, ferramentas e serviços online. Às vezes, você precisa converter seu conteúdo PDF de forma que possa ser exibido no navegador ou se tornar parte de seu aplicativo da web. A conversão de PDF para HTML permite atingir esse requisito onde o conteúdo do PDF é renderizado com tags HTML com estilo e formatação semelhantes. Graças ao Aspose, você pode implementar a funcionalidade agora em seu desktop ou aplicação web usando Aspose.PDF para .NET. A API permite converter seus documentos PDF em HTML usando algumas linhas de código e não apenas isso, mas também permite especificar diferentes opções de formatação e estilo durante a conversão. A seção a seguir do post o levará ao guia turístico completo sobre como usar o Aspose.PDF para .NET para converter PDF em HTML.
Conversão de PDF para HTML em .NET
Uma conversão simples de PDF para HTML pode ocorrer carregando um documento PDF e salvando-o como HTML usando HtmlSaveOptions. O exemplo a seguir mostra não apenas a conversão, mas a especificação de um requisito em que você pode salvar imagens como formato raster:
// Para exemplos completos e arquivos de dados, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// O caminho para o diretório de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat();
// Arquivo PDF de origem
Document doc = new Document(dataDir + "input.pdf");
// Crie HtmlSaveOption com recurso testado
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = true;
saveOptions.SplitIntoPages = false;
saveOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
// Salve a saída em formato HTML
doc.Save( dataDir + "SaveImages_out.html", saveOptions);
A história não termina aqui. O Aspose.PDF para .NET oferece recursos massivos e exigentes que não apenas aumentam sua usabilidade, mas também oferecem controle total sobre o processo de conversão conforme seu desejo. Você pode seguir os seguintes artigos excelentes e abrangentes na documentação da API para entender o conjunto completo de recursos neste domínio, ou seja, PDF para HTML:
- PDF para HTML - Dividir CSS em páginas
- PDF para HTML - Salvar fontes como WOFF ou TTF
- PDF para HTML - Especificar prefixo para imagem
- PDF para HTML - Definir prefixo para URLs de arquivos SVG
- PDF para HTML - Definir prefixo de URL para fontes em style.css
- PDF para HTML - Nomes de classe CSS de prefixo em style.css
- PDF para HTML - Adicionar um prefixo às diretivas de importação
- PDF para HTML - Salvar saída em um objeto de fluxo
- PDF para HTML - Detalhe do andamento da conversão
- PDF para HTML - Evite salvar imagens no formato SVG
- PDF para HTML - HTML único com todos os recursos incorporados
- PDF para HTML - Definir dimensões do arquivo de saída
- PDF para HTML - Excluir recursos de fonte
Além dos recursos acima, o Aspose.PDF for .NET 19.8 traz um novo aprimoramento onde você pode salvar PDF to HTML with full content width. Vamos dar uma olhada no uso deste novo recurso:
Conversão de PDF para HTML com largura de conteúdo total
A versão mais recente da API permite converter PDF em HTML com largura total de conteúdo, enquanto o conteúdo HTML é usado para ser alinhado à esquerda. A propriedade FlowLayoutParagraphFullWidth da classe HtmlSaveOptions permite que você faça isso conforme mostrado no exemplo de código a seguir.
// Para exemplos completos e arquivos de dados, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// O caminho para o diretório de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = (false);
saveOptions.FlowLayoutParagraphFullWidth = true;
Document doc = new Document(dataDir + "FlowLayoutParagraphFullWidth.Pdf");
doc.Save(dataDir + "FlowLayoutParagraphFullWidth_out.html", saveOptions);
Outras melhorias e correções úteis
O fator de usabilidade da API se torna mais forte com a seguinte lista de melhorias úteis que a API traz em [v19.8](https://docs.aspose.com/display/pdfnet/Aspose.PDF+for+.NET+19.8 +Release+Notes “Aspose.PDF for .NET 19.8 Release Notes”):
- A adição da funcionalidade de tabela é corrigida ainda mais
- A substituição de fontes é ainda mais aprimorada
- O consumo de memória durante a adição de HTML em PDF é ainda mais improvisado
- A conversão de PDF para imagem foi aprimorada
- A conversão de XML para PDF é ainda mais aprimorada
- A conversão de PDF para DOC/DOCX foi melhorada
- Os cenários de adição e processamento de texto foram ainda mais improvisados
Esperamos ter coberto todos os aspectos da conversão de PDF para HTML no guia acima. No entanto, caso você ainda tenha alguma dúvida, sinta-se à vontade para nos informar. Como sempre, não perca uma única atualização sobre APIs Aspose. Voltaremos em breve com uma nova revisão da API com recursos interessantes.