Converter PDF para HTML usando C++

PDF é um formato de documento padrão amplamente usado para troca de documentos entre indivíduos e diferentes organizações. Mesmo sendo popular, nem sempre pode ser a escolha ideal para exibir conteúdo. Por exemplo, em páginas da web, HTML é a melhor escolha para uma experiência de usuário mais satisfatória. Se você deseja exibir o conteúdo PDF em um site, convertê-lo em HTML pode ser útil. À luz disso, este artigo ensinará como converter documentos PDF para o formato HTML usando C++.

API C++ para converter documentos PDF para formato HTML

Aspose.PDF for C++ é uma biblioteca C++ que permite criar, ler e atualizar documentos PDF. Além disso, a API suporta a conversão de arquivos PDF para o formato HTML. Você pode instalar a API por meio do NuGet ou baixá-la diretamente da seção downloads.

PM> Install-Package Aspose.PDF.Cpp

Converter documentos PDF para o formato HTML usando C++

Converter um documento PDF para o formato HTML é muito fácil com a API Aspose.PDF para C++. Você pode realizar a conversão com apenas duas linhas de código. Para converter um documento PDF para o formato HTML, siga as etapas abaixo.

O código de exemplo a seguir mostra como converter documentos PDF para o formato HTML usando C++.

// Abra o documento PDF de origem
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Salve o arquivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);

Arquivo PDF de origem

Arquivo PDF de origem usado no código de exemplo.

Arquivo HTML de saída

Arquivo HTML de saída gerado pelo código de amostra

Converta documentos PDF para o formato HTML com opções adicionais usando C++

A API Aspose.PDF para C++ fornece a capacidade de personalizar o HTML gerado pelo processo de conversão. Para isso, a API oferece a classe HtmlSaveOptions. A seguir estão algumas das opções fornecidas pela classe HtmlSaveOptions.

A seguir estão as etapas para converter um documento PDF para o formato HTML com opções adicionais.

Veja a seguir o código de exemplo C++ que demonstra o uso da classe HtmlSaveOptions para personalizar a saída HTML.

// Abra o documento PDF de origem
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");

// Crie uma instância da classe HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();

// Defina as opções desejadas
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;

// Salve o arquivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);

Obtenha uma licença gratuita

Você pode experimentar a API sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como converter documentos PDF para o formato HTML usando C++. Além disso, você aprendeu como usar as opções adicionais fornecidas pelo Aspose.PDF para C++ API para personalizar o HTML gerado. A API fornece muitos recursos adicionais para automatizar suas tarefas relacionadas a PDF. Você pode explorar a API em detalhes usando a documentação oficial. Se você tiver alguma dúvida, sinta-se à vontade para entrar em contato conosco no fórum de suporte gratuito.

Veja também