PDF é um formato de documento padrão amplamente usado para troca de documentos entre indivíduos e diferentes organizações. Mesmo sendo popular, nem sempre pode ser a escolha ideal para exibir conteúdo. Por exemplo, em páginas da web, HTML é a melhor escolha para uma experiência de usuário mais satisfatória. Se você deseja exibir o conteúdo PDF em um site, convertê-lo em HTML pode ser útil. À luz disso, este artigo ensinará como converter documentos PDF para o formato HTML usando C++.
- API C++ para converter documentos PDF para formato HTML
- Converter documentos PDF para o formato HTML usando C++
- Converta documentos PDF para o formato HTML com opções adicionais usando C++
API C++ para converter documentos PDF para formato HTML
Aspose.PDF for C++ é uma biblioteca C++ que permite criar, ler e atualizar documentos PDF. Além disso, a API suporta a conversão de arquivos PDF para o formato HTML. Você pode instalar a API por meio do NuGet ou baixá-la diretamente da seção downloads.
PM> Install-Package Aspose.PDF.Cpp
Converter documentos PDF para o formato HTML usando C++
Converter um documento PDF para o formato HTML é muito fácil com a API Aspose.PDF para C++. Você pode realizar a conversão com apenas duas linhas de código. Para converter um documento PDF para o formato HTML, siga as etapas abaixo.
- Carregue o documento PDF usando a classe Document.
- Salve a saída HTML usando o método Document->Save(System::String outputFileName, formato SaveFormat).
O código de exemplo a seguir mostra como converter documentos PDF para o formato HTML usando C++.
// Abra o documento PDF de origem
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// Salve o arquivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);
Arquivo PDF de origem
Arquivo HTML de saída
Converta documentos PDF para o formato HTML com opções adicionais usando C++
A API Aspose.PDF para C++ fornece a capacidade de personalizar o HTML gerado pelo processo de conversão. Para isso, a API oferece a classe HtmlSaveOptions. A seguir estão algumas das opções fornecidas pela classe HtmlSaveOptions.
- FontSavingMode: É usado para definir o modo de economia de fonte usado durante a conversão. A enumeração FontSavingModes é usada para definir seu valor.
- RasterImagesSavingMode: É usado para definir como as imagens raster devem ser tratadas durante a conversão. A enumeração RasterImagesSavingModes é usada para definir seu valor.
- LettersPositioningMethod: Define o posicionamento das letras nas palavras. A enumeração LettersPositioningMethods é usada para definir seu valor.
- SpecialFolderForAllImages: É usado para definir o caminho onde as imagens serão salvas.
- SplitIntoPages: Define se cada página do PDF deve ser convertida como uma página HTML separada ou todo o documento deve ser convertido em um único arquivo HTML.
- SplitCssIntoPages: Quando SplitIntoPages é definido como verdadeiro, SplitCssIntoPages define se o CSS deve ser salvo como um único arquivo ou como um arquivo separado para cada página HTML.
A seguir estão as etapas para converter um documento PDF para o formato HTML com opções adicionais.
- Carregue o documento PDF usando a classe Document.
- Crie uma instância da classe HtmlSaveOptions.
- Defina as opções desejadas.
- Salve a saída HTML usando o Document->Save(System::String outputFileName, System::SharedPtr opções) método.
Veja a seguir o código de exemplo C++ que demonstra o uso da classe HtmlSaveOptions para personalizar a saída HTML.
// Abra o documento PDF de origem
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// Crie uma instância da classe HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();
// Defina as opções desejadas
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;
// Salve o arquivo HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);
Obtenha uma licença gratuita
Você pode experimentar a API sem limitações de avaliação solicitando uma licença temporária gratuita.
Conclusão
Neste artigo, você aprendeu como converter documentos PDF para o formato HTML usando C++. Além disso, você aprendeu como usar as opções adicionais fornecidas pelo Aspose.PDF para C++ API para personalizar o HTML gerado. A API fornece muitos recursos adicionais para automatizar suas tarefas relacionadas a PDF. Você pode explorar a API em detalhes usando a documentação oficial. Se você tiver alguma dúvida, sinta-se à vontade para entrar em contato conosco no fórum de suporte gratuito.