PDF è un formato di documento standard ampiamente utilizzato per lo scambio di documenti tra individui e organizzazioni diverse. Anche se è popolare, potrebbe non essere sempre la scelta ideale per mostrare i contenuti. Ad esempio, sulle pagine Web, HTML è la scelta migliore per un’esperienza utente più soddisfacente. Se desideri visualizzare il contenuto PDF su un sito Web, può essere utile convertirlo in HTML. Alla luce di ciò, questo articolo ti insegnerà come convertire documenti PDF in formato HTML usando C++.
- API C++ per la conversione di documenti PDF in formato HTML
- Converti documenti PDF in formato HTML usando C++
- Converti documenti PDF in formato HTML con opzioni aggiuntive utilizzando C++
API C++ per la conversione di documenti PDF in formato HTML
Aspose.PDF for C++ è una libreria C++ che consente di creare, leggere e aggiornare documenti PDF. Inoltre, l’API supporta la conversione di file PDF in formato HTML. Puoi installare l’API tramite NuGet o scaricarla direttamente dalla sezione download.
PM> Install-Package Aspose.PDF.Cpp
Converti documenti PDF in formato HTML utilizzando C++
La conversione di un documento PDF in formato HTML è un gioco da ragazzi con l’API Aspose.PDF per C++. Puoi eseguire la conversione con solo due righe di codice. Per convertire un documento PDF in formato HTML, segui i passaggi indicati di seguito.
- Carica il documento PDF utilizzando la classe Document.
- Salvare l’output HTML utilizzando il metodo Document->Save(System::String outputFileName, SaveFormat format).
Il codice di esempio seguente mostra come convertire i documenti PDF in formato HTML utilizzando C++.
// Apri il documento PDF di origine
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// Salva il file HTML
pdfDocument->Save(u"OutputDirectory\\output.html", SaveFormat::Html);
File PDF di origine
Output file HTML
Converti documenti PDF in formato HTML con opzioni aggiuntive utilizzando C++
L’API Aspose.PDF per C++ offre la possibilità di personalizzare l’HTML generato dal processo di conversione. Per questo, l’API offre la classe HtmlSaveOptions. Di seguito sono elencate alcune delle opzioni fornite dalla classe HtmlSaveOptions.
- FontSavingMode: viene utilizzato per impostare la modalità di salvataggio dei caratteri utilizzata durante la conversione. L’enumerazione FontSavingModes viene utilizzata per impostarne il valore.
- RasterImagesSavingMode: viene utilizzato per impostare la modalità di gestione delle immagini raster durante la conversione. L’enumerazione RasterImagesSavingModes viene utilizzata per impostarne il valore.
- LettersPositioningMethod: imposta il posizionamento delle lettere nelle parole. L’enumerazione LettersPositioningMethods viene utilizzata per impostarne il valore.
- SpecialFolderForAllImages: viene utilizzato per impostare il percorso in cui verranno salvate le immagini.
- SplitIntoPages: Stabilisce se ogni pagina del PDF deve essere convertita in una pagina HTML separata o se l’intero documento deve essere convertito in un unico file HTML.
- SplitCssIntoPages: Quando SplitIntoPages è impostato su true, SplitCssIntoPages imposta se il CSS deve essere salvato come file singolo o come file separato per ciascuna pagina HTML.
Di seguito sono riportati i passaggi per convertire un documento PDF in formato HTML con opzioni aggiuntive.
- Carica il documento PDF utilizzando la classe Document.
- Crea un’istanza della classe HtmlSaveOptions.
- Imposta le opzioni desiderate.
- Salva l’output HTML utilizzando Document->Save(System::String outputFileName, System::SharedPtr opzioni).
Di seguito è riportato il codice di esempio C++ che illustra l’utilizzo della classe HtmlSaveOptions per personalizzare l’output HTML.
// Apri il documento PDF di origine
auto pdfDocument = MakeObject<Document>(u"SourceDirectory\\Sample 1.pdf");
// Creare un'istanza della classe HtmlSaveOptions
SharedPtr<HtmlSaveOptions> options = MakeObject<HtmlSaveOptions>();
// Imposta le opzioni desiderate
options->PartsEmbeddingMode = HtmlSaveOptions::PartsEmbeddingModes::EmbedAllIntoHtml;
options->LettersPositioningMethod = HtmlSaveOptions::LettersPositioningMethods::UseEmUnitsAndCompensationOfRoundingErrorsInCss;
options->RasterImagesSavingMode = HtmlSaveOptions::RasterImagesSavingModes::AsEmbeddedPartsOfPngPageBackground;
options->FontSavingMode = HtmlSaveOptions::FontSavingModes::SaveInAllFormats;
// Salva il file HTML
pdfDocument->Save(u"OutputDirectory\\output.html", options);
Ottieni una licenza gratuita
Puoi provare l’API senza limitazioni di valutazione richiedendo una licenza temporanea gratuita.
Conclusione
In questo articolo, hai imparato come convertire documenti PDF in formato HTML usando C++. Inoltre, hai imparato come utilizzare le opzioni aggiuntive fornite dall’API Aspose.PDF per C++ per personalizzare l’HTML generato. L’API fornisce molte funzionalità aggiuntive per automatizzare le attività relative ai PDF. Puoi esplorare l’API in dettaglio utilizzando la documentazione ufficiale. In caso di domande, non esitare a contattarci tramite il forum di supporto gratuito.