Da PDF a HTML La conversione è una funzione ampiamente e comunemente utilizzata che può essere ottenuta attraverso diversi mezzi, ad esempio software, strumenti e servizi online. A volte è necessario convertire il contenuto PDF in modo che possa essere visualizzato nel browser o diventare parte della tua applicazione web. La conversione da PDF a HTML consente di soddisfare questo requisito in cui il contenuto PDF viene visualizzato con tag HTML con stile e formattazione simili. Grazie ad Aspose, puoi implementare la funzionalità ora nella tua applicazione desktop o web utilizzando Aspose.PDF per .NET. L’API ti consente di convertire i tuoi documenti PDF in HTML utilizzando poche righe di codice e non solo questo, ma ti consente anche di specificare diverse opzioni di formattazione e stile durante la conversione. La sezione seguente del post ti porterà alla guida turistica completa su come utilizzare Aspose.PDF per .NET per convertire PDF in HTML.
Conversione da PDF a HTML in .NET
È possibile eseguire una semplice conversione da PDF a HTML caricando un documento PDF e salvandolo come HTML utilizzando HtmlSaveOptions. L’esempio seguente mostra non solo la conversione, ma anche la specifica di un requisito in cui è possibile salvare le immagini come formato raster:
// Per esempi completi e file di dati, visitare https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Il percorso della directory dei documenti.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion_PDFToHTMLFormat();
// File PDF di origine
Document doc = new Document(dataDir + "input.pdf");
// Crea HtmlSaveOption con funzionalità testate
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = true;
saveOptions.SplitIntoPages = false;
saveOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsExternalPngFilesReferencedViaSvg;
// Salva l'output in formato HTML
doc.Save( dataDir + "SaveImages_out.html", saveOptions);
La storia non finisce qui. Aspose.PDF per .NET offre funzionalità enormi e più esigenti che non solo ne aumentano l’usabilità, ma ti danno il pieno controllo sul processo di conversione secondo il tuo desiderio. Puoi leggere i seguenti articoli eccezionali e completi nella documentazione dell’API per comprendere l’intero set di funzionalità in questo dominio, ad esempio da PDF a HTML:
- Da PDF a HTML - Dividi CSS in pagine
- Da PDF a HTML: salva i caratteri come WOFF o TTF
- Da PDF a HTML - Specificare il prefisso per l’immagine
- Da PDF a HTML: imposta il prefisso per gli URL dei file SVG
- Da PDF a HTML - Imposta il prefisso URL per i caratteri in style.css
- Da PDF a HTML - Prefisso i nomi delle classi CSS in style.css
- Da PDF a HTML - Aggiungi un prefisso alle direttive di importazione
- Da PDF a HTML - Salva l’output in un oggetto Stream
- Da PDF a HTML - Dettagli sullo stato di avanzamento della conversione
- Da PDF a HTML - Evita di salvare le immagini in formato SVG
- Da PDF a HTML - HTML singolo con tutte le risorse integrate
- Da PDF a HTML - Imposta le dimensioni del file di output
- Da PDF a HTML - Escludi risorse font
Oltre alle funzionalità di cui sopra, Aspose.PDF for .NET 19.8 offre un nuovo miglioramento in cui è possibile salvare PDF in HTML con larghezza del contenuto completa. Diamo un’occhiata all’utilizzo di questa nuova funzionalità:
Conversione da PDF a HTML con larghezza di contenuto completa
L’ultima versione dell’API ti consente di convertire PDF in HTML con l’intera larghezza del contenuto mentre il contenuto HTML viene utilizzato per essere allineato a sinistra. La proprietà FlowLayoutParagraphFullWidth della classe HtmlSaveOptions consente di ottenere ciò, come illustrato nell’esempio di codice seguente.
// Per esempi completi e file di dati, visitare https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Il percorso della directory dei documenti.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.FixedLayout = (false);
saveOptions.FlowLayoutParagraphFullWidth = true;
Document doc = new Document(dataDir + "FlowLayoutParagraphFullWidth.Pdf");
doc.Save(dataDir + "FlowLayoutParagraphFullWidth_out.html", saveOptions);
Ulteriori miglioramenti e correzioni utili
Il fattore di usabilità dell’API diventa più forte con il seguente elenco di utili miglioramenti che l’API porta con sé in [v19.8](https://docs.aspose.com/display/pdfnet/Aspose.PDF+for+.NET+19.8 +Release+Note “Aspose.PDF for .NET 19.8 Release Notes”):
- L’aggiunta della funzionalità Tabella è ulteriormente rettificata
- La sostituzione dei caratteri è ulteriormente migliorata
- Il consumo di memoria durante l’aggiunta di HTML in PDF è ulteriormente improvvisato
- La conversione da PDF a immagine è migliorata
- La conversione da XML a PDF è ulteriormente migliorata
- La conversione da PDF a DOC/DOCX è migliorata
- Gli scenari di aggiunta ed elaborazione del testo sono stati ulteriormente improvvisati
Ci auguriamo di aver coperto ogni aspetto della conversione da PDF a HTML nella guida sopra. Tuttavia, nel caso in cui tu abbia ancora qualche domanda, non esitare a farcelo sapere. Come sempre, da non perdere un singolo aggiornamento sulle API di Aspose. Torneremo presto con una nuova revisione dell’API con interessanti funzionalità.