In questo articolo, dimostrerò come convertire in modo accurato e semplice documenti da PDF a Word, inclusa la conversione di formati PDF in DOC e PDF in DOCX. Le versioni precedenti di Microsoft Word salvavano i documenti in formato binario con estensione .doc. Con il rilascio di Office 2007, Microsoft ha adottato Office Open XML (OOXML), basato su una combinazione di file XML e binari combinati insieme come archivi ZIP. MS Word ora utilizza .docx come estensione predefinita per il salvataggio dei documenti.
La conversione di PDF in DOC e PDF in DOCX potrebbe essere richiesta in vari scenari. Ad esempio, potresti voler rendere il PDF modificabile o evitare di riscrivere il contenuto del PDF in un documento Word mantenendo la formattazione originale. Un altro caso d’uso potrebbe essere la conversione in blocco da PDF a DOC o DOCX senza alcun software specializzato. Tenendo d’occhio uno scenario del genere, questo articolo copre la seguente conversione da PDF a Word a livello di codice in C#:
- Converti PDF in DOC in C#
- Converti PDF in DOCX in C#
- Converti PDF in DOC con impostazioni aggiuntive
Convertitore C# da PDF a Word DOC o DOCX
Aspose.PDF for .NET possiede una potente API di conversione da PDF a DOC o DOCX che ti consente di convertire documenti da PDF a Word nelle tue applicazioni .NET in poche righe di codice. L’API può essere utilizzata in WinForms, ASP.NET, servizi Web o qualsiasi applicazione basata su .NET. Puoi scaricare l’API o installarla utilizzando NuGet Package Manager nel tuo progetto.
Converti PDF in DOC in C#
Di seguito sono riportati i passaggi per convertire PDF in DOC utilizzando Aspose.PDF for .NET.
- Carica i documenti PDF utilizzando la classe Document.
- Salva il documento con estensione .doc usando il metodo Document.Save(string).
L’esempio di codice seguente mostra come convertire PDF in Word DOC usando C#.
// Per esempi completi e file di dati, visitare https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Il percorso della directory dei documenti.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Apri il documento PDF di origine
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// Salva il file in formato documento MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);
Converti PDF in DOCX in C#
La conversione di PDF in DOCX è simile alla conversione da PDF a DOC come mostrato in precedenza. L’API ha la classe DocSaveOptions che consente di impostare il formato del documento su DOCX. Di seguito sono riportati i passaggi per convertire PDF in DOCX:
- Carica i documenti PDF utilizzando la classe Document.
- Imposta il formato del documento di output come DOCX usando la classe DocSaveOptions.
- Salva il documento con estensione .docx usando il metodo Document.Save(string).
L’esempio di codice seguente mostra come convertire un PDF in Word DOCX in C#.
// Per esempi completi e file di dati, visitare https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Il percorso della directory dei documenti.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Apri il documento PDF di origine
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// Istanziare l'oggetto DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Specificare il formato di output come DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Salva il documento in formato docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);
Converti PDF in DOC con opzioni aggiuntive
Aspose.PDF for .NET fornisce varie altre opzioni per personalizzare la conversione da PDF a DOC o DOCX. La classe DocSaveOptions espone le proprietà per migliorare o migliorare le conversioni da PDF a DOC, come la risoluzione dell’immagine, la distanza tra le righe e così via. Il codice seguente mostra come impostare proprietà aggiuntive durante la conversione da PDF a DOC in C# .
// Per esempi completi e file di dati, visitare https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Il percorso della directory dei documenti.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();
// Apri il documento PDF di origine
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");
// Salva usando le opzioni di salvataggio
// Crea oggetto DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Imposta la modalità di riconoscimento come Flusso
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;
// Impostare la prossimità orizzontale come 2.5
saveOptions.RelativeHorizontalProximity = 2.5f;
// Abilita il valore per riconoscere i punti elenco durante il processo di conversione
saveOptions.RecognizeBullets = true;
// Salva il file DOC risultante
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);
Conclusione
In questo articolo, hai imparato alcuni semplici modi per convertire PDF in DOC e PDF in DOCX usando C#. Se vuoi saperne di più sulle potenti funzionalità di conversione di Aspose.PDF for .NET, puoi andare alla sezione della documentazione API, Conversione di PDF in altri formati. Scarica la tua copia gratuita di Aspose.PDF for .NET e potrai iniziare in pochissimo tempo seguendo la documentazione dell’API. In caso di domande, non esitare a postare su Forum Aspose.PDF. Saremo lieti di assistervi con le vostre domande e richieste.