Convert PDF to Word

In diesem Artikel werde ich demonstrieren, wie Sie PDF Dokumente genau und mühelos in Word Dokumente konvertieren können, einschließlich der Konvertierung von PDF-in-DOC und PDF-in-DOCX-Formaten. Frühere Versionen von Microsoft Word speicherten Dokumente im Binärformat mit der Erweiterung .doc. Mit der Veröffentlichung von Office 2007 hat Microsoft Office Open XML (OOXML) eingeführt, das auf einer Kombination aus XML und Binärdateien basiert, die als ZIP-Archive kombiniert werden. MS Word verwendet jetzt .docx als Standarderweiterung zum Speichern von Dokumenten.

Die Konvertierung von PDF in DOC und PDF in DOCX kann in verschiedenen Szenarien erforderlich sein. Beispielsweise möchten Sie die PDF-Datei bearbeitbar machen oder vermeiden, den Inhalt der PDF-Datei erneut in ein Word Dokument einzugeben, wobei die ursprüngliche Formatierung beibehalten wird. Ein weiterer Anwendungsfall könnte die Massenkonvertierung von PDF in DOC oder DOCX ohne spezielle Software sein. Um ein solches Szenario im Auge zu behalten, behandelt dieser Artikel die folgende PDF zu Word-Konvertierung programmgesteuert in C#:

  • Konvertieren Sie PDF in DOC in C#
  • Konvertieren Sie PDF in DOCX in C#
  • Konvertieren Sie PDF in DOC mit zusätzlichen Einstellungen

C#-PDF zu Word-DOC oder DOCX-Konverter

Aspose.PDF for .NET besitzt eine leistungsstarke PDF zu DOC oder DOCX-Konverter-API, mit der Sie PDF zu Word Dokumente in Ihren .NET-Anwendungen innerhalb weniger Codezeilen konvertieren können. Die API kann in WinForms, ASP.NET, Webdiensten oder jeder .NET-basierten Anwendung verwendet werden. Sie können die API entweder herunterladen oder sie mit dem NuGet Package Manager in Ihrem Projekt installieren.

Konvertieren Sie PDF in DOC in C#

Im Folgenden sind die Schritte zum Konvertieren von PDF in DOC mit Aspose.PDF for .NET aufgeführt.

Das folgende Codebeispiel zeigt, wie Sie PDF mit C# in Word DOC konvertieren.

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Der Pfad zum Dokumentenverzeichnis.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Öffnen Sie das Quell-PDF Dokument
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Speichern Sie die Datei im MS Dokumentenformat
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Konvertieren Sie PDF in DOCX in C#

Das Konvertieren von PDF in DOCX ähnelt der zuvor gezeigten PDF-in-DOC-Konvertierung. Die API verfügt über die Klasse DocSaveOptions, mit der Sie das Dokumentformat auf DOCX festlegen können. Im Folgenden sind die Schritte zum Konvertieren von PDF in DOCX aufgeführt:

  • Laden Sie die PDF Dokumente mit der Klasse Document.
  • Legen Sie das Ausgabedokumentformat mit der Klasse DocSaveOptions als DOCX fest.
  • Speichern Sie das Dokument mit der Erweiterung .docx mit der Methode Document.Save(string).

Das folgende Codebeispiel zeigt, wie Sie eine PDF-Datei in C# in Word DOCX konvertieren.

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Der Pfad zum Dokumentenverzeichnis.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Öffnen Sie das Quell-PDF Dokument
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Instanziieren Sie das DocSaveOptions Objekt
DocSaveOptions saveOptions = new DocSaveOptions();
// Geben Sie das Ausgabeformat als DOCX an
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Dokument im docx-Format speichern
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Konvertieren Sie PDF in DOC mit zusätzlichen Optionen

Aspose.PDF for .NET bietet verschiedene andere Optionen zum Anpassen der PDF zu DOC oder DOCX-Konvertierung. Die Klasse DocSaveOptions macht die Eigenschaften verfügbar, um die PDF zu DOC-Konvertierung zu verbessern oder zu erweitern, z. B. Bildauflösung, Abstand zwischen Zeilen usw. Der folgende Code zeigt, wie zusätzliche Eigenschaften beim Konvertieren von PDF in DOC in C# festgelegt werden. .

// Vollständige Beispiele und Datendateien finden Sie unter https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Der Pfad zum Dokumentenverzeichnis.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Öffnen Sie das Quell-PDF Dokument
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Speichern Sie mit den Speicheroptionen
// Erstellen Sie ein DocSaveOptions Objekt
DocSaveOptions saveOptions = new DocSaveOptions();

// Stellen Sie den Erkennungsmodus auf Flow ein
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Stellen Sie die horizontale Nähe auf 2,5 ein
saveOptions.RelativeHorizontalProximity = 2.5f;

// Aktivieren Sie den Wert, um Aufzählungszeichen während des Konvertierungsprozesses zu erkennen
saveOptions.RecognizeBullets = true;

// Speichern Sie die resultierende DOC-Datei
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Fazit

In diesem Artikel haben Sie einige einfache Methoden zum Konvertieren von PDF in DOC und PDF in DOCX mit C# kennengelernt. Wenn Sie mehr über die leistungsstarken Konvertierungsfunktionen von Aspose.PDF for .NET erfahren möchten, können Sie den API Dokumentationsabschnitt Konvertierung von PDF in andere Formate aufrufen. Laden Sie Ihre kostenlose Kopie von Aspose.PDF for .NET herunter und Sie können im Handumdrehen loslegen, indem Sie der API Dokumentation folgen. Wenn Sie Fragen haben, können Sie diese gerne im Aspose.PDF-Forum posten. Wir helfen Ihnen gerne bei Ihren Fragen und Anliegen.

Siehe auch