Convert PDF to Word

W tym artykule pokażę, jak dokładnie i bez wysiłku przekonwertować dokument PDF na dokument Word, w tym konwersję formatów PDF na DOC i PDF na DOCX. Wcześniejsze wersje programu Microsoft Word zapisywały dokumenty w formacie binarnym z rozszerzeniem .doc. Wraz z wydaniem pakietu Office 2007 firma Microsoft przyjęła standard Office Open XML (OOXML), który jest oparty na kombinacji plików XML i plików binarnych połączonych razem jako archiwa ZIP. MS Word używa teraz .docx jako domyślnego rozszerzenia do zapisywania dokumentów.

Konwersja plików PDF na DOC i PDF na DOCX może być wymagana w różnych scenariuszach. Na przykład możesz chcieć udostępnić plik PDF do edycji lub uniknąć ponownego wpisywania zawartości pliku PDF do dokumentu programu Word z zachowaniem oryginalnego formatowania. Innym przypadkiem użycia może być masowa konwersja PDF do DOC lub DOCX bez specjalistycznego oprogramowania. Mając oko na taki scenariusz, w tym artykule omówiono następującą programową konwersję plików PDF do programu Word w języku C#:

  • Konwertuj PDF na DOC w C#
  • Konwertuj PDF na DOCX w C#
  • Konwertuj PDF na DOC z dodatkowymi ustawieniami

C# PDF do Word DOC lub DOCX Converter

Aspose.PDF for .NET jest właścicielem potężnego API konwertera plików PDF na DOC lub DOCX, które umożliwia konwersję dokumentów PDF na dokumenty Word w aplikacjach .NET w ciągu kilku wierszy kodu. Interfejs API może być używany w WinForms, ASP.NET, usługach sieciowych lub dowolnej aplikacji opartej na .NET. Możesz pobrać interfejs API lub zainstalować go za pomocą Menedżera pakietów NuGet w swoim projekcie.

Konwertuj PDF na DOC w C#

Poniżej przedstawiono kroki konwersji plików PDF na DOC za pomocą Aspose.PDF for .NET.

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format Word DOC przy użyciu języka C#.

// Pełne przykłady i pliki danych można znaleźć na stronie https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Ścieżka do katalogu dokumentów.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Otwórz źródłowy dokument PDF
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Zapisz plik w formacie dokumentu MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Konwertuj PDF na DOCX w C#

Konwersja PDF na DOCX jest podobna do konwersji PDF na DOC, jak pokazano wcześniej. API posiada klasę DocSaveOptions, która pozwala ustawić format dokumentu na DOCX. Poniżej przedstawiono kroki konwersji plików PDF na DOCX:

Poniższy przykładowy kod pokazuje, jak przekonwertować plik PDF na format Word DOCX w języku C#.

// Pełne przykłady i pliki danych można znaleźć na stronie https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Ścieżka do katalogu dokumentów.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Otwórz źródłowy dokument PDF
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Utwórz instancję obiektu DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Określ format wyjściowy jako DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Zapisz dokument w formacie docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Konwertuj PDF na DOC z dodatkowymi opcjami

Aspose.PDF for .NET zapewnia różne inne opcje dostosowywania konwersji PDF do DOC lub DOCX. Klasa DocSaveOptions udostępnia właściwości poprawiające lub ulepszające konwersję plików PDF na DOC, takie jak rozdzielczość obrazu, odległość między wierszami itp. Poniższy kod pokazuje, jak ustawić dodatkowe właściwości podczas konwersji plików PDF na DOC w języku C# .

// Pełne przykłady i pliki danych można znaleźć na stronie https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// Ścieżka do katalogu dokumentów.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Otwórz źródłowy dokument PDF
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Zapisz, korzystając z opcji zapisywania
// Utwórz obiekt DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Ustaw tryb rozpoznawania na Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Ustaw bliskość poziomą na 2,5
saveOptions.RelativeHorizontalProximity = 2.5f;

// Włącz wartość, aby rozpoznawać punktory podczas procesu konwersji
saveOptions.RecognizeBullets = true;

// Zapisz wynikowy plik DOC
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Wniosek

W tym artykule nauczyłeś się kilku prostych sposobów konwertowania plików PDF na DOC i PDF na DOCX przy użyciu języka C#. Jeśli chcesz dowiedzieć się więcej o potężnych funkcjach konwersji Aspose.PDF for .NET, możesz przejść do sekcji dokumentacji API, Konwersja PDF do innych formatów. Pobierz darmową kopię Aspose.PDF for .NET i możesz błyskawicznie rozpocząć pracę, postępując zgodnie z dokumentacją API. Jeśli masz jakieś pytania, śmiało pisz na forum Aspose.PDF. Z przyjemnością pomożemy Ci w Twoich pytaniach i zapytaniach.

Zobacz też