Convert PDF to Word

Neste artigo, vou demonstrar como converter documentos PDF para Word com precisão e sem esforço, incluindo a conversão de formatos PDF para DOC e PDF para DOCX. Versões anteriores do Microsoft Word salvavam documentos em formato binário com extensão .doc. Com o lançamento do Office 2007, a Microsoft adotou o Office Open XML (OOXML) que é baseado em uma combinação de XML e arquivos binários combinados como arquivos ZIP. O MS Word agora usa .docx como a extensão padrão para salvar documentos.

A conversão de PDF para DOC e PDF para DOCX pode ser necessária em vários cenários. Por exemplo, você pode querer tornar o PDF editável ou evitar redigitar o conteúdo do PDF em um documento do Word mantendo a formatação original. Outro caso de uso pode ser a conversão em massa de PDF para DOC ou DOCX sem nenhum software especializado. De olho nesse cenário, este artigo aborda a seguinte conversão de PDF para Word programaticamente em C#:

  • Converter PDF para DOC em C#
  • Converter PDF para DOCX em C#
  • Converta PDF para DOC com configurações adicionais

C# PDF para Word DOC ou Conversor DOCX

Aspose.PDF for .NET possui uma poderosa API de conversão de PDF para DOC ou DOCX que permite converter PDF para documentos do Word em seus aplicativos .NET em poucas linhas de código. A API pode ser usada em WinForms, ASP.NET, serviços da Web ou qualquer aplicativo baseado em .NET. Você pode baixar a API ou instalá-la usando o NuGet Package Manager em seu projeto.

Converter PDF para DOC em C#

A seguir estão as etapas para converter PDF em DOC usando Aspose.PDF para .NET.

O exemplo de código a seguir mostra como converter PDF em Word DOC usando C#.

// Para exemplos completos e arquivos de dados, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// O caminho para o diretório de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Abra o documento PDF de origem
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Salve o arquivo no formato de documento MS
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

Converter PDF para DOCX em C#

A conversão de PDF para DOCX é semelhante à conversão de PDF para DOC, conforme mostrado anteriormente. A API possui a classe DocSaveOptions que permite definir o formato do documento como DOCX. A seguir estão as etapas para converter PDF para DOCX:

O exemplo de código a seguir mostra como converter um PDF em Word DOCX em C#.

// Para exemplos completos e arquivos de dados, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// O caminho para o diretório de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Abra o documento PDF de origem
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Instanciar o objeto DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();
// Especifique o formato de saída como DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Salvar documento no formato docx
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

Converter PDF para DOC com opções adicionais

O Aspose.PDF para .NET oferece várias outras opções para personalizar a conversão de PDF para DOC ou DOCX. A classe DocSaveOptions expõe as propriedades para melhorar ou aprimorar as conversões de PDF para DOC, como resolução de imagem, distância entre linhas etc. O código a seguir mostra como definir propriedades adicionais ao converter PDF para DOC em C# .

// Para exemplos completos e arquivos de dados, acesse https://github.com/aspose-pdf/Aspose.PDF-for-.NET
// O caminho para o diretório de documentos.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Abra o documento PDF de origem
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Salvar usando as opções de salvamento
// Criar objeto DocSaveOptions
DocSaveOptions saveOptions = new DocSaveOptions();

// Defina o modo de reconhecimento como Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Defina a proximidade horizontal como 2,5
saveOptions.RelativeHorizontalProximity = 2.5f;

// Ative o valor para reconhecer marcadores durante o processo de conversão
saveOptions.RecognizeBullets = true;

// Salve o arquivo DOC resultante
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);

Conclusão

Neste artigo, você aprendeu algumas maneiras simples de converter PDF para DOC e PDF para DOCX usando C#. Se você quiser saber mais sobre os poderosos recursos de conversão do Aspose.PDF para .NET, então você pode ir para a seção de documentação da API, Conversão de PDF para outros formatos. Baixe sua cópia gratuita do Aspose.PDF for .NET e você poderá começar rapidamente seguindo a documentação da API. Se você tiver alguma dúvida, sinta-se à vontade para postar no fórum Aspose.PDF. Teremos o maior prazer em ajudá-lo com suas dúvidas e perguntas.

Veja também