C# .NET 文字自动化

您是否正在寻找 .NET Word 自动化解决方案来创建和处理 C# 中的文字处理文档?您想在不需要 MS Office 的情况下以编程方式创建、编辑/修改和转换 Word 文档吗?让我们试试 Aspose.Words for .NET API,它提供了一套完整的功能,可以在您的 .NET 应用程序中使用 C# 创建 MS Word 文档(.doc、.docx 等)。

企业对 MS Word 文档自动化和报告生成的需求很高。 Aspose.Words for .NET 是一个完整且功能丰富的 Word 自动化解决方案,用于在这种情况下创建、编辑或分析 Word 文档。本文介绍了使用 C# 以编程方式生成和操作 Word 文档所需的所有基本功能。阅读本文后,您将能够:

创建 Word 文档 - C# Word 自动化 API

Aspose.Words for .NET DLL 可以从 这里 下载。另一种选择是通过 NuGet 包管理器或 Visual Studio 中的包管理器控制台安装它。

使用 NuGet 包管理器

C# .NET Word 自动化库

使用包管理器控制台

PM> Install-Package Aspose.Words

使用 C# 创建 Word 文档

让我们通过使用 Aspose.Words for .NET 创建一个新的 Word 文档开始我们的旅程。 API 的 DocumentBuilder 类包含从头开始创建 Word 文档的所有方法和属性。结合 Document 类,DocumentBuilder 支持插入元素,例如文本/段落、复选框、表格、列表、图像以及 Word 文档可以包含的其他对象。此外,您可以使用此类指定字体和其他格式选项。

以下是使用 DocumentBuilder 类创建 Word 文档的步骤。

  • 创建一个新的 Document 对象。
  • 创建和新的 DocumentBuilder 对象并使用 Document 对象对其进行初始化。
  • 使用 DocumentBuilder 对象插入/写入元素。
  • 使用 Document.Save 方法保存文档。

以下代码示例展示了如何使用 C# 创建 Word DOCX 文档。

Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);

// 指定字体格式
Font font = builder.Font;
font.Size = 32;
font.Bold = true;
font.Color = System.Drawing.Color.Black;
font.Name = "Arial";
font.Underline = Underline.Single;

// 插入文本
builder.Writeln("This is the first page.");
builder.Writeln();

// 更改下一个元素的格式。
font.Underline = Underline.None;
font.Size = 10;
font.Color = System.Drawing.Color.Blue;

builder.Writeln("This following is a table");
// 插入表格
Table table = builder.StartTable();
// 插入一个单元格
builder.InsertCell();
// 使用固定的列宽。
table.AutoFit(AutoFitBehavior.AutoFitToContents);
builder.CellFormat.VerticalAlignment = CellVerticalAlignment.Center;
builder.Write("This is row 1 cell 1");
// 插入一个单元格
builder.InsertCell();
builder.Write("This is row 1 cell 2");
builder.EndRow();
builder.InsertCell();
builder.Write("This is row 2 cell 1");
builder.InsertCell();
builder.Write("This is row 2 cell 2");
builder.EndRow();
builder.EndTable();
builder.Writeln();

// 插入图片
builder.InsertImage("image.png");
// 插入分页符 
builder.InsertBreak(BreakType.PageBreak);             
// 分页符后的所有元素都将插入到下一页。

// 保存文档
doc.Save("Document.docx");

以下是我们执行上述代码后得到的文档。

在 C# .NET 中创建 Word 文档

访问 这些文章 以探索更多关于可以使用 Aspose.Words for .NET 添加到 Word 文档的元素。

在 C# 中编辑 Word 文档

您还可以使用 Aspose.Words for .NET 编辑或修改现有的 Word 文档。 Aspose.Words 文档对象模型类允许您访问和修改文档的元素以及它们的格式。 DOM 实际上是文档的内存表示。要将文档表示理解为 DOM,请参阅 DOM 概述

现在让我们看看如何编辑 Word 文档中的现有元素。假设我们需要更新文本“这是第一页”。在我们最近创建的文档中。由于这是文档第一节的第一段,我们可以通过指定第一节和第一段的索引来访问它。以下代码示例演示如何使用 C# 编辑 Word 文档中的段落。

// 加载文档
Document doc = new Document("Document.docx");
DocumentBuilder builder = new DocumentBuilder(doc);
// 访问段落
var paragraph=doc.Sections[0].Body.Paragraphs[0].Runs[0];
paragraph.Text = "This is updated text";  
// 保存文档
doc.Save("Document_updated.docx");

以下是更新后的Word文档。

C# .NET 中的文字自动化

在 C# 中将 Word 文档转换为其他格式

除了创建和操作 Word 文档外,Aspose.Words for .NET 还允许将文档转换为其他格式,包括(但不限于)PDF、XPS、EPUB、HTML 和 BMP、PNG 或 JPEG 等图像格式。以下代码示例展示了如何在 C# 中将 Word 文档转换为 PDF。

Document doc = new Document("word.docx");
// 为 PDF17 提供 PDFSaveOption 合规性
PdfSaveOptions options = new PdfSaveOptions();
options.Compliance = PdfCompliance.Pdf17;
// 将 Word 转换为 PDF
doc.Save("output.pdf", options);

访问 本文 了解如何将 Word 文档转换为其他格式。

在 C# 中解析 Word 文档

您还可以通过将其内容提取为纯文本来解析 Word 文档。以下代码示例演示如何从 Word 文档中提取文本并将其保存到 .txt 文件中。

// 从磁盘加载文档。
Document doc = new Document("document.docx");
// 另存为纯文本 
doc.Save("output.txt");

结论

在本文中,您了解了如何使用 C# 创建或编辑 MS Word DOC/DOCX 文档。此外,您还学习了如何以编程方式转换或解析 MS Word 文档。请访问 Aspose.Words for .NET 的文档以获取完整的开发人员指南。如果您发现任何让您感到困惑的事情,请通过我们的 论坛 告诉我们。

相关文章)