Word 文档中的 目录 (TOC) 可让您大致了解文档包含的内容。此外,它还允许您导航到文档的特定部分。在本文中,您将学习如何以编程方式处理 Word 文档中的目录。特别是,本文介绍了如何在 C# 中添加、提取、更新或删除 Word 文档中的目录。

在 Word 文档中添加、编辑或删除 TOC 的 C# API

为了使用 Word 文档中的目录,我们将使用 Aspose.Words for .NET。所述 API 旨在从 .NET 应用程序中执行基本和高级 Word 自动化功能。此外,它使您可以很好地控制 Word 文档中目录的操作。您可以 下载 API 或使用 NuGet 安装它。

PM> Install-Package Aspose.Words

在 C# 中的 Word 文档中添加目录

以下是使用 Aspose.Words for .NET 将目录添加到 Word 文档的步骤。

以下代码示例演示如何在 C# 中的 Word 文档中添加目录。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-words/Aspose.Words-for-.NET
// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_WorkingWithDocument();
// 初始化文档。
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);

// 在文档开头插入目录。
builder.InsertTableOfContents("\\o \"1-3\" \\h \\z \\u");

// 新插入的目录最初是空的。
// 它需要通过更新文档中的字段来填充。
doc.UpdateFields();
dataDir = dataDir + "DocumentBuilderInsertTOC_out.doc";
doc.Save(dataDir);

C# 从 Word 文档中提取目录

以下是从 Word 文档的目录中提取字段的步骤。

  • 使用 Document 类加载 Word 文档。
  • 使用 Document.Range.Fields 集合循环遍历文档中的每个 Field
  • 使用 Field.Type 属性检查字段类型是否为超链接。
  • 检查该字段是否位于目录部分的表下。
  • 检索字段信息并打印。

以下代码示例演示如何使用 C# 从 Word 文档中提取目录。

// 文档目录的路径。
string dataDir = RunExamples.GetDataDir_WorkingWithDocument();

string fileName = "TOC.doc";
Aspose.Words.Document doc = new Aspose.Words.Document(dataDir + fileName);

foreach (Field field in doc.Range.Fields)
{
	if (field.Type.Equals(Aspose.Words.Fields.FieldType.FieldHyperlink))
	{
		FieldHyperlink hyperlink = (FieldHyperlink)field;
		if (hyperlink.SubAddress != null && hyperlink.SubAddress.StartsWith("_Toc"))
		{
			Paragraph tocItem = (Paragraph)field.Start.GetAncestor(NodeType.Paragraph);
			Console.WriteLine(tocItem.ToString(SaveFormat.Text).Trim());
			Console.WriteLine("------------------");
			if (tocItem != null)
			{
				Bookmark bm = doc.Range.Bookmarks[hyperlink.SubAddress];
				// 获取此 TOC 项指向的位置
				Paragraph pointer = (Paragraph)bm.BookmarkStart.GetAncestor(NodeType.Paragraph);
				Console.WriteLine(pointer.ToString(SaveFormat.Text));
			}
		} // End If
	}// End If
}// End Foreach

在 C# 中更新 Word 文档中的目录

每当您将某些内容附加到 Word 文档时,都需要更新目录。为了以编程方式执行此操作,您只需在保存文档之前调用 Document.UpdateFields() 方法。

在 C# 中删除 Word 文档中的目录

Aspose.Words for .NET 还允许您从 Word 文档中删除目录。以下是执行此操作的步骤。

  • 首先,使用 Document 类加载 Word 文档。
  • 获取每个 TOC 的 FieldStart 节点并将其存储在一个数组中。
  • 遍历节点,直到获得类型为 FieldEnd 的节点(TOC 的结尾)。
  • 使用 Node.Remove() 方法删除节点并保存更新的文档。

以下代码示例演示如何从 C# 中的 Word 文档中删除目录。

// 如需完整的示例和数据文件,请访问 https://github.com/aspose-words/Aspose.Words-for-.NET
public static void Run()
{
    
    // 文档目录的路径。
    string dataDir = RunExamples.GetDataDir_WorkingWithStyles();

    // 打开包含目录的文档。
    Document doc = new Document(dataDir + "Document.TableOfContents.doc");

    // 从文档中删除第一个目录。
    RemoveTableOfContents(doc, 0);

    dataDir = dataDir + "Document.TableOfContentsRemoveToc_out.doc";
    // 保存输出。
    doc.Save(dataDir);
    
    Console.WriteLine("\nSpecified TOC from a document removed successfully.\nFile saved at " + dataDir);
}
///<summary>
/// 从文档中删除指定的目录字段。
///</summary>
///<param name="doc">要从中删除字段的文档。</param>
///<param name="index">要删除的 TOC 的从零开始的索引。</param>
public static void RemoveTableOfContents(Document doc, int index)
{
    // 将 TOC 字段的 FieldStart 节点存储在文档中以便快速访问。
    ArrayList fieldStarts = new ArrayList();
    // 这是一个列表,用于存储在指定 TOC 中找到的节点。他们将被删除
    // 在这个方法结束时。
    ArrayList nodeList = new ArrayList();

    foreach (FieldStart start in doc.GetChildNodes(NodeType.FieldStart, true))
    {
        if (start.FieldType == FieldType.FieldTOC)
        {
            // 添加所有 FieldTOC 类型的 FieldStart。
            fieldStarts.Add(start);
        }
    }

    // 确保传递的索引指定的 TOC 存在。
    if (index > fieldStarts.Count - 1)
        throw new ArgumentOutOfRangeException("TOC index is out of range");

    bool isRemoving = true;
    // 获取指定 TOC 的 FieldStart。
    Node currentNode = (Node)fieldStarts[index];

    while (isRemoving)
    {
        // 存储这些节点并稍后将它们全部删除会更安全。
        nodeList.Add(currentNode);
        currentNode = currentNode.NextPreOrder(doc);

        // 一旦我们遇到 FieldTOC 类型的 FieldEnd 节点,我们就知道我们在最后
        // 当前的TOC,我们可以到此为止。
        if (currentNode.NodeType == NodeType.FieldEnd)
        {
            FieldEnd fieldEnd = (FieldEnd)currentNode;
            if (fieldEnd.FieldType == FieldType.FieldTOC)
                isRemoving = false;
        }
    }

    // 删除在指定 TOC 中找到的所有节点。
    foreach (Node node in nodeList)
    {
        node.Remove();
    }
}

获取免费 API 许可证

如果您想在没有评估限制的情况下试用 API,您可以获得免费的临时许可证

结论

在本文中,您学习了如何以编程方式处理 Word 文档中的目录。分步指南和代码示例展示了如何在 C# 中从 Word 文档中添加、更新、提取和删除目录。您可以使用 documentation 探索有关 C# Word 自动化 API 的更多信息。如果您有任何问题或疑虑,请通过我们的 论坛 与我们联系。

也可以看看