Extrahujte text a obrázky z OneNotu v C#

Shromažďujeme, organizujeme a spolupracujeme s poznámkami a nápady v dokumentech OneNotu. Je to druh digitálního poznámkového bloku, který se používá k psaní poznámek a sdílení s ostatními uživateli OneNotu. V určitých případech můžeme potřebovat extrahovat text nebo obrázky z dokumentů OneNotu programově bez použití MS OneNotu. V tomto článku se naučíme, jak extrahovat text a obrázky z OneNotu v C#.

Tento článek bude obsahovat následující témata:

C# API pro extrahování textu a obrázků z OneNotu

Pro extrahování textu a obrázků z dokumentu OneNote budeme používat API Aspose.Note for .NET. Jedná se o rozhraní API pro manipulaci s dokumenty OneNote bohaté na funkce, které umožňuje vytvářet, číst a převádět dokumenty OneNotu programově. Prosím buď stáhněte DLL API, nebo ji nainstalujte pomocí NuGet.

PM> Install-Package Aspose.Note

Extrahujte veškerý text z OneNotu v C#

Veškerý text můžeme snadno extrahovat z dokumentu OneNote podle následujících kroků:

  1. Nejprve načtěte soubor OneNotu pomocí třídy Document.
  2. Poté zavolejte metodu GetChildNodes s RichText jako NodeType a extrahujte text.
  3. Nakonec ukažte extrahovaný text.

Následující ukázka kódu ukazuje, jak extrahovat veškerý text ze souboru OneNotu pomocí C#.

// Tento příklad kódu ukazuje, jak extrahovat veškerý text z dokumentu OneNotu.
// Vložte dokument do Aspose.Note.
Document oneFile = new Document(@"C:\Files\Note\Aspose.one");

// Načíst text
string text = string.Join(Environment.NewLine, oneFile.GetChildNodes<RichText>().Select(e => e.Text)) + Environment.NewLine;

// Tisk textu
Console.WriteLine(text);
Extrahujte veškerý text z dokumentů OneNotu.

Extrahujte veškerý text z dokumentů OneNotu.

Extrahujte text z konkrétních stránek OneNotu v C#

Text z konkrétních stránek dokumentu OneNote můžeme extrahovat podle následujících kroků:

  1. Nejprve načtěte soubor OneNotu pomocí třídy Document.
  2. Dále zavolejte metodu GetChildNodes s Page jako NodeType pro extrahování stránek.
  3. Poté získejte seznam textových položek pomocí metody GetChildNodes s RichText jako NodeType.
  4. Nakonec ukažte extrahovaný text.

Následující ukázka kódu ukazuje, jak extrahovat text z konkrétní stránky souboru OneNote pomocí C#.

// Tento příklad kódu ukazuje, jak získat text z konkrétní stránky.
// Získat první stránku ze seznamu uzlů stránky
var page = oneFile.GetChildNodes<Page>().FirstOrDefault();

if (page != null)
{
    // Načíst text
    IList<RichText> textNodes = page.GetChildNodes<RichText>();

    foreach (RichText t in textNodes)
    {
        // Tisk textu
        Console.WriteLine(t.Text);
    }
}

Extrahujte obrázky z OneNotu v C#

Obrázky můžeme také extrahovat z dokumentu OneNote podle následujících kroků:

  1. Nejprve načtěte soubor OneNotu pomocí třídy Document.
  2. Poté získejte seznam obrázků pomocí metody GetChildNodes s Image jako NodeType.
  3. Nakonec ukažte vlastnosti obrazu a uložte na místní disk.

Následující ukázka kódu ukazuje, jak extrahovat obrázky ze souboru OneNotu pomocí C#.

// Tento příklad kódu ukazuje, jak extrahovat všechny obrázky.
// Získejte všechny obrazové uzly
IList<Aspose.Note.Image> nodes = oneFile.GetChildNodes<Aspose.Note.Image>();

foreach (Aspose.Note.Image image in nodes)
{
    Console.WriteLine("Width: {0}", image.Width);
    Console.WriteLine("Height: {0}", image.Height);
    Console.WriteLine("OriginalWidth: {0}", image.OriginalWidth);
    Console.WriteLine("OriginalHeight: {0}", image.OriginalHeight);
    Console.WriteLine("FileName: {0}", image.FileName);
    Console.WriteLine("LastModifiedTime: {0}", image.LastModifiedTime);

    using (MemoryStream stream = new MemoryStream(image.Bytes))
    {
        using (Bitmap bitMap = new Bitmap(stream))
        {
            // Uložte bajty obrázku do souboru
            bitMap.Save(String.Format(@"C:\Files\Note\" + "{0}", Path.GetFileName(image.FileName)));
        }
    }

    Console.WriteLine("Image saved!");
    Console.WriteLine();
}
Extrahujte obrázky z dokumentů OneNotu.

Extrahujte obrázky z dokumentů OneNotu.

Získejte bezplatnou licenci

Můžete získat bezplatnou dočasnou licenci a vyzkoušet knihovnu bez omezení hodnocení.

Závěr

V tomto článku jsme se naučili, jak extrahovat text z dokumentu OneNotu nebo z konkrétních stránek dokumentu. Také jsme viděli, jak programově extrahovat obrázky z dokumentů OneNotu. Kromě toho se můžete dozvědět více o Aspose.Note pro .NET API pomocí dokumentace. V případě jakýchkoliv nejasností nás neváhejte kontaktovat na fóru.

Viz také