Odstraňte vodoznak do PDF v Python

Vodoznaky v souborech PDF se používají k vkládání log, ochranných známek nebo části textu na stránky. Účelem vodoznaku může být ochrana důvěrných informací, uplatnění autorských práv atd. Při programovém zpracování souborů PDF musíte často odstranit vodoznaky přidané na stránky PDF. Abychom toho dosáhli, tento článek vám ukáže, jak odstranit vodoznaky z PDF v Python.

Knihovna Python pro odstranění vodoznaků v PDF

K odstranění vodoznaků ze souborů PDF použijeme Aspose.PDF for Python. Je to výkonná knihovna pro manipulaci s PDF, která vám umožňuje přidávat a odstraňovat vodoznaky PDF v několika jednoduchých krocích. Knihovnu můžete nainstalovat pomocí následujícího příkazu pip.

pip install aspose-pdf

Odebrat vodoznak z PDF v Python

V souboru PDF jsou vodoznaky reprezentovány jako artefakty. Abychom odstranili vodoznaky, budeme muset přistupovat k artefaktům na každé stránce PDF. Níže jsou uvedeny kroky k odstranění vodoznaků z PDF v Python.

  • Nejprve načtěte soubor PDF pomocí třídy Document.
  • Poté vytvořte pole pro uchování odkazů na artefakty, které mají být odstraněny.
  • Procházejte každou stránku PDF pomocí kolekce Document.pages a v každé iteraci proveďte následující kroky:
    • Získejte přístup ke každému artefaktu stránky z kolekce Page.artifacts.
    • Zkontrolujte, zda je typ artefaktu Artifact.artifactsubtype.WATERMARK.
    • Pokud ano, přidejte artefakt do pole.
  • Nakonec projděte artefakty, které chcete odstranit, a odstraňte každý artefakt pomocí metody Page.artifacts.delete().
  • Nakonec uložte aktualizovaný soubor PDF pomocí metody Document.save().

Následující ukázka kódu ukazuje, jak odstranit vodoznaky z PDF v Python.

import aspose.pdf as ap

# Načíst soubor PDF
document = ap.Document("watermarked.pdf")

# Vytvořte pole pro uchování vodoznaků
artifactsToBeDeleted = []

# Projděte všechny stránky
for page in document.pages:

    # Přístup ke každému artefaktu na stránce
   for item in page.artifacts:

        # Zkontrolujte, zda artefakt není vodoznak
        if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:

            # Udržujte odkaz v poli
            artifactsToBeDeleted.add(item)

    # Projděte artefakty vodoznaku
   for item in artifactsToBeDeleted:
        # Odstraňte artefakt
        page.artifacts.delete(item)

# Uložte výsledný soubor PDF
document.save("Output.pdf")

Vodoznak PDF soubory online

Vyzkoušejte náš bezplatný online nástroj pro vodoznaky PDF, který je vyvinut pomocí Aspose.PDF. Tento nástroj můžete použít bez vytvoření účtu.

Získejte bezplatnou licenci

Získejte bezplatnou dočasnou licenci a vyzkoušejte funkci odstranění vodoznaku bez jakýchkoli omezení.

Prozkoumejte Python PDF Library

Prozkoumejte další funkce Aspose.PDF for Python pomocí dokumentace. V případě, že byste měli nějaké dotazy nebo dotazy, dejte nám vědět prostřednictvím našeho fóra.

Závěr

V tomto článku jste se naučili, jak odstranit vodoznaky ze souborů PDF v Python. Podrobné pokyny a ukázka kódu Python ukázaly, jak přistupovat k vodoznakům a jak je z každé stránky v souboru PDF odstranit. Kromě toho jsme vám poskytli bezplatný webový nástroj pro vytváření vodoznaků PDF, který můžete zdarma používat kdekoli a kdykoli.

Viz také