Vodoznaky v souborech PDF se používají k vkládání log, ochranných známek nebo části textu na stránky. Účelem vodoznaku může být ochrana důvěrných informací, uplatnění autorských práv atd. Při programovém zpracování souborů PDF musíte často odstranit vodoznaky přidané na stránky PDF. Abychom toho dosáhli, tento článek vám ukáže, jak odstranit vodoznaky z PDF v Python.
- Knihovna Python pro odstranění vodoznaků v PDF
- Odebrat vodoznak z PDF v Python
- Online vodoznakový nástroj PDF
Knihovna Python pro odstranění vodoznaků v PDF
K odstranění vodoznaků ze souborů PDF použijeme Aspose.PDF for Python. Je to výkonná knihovna pro manipulaci s PDF, která vám umožňuje přidávat a odstraňovat vodoznaky PDF v několika jednoduchých krocích. Knihovnu můžete nainstalovat pomocí následujícího příkazu pip.
pip install aspose-pdf
Odebrat vodoznak z PDF v Python
V souboru PDF jsou vodoznaky reprezentovány jako artefakty. Abychom odstranili vodoznaky, budeme muset přistupovat k artefaktům na každé stránce PDF. Níže jsou uvedeny kroky k odstranění vodoznaků z PDF v Python.
- Nejprve načtěte soubor PDF pomocí třídy Document.
- Poté vytvořte pole pro uchování odkazů na artefakty, které mají být odstraněny.
- Procházejte každou stránku PDF pomocí kolekce Document.pages a v každé iteraci proveďte následující kroky:
- Získejte přístup ke každému artefaktu stránky z kolekce Page.artifacts.
- Zkontrolujte, zda je typ artefaktu Artifact.artifactsubtype.WATERMARK.
- Pokud ano, přidejte artefakt do pole.
- Nakonec projděte artefakty, které chcete odstranit, a odstraňte každý artefakt pomocí metody Page.artifacts.delete().
- Nakonec uložte aktualizovaný soubor PDF pomocí metody Document.save().
Následující ukázka kódu ukazuje, jak odstranit vodoznaky z PDF v Python.
import aspose.pdf as ap
# Načíst soubor PDF
document = ap.Document("watermarked.pdf")
# Vytvořte pole pro uchování vodoznaků
artifactsToBeDeleted = []
# Projděte všechny stránky
for page in document.pages:
# Přístup ke každému artefaktu na stránce
for item in page.artifacts:
# Zkontrolujte, zda artefakt není vodoznak
if item.sub_type == ap.Artifact.artifact_subtype.WATERMARK:
# Udržujte odkaz v poli
artifactsToBeDeleted.add(item)
# Projděte artefakty vodoznaku
for item in artifactsToBeDeleted:
# Odstraňte artefakt
page.artifacts.delete(item)
# Uložte výsledný soubor PDF
document.save("Output.pdf")
Vodoznak PDF soubory online
Vyzkoušejte náš bezplatný online nástroj pro vodoznaky PDF, který je vyvinut pomocí Aspose.PDF. Tento nástroj můžete použít bez vytvoření účtu.
Získejte bezplatnou licenci
Získejte bezplatnou dočasnou licenci a vyzkoušejte funkci odstranění vodoznaku bez jakýchkoli omezení.
Prozkoumejte Python PDF Library
Prozkoumejte další funkce Aspose.PDF for Python pomocí dokumentace. V případě, že byste měli nějaké dotazy nebo dotazy, dejte nám vědět prostřednictvím našeho fóra.
Závěr
V tomto článku jste se naučili, jak odstranit vodoznaky ze souborů PDF v Python. Podrobné pokyny a ukázka kódu Python ukázaly, jak přistupovat k vodoznakům a jak je z každé stránky v souboru PDF odstranit. Kromě toho jsme vám poskytli bezplatný webový nástroj pro vytváření vodoznaků PDF, který můžete zdarma používat kdekoli a kdykoli.