Python은 PDF에서 텍스트 찾기 및 바꾸기

PDF 파일에서 텍스트를 찾고 바꾸는 간단하면서도 정확한 방법을 찾고 있다면 잘 찾아오셨습니다. 이 기사에서는 Python을 사용하여 PDF의 특정 텍스트를 바꾸는 방법을 배웁니다. 몇 줄의 코드를 작성하면 전체 PDF를 구문 분석하여 원하는 단어/문구를 검색하고 바꿀 수 있습니다.

PDF에서 텍스트를 찾고 바꾸는 Python 라이브러리

PDF 파일에서 텍스트를 찾고 바꾸려면 Aspose.PDF for Python을 사용합니다. PDF 파일을 쉽게 만들고 처리할 수 있는 강력한 Python 라이브러리입니다. 라이브러리를 사용하면 PDF 파일의 텍스트를 매우 정확하고 빠르게 찾고 바꿀 수 있습니다.

라이브러리를 설치하려면 다음 pip 명령을 사용할 수 있습니다.

> pip install aspose-pdf

Python을 사용하여 PDF에서 텍스트 찾기 및 바꾸기

다음 단계는 Aspose.PDF의 도움으로 Python을 사용하여 PDF 문서에서 텍스트를 찾고 바꾸는 방법을 설명합니다.

  1. 문서 클래스를 사용하여 해당 경로에서 PDF를 로드합니다.
  2. TextFragmentAbsorber 클래스의 인스턴스를 만들고 생성자에 검색 구문을 제공합니다.
  3. doc.pages.accept(textabsorber)를 사용하여 PDF의 모든 페이지에 대한 텍스트 흡수기를 수락합니다.
  4. 추출된 텍스트 조각을 개체로 가져옵니다.
  5. 찾은 텍스트 조각을 반복하고 각 조각의 텍스트를 바꿉니다.
  6. 마지막으로 Document.save() 메서드를 사용하여 업데이트된 PDF 문서를 저장합니다.

다음 코드 샘플은 Python을 사용하여 PDF에서 텍스트를 찾고 바꾸는 방법을 보여줍니다.

# PDF 문서 불러오기
document = ap.Document("input.pdf")

# TextFragmentAbsorber 개체 인스턴스화
txtAbsorber = ap.text.TextFragmentAbsorber("text-to-replace")

# 검색 텍스트
document.pages.accept(txtAbsorber)

# 발견된 텍스트 조각에 대한 참조 가져오기
textFragmentCollection = txtAbsorber.text_fragments

# 검색된 모든 텍스트 조각을 구문 분석하고 텍스트 바꾸기
for txtFragment in textFragmentCollection:
    txtFragment.text = "replaced-text"

# 업데이트된 PDF 저장
document.save("output.pdf")

PDF에서 텍스트를 대체하는 온라인 도구

또한 Python용 Aspose.PDF를 기반으로 하는 PDF 파일의 텍스트를 대체하는 온라인 도구를 개발했습니다. 인터넷 연결만 있으면 언제 어디서나 이 도구를 사용할 수 있습니다.

PDF의 텍스트를 대체하는 무료 Python 라이브러리

무료 임시 라이선스를 받고 제한 없이 PDF 파일의 텍스트를 교체할 수 있습니다.

또한 문서를 사용하여 Python PDF 라이브러리의 다른 기능을 탐색할 수 있습니다. 또한 포럼에서 귀하의 문제, 제안 또는 피드백에 대해 저희에게 편지를 보내주십시오.

결론

이 기사에서는 Python을 사용하여 PDF를 구문 분석하고 특정 텍스트를 찾아 바꾸는 방법을 배웠습니다. 몇 줄의 코드로 PDF 파일 배치에서 텍스트를 검색하고 바꿀 수 있습니다. 또한 PDF 파일의 텍스트를 교체할 수 있는 무료 온라인 도구를 제공했습니다. 인터넷에 연결된 모든 장치에서 이 도구를 사용할 수 있습니다.

또한보십시오