Python을 사용하여 Excel 파일의 데이터 읽기

MS Excel은 행과 열의 형태로 데이터를 유지하고 공유하는 편리한 방법을 제공합니다. 더 자주 Excel 파일은 수백 수천 개의 레코드가 있는 거대한 데이터 세트를 저장하는 데 사용됩니다. Python에서 Excel 파일로 작업하는 동안 워크시트의 각 셀에서 데이터를 읽어야 할 수 있습니다. 이를 달성하기 위해 이 기사에서는 Python에서 Excel 파일을 읽는 방법을 보여줍니다. 단일 워크시트 또는 Excel 통합 문서의 모든 워크시트에서 데이터를 읽는 방법을 배웁니다.

Excel 파일을 읽는 Python 라이브러리

통합 문서에서 데이터를 읽으려면 Java를 통한 Python용 Aspose.Cells를 사용합니다. MS Excel 파일을 생성하는 강력하고 기능이 풍부한 Python 라이브러리입니다. 또한 기존 Excel 파일을 원활하게 읽고 조작할 수 있습니다. 라이브러리를 다운로드하거나 다음 pip 명령을 사용하여 설치할 수 있습니다.

pip install aspose-cells

Python에서 Excel 파일 읽기

데이터 읽기를 시작하기 전에 Excel 파일에서 데이터를 관리하는 방법에 대한 개요를 살펴보겠습니다. Excel 파일을 컨테이너 역할을 하는 통합 문서라고 합니다. 각 통합 문서에는 하나 이상의 워크시트가 포함되어 있으며 모든 워크시트는 여러 셀로 구성되어 있습니다. 이러한 셀은 행과 열로 고유하게 식별됩니다. 따라서 셀에서 데이터를 읽으려면 행 및 열 인덱스를 알아야 합니다.

다음은 Excel 파일을 읽고 Python에서 데이터를 인쇄하는 단계입니다.

  • Workbook 클래스를 이용하여 엑셀 파일을 불러옵니다.
  • Workbook.getWorksheets() 메서드를 사용하여 WorksheetCollection의 참조를 가져옵니다.
  • 컬렉션의 워크시트를 반복하고 각 반복에서 다음 단계를 수행합니다.
    • 개체에서 워크시트의 참조를 가져옵니다.
    • 워크시트의 데이터 행과 열 수를 가져옵니다.
    • 행에 대한 루프를 시작합니다.
    • 열에 대해 중첩 루프를 시작합니다.
    • Worksheet.getCells().get(rowIndex, columnIndex).getValue() 메서드를 사용하여 각 셀에서 데이터를 읽습니다.

다음 코드 샘플은 Python에서 Excel 파일을 읽는 방법을 보여줍니다.

# Load Excel workbook
wb = Workbook("workbook.xlsx")

# Get worksheets collection
collection = wb.getWorksheets()
collectionCount = collection.getCount()

# Loop through all the worksheets
for worksheetIndex in range(collectionCount):

    # Get worksheet using its index
    worksheet = collection.get(worksheetIndex)

    # Print worksheet name
    print("Worksheet: " + str(worksheet.getName()))

    # Get number of rows and columns
    rows = worksheet.getCells().getMaxDataRow()
    cols = worksheet.getCells().getMaxDataColumn()

    # Loop through rows
    for i in range(rows):

        # Loop through each column in selected row
        for j in range(cols):
            # Print cell value
            print(worksheet.getCells().get(i, j).getValue(), end =" | ")

        # Print line break
        print("\n")

다음은 위의 코드 샘플을 실행한 후 얻은 출력입니다.

Python에서 Excel 파일의 워크시트 데이터 읽기

파이썬에서 엑셀 파일 읽기

Python의 Excel에서 특정 워크시트 읽기

아래 단계에 따라 Excel 파일에서 특정 워크시트를 읽을 수도 있습니다.

다음 코드 샘플은 Python의 특정 워크시트에서 데이터를 읽는 방법을 보여줍니다.

# Load Excel workbook
wb = Workbook("workbook.xlsx")

# Get worksheets collection
worksheet = wb.getWorksheets().get(0)   

# Print worksheet name
print("Worksheet: " + str(worksheet.getName()))

# Get number of rows and columns
rows = worksheet.getCells().getMaxDataRow()
cols = worksheet.getCells().getMaxDataColumn()

# Loop through rows
for i in range(rows):

    # Loop through each column in selected row
    for j in range(cols):
        # print cell value
        print(worksheet.getCells().get(i, j).getValue(), end =" | ")

    # Print line break
    print("\n")

무료 API 라이선스 받기

무료 임시 라이선스를 요청하면 평가 제한 없이 Java를 통해 Aspose.Cells for Python을 사용할 수 있습니다.

결론

이 기사에서는 Python에서 Excel 파일을 읽는 방법을 배웠습니다. 또한 Excel 통합 문서의 특정 워크시트 또는 모든 워크시트에서 데이터를 읽는 방법을 살펴보았습니다. 문서를 사용하여 Python 스프레드시트 라이브러리에 대해 자세히 알아볼 수 있습니다. 질문이나 질문이 있는 경우 포럼을 통해 알려주십시오.

또한보십시오