Python Pandas DataFrame Column과 Index 설정하는 방법

안녕하세요, 이번 포스팅에서는 Pandas의 DataFrame화 한 Data의 Column과 Index를 설정하는 방법에 대해서 작성하려고 합니다. 쉬운 이해를 돕기 위해서 예시를 통해 설명드리도록 하겠습니다.

Pandas-Column-Index-설정-썸네일 — Pandas-Column-Index-설정

Column과 Index 설정을 위한 기초 데이터 만들기

: 이전 포스팅에서 사용했던 데이터를 이용하여 Column과 Index 설정을 하는 방법을 설명드리도록 하겠습니다. 이번 포스팅을 보지 않은 분이 계신다면 아래 링크를 통해서 보고 오시면 어떻게 DataFrame을 구현했는지 쉽게 이해하고 오실 수 있을 겁니다. 그다음에 이 포스팅을 보시면 더 이해가 빠르실 거 같습니다.

Python Pandas DataFrame 활용하기

안녕하세요, 이번 포스팅에서는 Python의 Pandas 패키지 함수 중에 DataFrame이라는 함수를 어떻게 활용하는지에 대한 내용으로 작성해보도록 하겠습니다. 쉬운 이해를 돕기 위해서 예시를 통해 설명

davey.tistory.com

기초 데이터 설정 코드는 아래와 같습니다. 필요한 Panda 패키지를 선언을 하고 그에 맞게 필요한 Data를 기본적으로 입력을 해보았습니다.

#필요한 패키지 or 라이브러리를 선언함
import pandas as pd
import numpy as np

#
# 001. Pandas 의 DataFrame 활용하기
# pandas library를 선언
# Data Frame 내용을 Dictionary 로 정리해서 준비함.

Test_Data = {'City': ['Seoul', 'Busan', 'Paris', 'London', 'NewYork'],
'Year To Visit': [2021, 2020, 2015, 2016, 2015],
'Impression (Out of 10)': [6, 7, 6, 4, 9]}

# Dictionary로 준비한 내용을 간단하게 DataFrame 화 할 수 있음.
df1 = pd.DataFrame(Test_Data)

print(df1)
print()

위 코드를 구현해보면 아래와 같은 결과를 보실 수 있습니다. 즉 Dictionary로 구현한 내용이 DataFrame 화 되는 걸 확인 하실 수 있습니다.

DataFrame 한 Data의 Column과 Index 설정하기

: 위의 코드를 통해서 구현한 Data Table의 Column과 Index를 설정해보도록 하겠습니다. # DataFrame을 만들면서 columns와 index를 설정할 수 있다. Column과 Index에 대한 내용 설정은 순서에 상관없이 사용자가 먼저 선언하고 싶은 걸 먼저 선언하셔도 됩니다. 위에 설정한 Test_Data에 기 설정한 Column 이름과 다를 경우에는 아래와 같이 NaN (Not a Number) 이 나오는 걸 확인하실 수 있습니다. 그리고 자세히 보시면, Column의 순서가 Test_Data Dictionary에 설정한 Column 순서가 일치하지 않더라도, 알아서 찾아서 매칭 시켜주는 걸 확인하실 수 있습니다.

그리고 추가적으로 기존에 선언한 Column 이름을 하나도 포함하지 않고 새로운 Column 이름으로도 선언해보도록 하겠습니다. 그리고 결과를 보면 위에서 "City3"에 대해서 아무런 Data가 나오지 않은 것처럼 새로 설정한 Column에 대해서는 NaN (Not a Number)의 Data가 출력되는 걸 확인하실 수 있습니다.

# 기존에 포함한 Column 이름과 새로운 Column 이름을 설정
# Index 이름은 새롭게 설정함
df2 = pd.DataFrame(Test_Data, columns=['Year To Visit', 'City', 'City3'],
                   index=['one', 'two', 'three', 'four', 'five'])

df3 = pd.DataFrame(Test_Data, index=['one', 'two', 'three', 'four', 'five'],
                   columns=['Year To Visit', 'City', 'City3'])

print(df2)
print(df3)

# 기존에 선언한 Column 이름을 하나도 포함하지 않고 새로운 Column 이름 선언
df2 = pd.DataFrame(Test_Data, columns=['City1', 'City2', 'City3'],
                   index=['one', 'two', 'three', 'four', 'five'])

df3 = pd.DataFrame(Test_Data, index=['one', 'two', 'three', 'four', 'five'],
                   columns=['City1', 'City2', 'City3'])

print(df2)
print(df3)

Pandas-Column-Index-설정 — DataFrame-Column-Index-설정

이상입니다. 지금까지 Pandas의 DataFrame화 한 Data의 Column과 Index를 설정하는 방법에 대해서 포스팅을 작성하였습니다. 기존의 Data를 수정하지 않고 하나의 코드로 Column과 Index를 손쉽게 작성 할 수가 있다면 나중에 Data Modification과 재 배치가 수월할 거 같습니다. 그럼 이만 마무리하도록 하겠습니다. 감사합니다.

[저작권이나, 권리를 침해한 사항이 있으면 언제든지 Comment 부탁 드립니다. 검토 후 수정 및 삭제 조치하도록 하겠습니다. 그리고, 기재되는 내용은 개인적으로 습득한 내용이므로, 혹 오류가 발생할 수 있을 가능성이 있으므로, 기재된 내용은 참조용으로만 봐주시길 바랍니다. 게시물에, 오류가 있을 때도, Comment 달아 주시면, 검증 결과를 통해, 수정하도록 하겠습니다.]

728x90

저작자표시 비영리 변경금지 (새창열림)

'파이썬 (Python) > Pandas' 카테고리의 다른 글

Python Panda Column 삭제 및 원하는 행 Data 출력 (0)	2021.04.17
Python Panda Seriese 로 Data 테이블화 하기 + Column 추가 및 Data 사칙 계산 (0)	2021.04.17
Python Panda DataFrame 에서 선별적으로 Data 출력하기 (0)	2021.04.05
Python Pandas DataFrame 활용하기 (0)	2021.03.20
Python 파이썬 데이터 조작과 분석을 위한 절대 병기 Pandas 라이브러리 파헤치기 Part 1 (1)	2021.01.28