본문 바로가기
파이썬 (Python)/Pandas

Python Panda 행 Data 추가 및 Boolean 값 출력하는 방법

by ★√★ 2021. 4. 19.

안녕하세요 이번 포스팅은 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 행 Data 추가 및 Boolean 값 출력과 Sort 기능 구현하는 방법에 설명 드리도록 하겠습니다. 

 

Pandas-행-Data-추가-Boolean값-출력
Pandas-행-Data-추가-Boolean값-출력

 

코드 구현을 위한 Source Data DataFrame 화 하기

 

: 일단 DataFrame을 구현하기 위한 Source Data를 구현해보도록 하겠습니다. 이전 포스팅에서 설명 드린 것처럼 DataFrame을 구현하기 위해서는 Dictionary로 구현되어 있는 Data Source가 필요합니다. 아래와 같이 예시 Data를 구현해보도록 하겠습니다. (참고로 이 부분은 이전 포스팅에서 똑같은 Source Data를 사용하고 있다는 걸 참조 해주세요.)

 

# 필요한 패키지를 먼저 선언을 합니다.
import pandas as pd
import numpy as np

# 예시 Source Data를 구현하여, pandas를 이용하여 DataFrame화 시키는 코드입니다.
data = {"names": ["Kim", "Park", "Jang", "Kim", "MC-Yoo"],
"NumberofYear" : [2014, 2015, 2017, 2018, 2019],
"Value": [90, 86, 77, 99, 75]}
df = pd.DataFrame(data, columns=["names", "NumberofYear", "Value", "remarks"],
index=["first_row", "second_row", "third_row", "forth_row", "fifth_row"])

▼ 위의 Data는 예시로 한 것이고, Source Data는 원하시는 내용으로 다시 수정해서 구현하셔도 됩니다.

 

 

원하는 행 Data를 추가하는 방법

 

: 위에서 구현한 Source Data에 이전 포스팅에서는 Column을 추가하여 해당 Column Value를 입력했다고 하면, 이번에는 원하는  행을 입력하면 해당 행에 원하는 Data를 입력하는 방법에 대해서 코드를 구현해보도록 하겠습니다. 혹시 Column 추가 건에 대해서 궁금하신 분은 아래 포스팅을 참조하시면 됩니다.

 

 

 

Python Panda Seriese 로 Data 테이블화 하기 + Column 추가 및 Data 사칙 계산

안녕하세요 이번 포스팅은 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 Seriese를 이용한 Data 테이블하는 방법과 DataFrame화한 Data에 추가 Column 및 그 Column에 Data를 추가하는..

davey.tistory.com

 

Python Panda Column 삭제 및 원하는 행 Data 출력

안녕하세요 이번 포스팅은 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 Column을 삭제하는 방법 및 원하는 행의 Data를 출력하는 방법에 설명 드리도록 하겠습니다. 코드 구현

davey.tistory.com

 

 그럼 원하는 행을 추가해보도록 하겠습니다. 추가하고 싶은 행의 Index를 먼저 선언하고 모든 행에 대한 Value를 입력한다는 코드를 작성해보도록 하겠습니다. 아래 코드를 실행 시켜 보면 새로운 'sixth_row' 가 추가된 걸 확인 하실 수 있습니다.

 

여기에서 유의하셔야 할 부분이 추가되는 Value 값이 해당 df의 Column 개수와 일치하셔야 합니다. 아니면 에러 뜹니다.

 

# sixth_row 라는 Index를 가지는 행의 Data를 추가함.
df.loc['sixth_row',:] = ['Choi', 2020, 88, 'new_row1','new_row2','new_row3']

# 행이 추가된 DataFrame을 출력함.
print('==== 새로운 행을 추가 후 출력할 때 =====')
print(df)
==== 새로운 행을 추가 후 출력할 때 =====
             names  NumberofYear  Value   remarks
first_row      Kim          2014     90       NaN
second_row    Park          2015     86       NaN
third_row     Jang          2017     77       NaN
forth_row      Kim          2018     99       NaN
fifth_row   MC-Yoo          2019     75       NaN
sixth_row     Choi          2020     88  new_row1

Process finished with exit code 0

 

조건 값에 따라 Boolean 값으로 출력

 

: 이제는 기존에 가지고 있는 DataFrame화 한 Data를 가지고 조건 값에 맞게 Boolean 값이 출력되는 코드를 작성해보도록 하겠습니다. 간단하게 조건 값을 정수 값이 있는 Column을 기준으로 주도록 하겠습니다. 하나의 예제로 보여 드리면 2016년 이전의 행은 False를 출력하고 이후면 True 를 출력하는 코드를 작성해보도록 하겠습니다.

 

===== 조건 값에 맞게 Boolean 값으로 출력하는 코드 구현 =====

print(df['NumberofYear']>2016)
print()

 

 위 코드만 보면 엄청 심풀한데, 좀 분석을 해보면, 일단 'NumberofYear' 이라는 Column에 있는 년도를 다 비교해서 '2016' 보다 이전인 년도의 경우에는 'False'로 출력을 하고 이후는 'True'이 출력되는 걸 확인 하실 수 있습니다. 즉 여러가지 Data를 수치가 아닌 간단한 Boolean으로 보고 싶은 Data는 이렇게 처리가 가능합니다. 

 

==== 조건 값을 줘서 출력되는 값 형태를 Boolean으로 출력하는 결과 값 =====

first_row     False
second_row    False
third_row      True
forth_row      True
fifth_row      True
sixth_row      True
Name: NumberofYear, dtype: bool

위에서 줬던 조건은 심플한 조건이고, 이 조건을 여러가지 조건으로 줘서 마케팅이나 보험회사, 은행 같은 금융권에서 수치 데이터를 심플하게 개량해서 자신들의 입맛대로 사용하는 걸로 인지하고 있습니다. 참조하세요.

 

이상입니다. 지금까지 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 Column을 삭제하는 방법 및 원하는 행의 Data를 출력하는 방법에 대해서 포스팅을 작성하였습니다. 최고의 프로그래머가 되는 데 조금이나 도움이 되었으면 좋겠습니다. 항상 말씀드리지만 코드 분석이 끝나면 직접 해보시길 추천 드립니다. 그럼 이만 마무리 하도록 하겠습니다. 감사합니다.

 

[저작권이나, 권리를 침해한 사항이 있으면 언제든지 Comment 부탁 드립니다. 검토 후 수정 및 삭제 조치 하도록 하겠습니다. 그리고, 기재되는 내용은 개인적으로 습득한 내용이므로, 혹 오류가 발생할 수 있을 가능성이 있으므로, 기재된 내용은 참조용으로만 봐주시길 바랍니다. 게시물에, 오류가 있을때도, Comment 달아 주시면, 검증 결과를 통해, 수정하도록 하겠습니다.] 

 

관련 다른 글

 

728x90

댓글