안녕하세요 이번 포스팅은 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 중복되지 않는 값 출력 및 lamda 문 이용하는 방법에 대해서 설명드리도록 하겠습니다.
코드 구현을 위한 Source Data DataFrame 화 하기
: 일단 DataFrame을 구현하기 위한 Source Data를 구현해보도록 하겠습니다. 이전 포스팅에서 설명드린 것처럼 DataFrame을 구현하기 위해서는 Dictionary로 구현되어 있는 Data Source가 필요합니다. 아래와 같이 예시 Data를 구현해보도록 하겠습니다. (참고로 이 부분은 이전 포스팅에서 똑같은 Source Data를 사용하고 있다는 걸 참조해주세요.)
# 필요한 패키지를 먼저 선언을 합니다.
import pandas as pd
import numpy as np
# 상관계수와 공분산 구하기 위해 새로운 DataFrame 선언하기
df2 = pd.DataFrame(np.random.randn(8, 5), columns=["Column1", "Column2", "Column3", "Column4", "Column5"], index=np.arange(8))
▼ 위의 Data는 예시로 한 것이고, Source Data는 원하시는 내용으로 다시 수정해서 구현하셔도 됩니다.
중복되지 않은 값 출력하는 코드
: 특정 Column에서 중복되지 않은 Value만 출력하는 코드를 구현해보도록 하겠습니다. Data를 다루게 되면, 중복되지 않는 값을 빠르게 파악하고 싶을 때 사용하시면 유용할 거 같습니다. 코드 자체는 간단하니 코드와 결과 값을 한꺼번에 보여드리겠습니다.
▼ 결과 값을 보시면, List 형식으로 출력되는 걸 확인 하실 수 있습니다.
# Column1 Value 중에 중복되지 않은 Value만 출력하는 코드
print(df2['Column1'].unique())
# Column1 Value 중에 중복되지 않은 Value만 출력되는 결과 값
# List 형식으로 출력됨.
[ 0.06338947 1.18202291 -0.1298279 -0.88653135 0.79481879 -0.21689688
1.33672448 0.26237793]
lamda 문을 이용해서 원하는 값 출력하기
: DataFrame으로 구성한 Value를 lamda 문을 이용해서 원하는 값을 출력하는 코드를 구현해보도록 하겠습니다. lambda 문을 이용하여 원하는 값을 출력하는 코드 예제로 각 Column별로 최대값에서 최소값을 빼는 코드를 구현해보도록 하겠습니다.
# lambda 문을 이용하여 원하는 값을 출력하는 코드를 구현
# 각 Column별로 최대값에서 최소값을 빼는 코드를 구현
func = lambda x: x.max() - x.min()
print(df2.apply(func, axis=0))
▼ 위 코드를 실행을 하면 아래와 같이 Column 별로 최대값에서 최소값을 뺀 값을 출력하는 걸 발견 하실 겁니다.
Column1 0.932199
Column2 2.036456
Column3 3.868122
Column4 3.548492
Column5 1.830340
dtype: float64
이상입니다. 지금까지 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 중복되지 않는 값 출력 및 lamda 문 이용하는 방법에 대해서 포스팅을 작성하였습니다. 위 코드를 이해하셨으면 실제로 파이 참에서 실행을 해보시는 걸 추천드립니다. 그럼 최고의 프로그래머가 되는 데 조금이나 도움이 되었으면 좋겠습니다. 이만 마무리하도록 하겠습니다. 감사합니다.
[저작권이나, 권리를 침해한 사항이 있으면 언제든지 Comment 부탁드립니다. 검토 후 수정 및 삭제 조치하도록 하겠습니다. 그리고, 기재되는 내용은 개인적으로 습득한 내용이므로, 혹 오류가 발생할 수 있을 가능성이 있으므로, 기재된 내용은 참조용으로만 봐주시길 바랍니다. 게시물에, 오류가 있을 때도, Comment 달아 주시면, 검증 결과를 통해, 수정하도록 하겠습니다.]
관련 다른 글
'파이썬 (Python) > Pandas' 카테고리의 다른 글
Python Panda 상관계수와 공분산 구하기, DataFrame Sort 하는 방법 (0) | 2021.06.02 |
---|---|
Python Panda Column 삭제 및 Data 수치 합산하는 방법 (0) | 2021.06.02 |
Python Panda NaN 값 처리 및 확인 하는 방법 (0) | 2021.06.02 |
Python Panda Index를 날짜 간격으로 선언, nan 값 Sort 하는 방법 (0) | 2021.05.12 |
Python Panda Random Data를 이용한 DataFrame 구현하는 방법 (0) | 2021.05.06 |
댓글