본문 바로가기
파이썬 (Python)/Pandas

Python Panda Random Data를 이용한 DataFrame 구현하는 방법

by ★√★ 2021. 5. 6.

안녕하세요 이번 포스팅은 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 특정 조건 값에 맞춰서 Data 출력 및 조건 값에 맞게 도출되는 값 수정하는 방법까지 설명 드리도록 하겠습니다. 

 

python-pandas-random-dataframe-썸네일
python-pandas-random-dataframe

 

코드 구현을 위한 Source Data DataFrame 화 하기

 

: 일단 DataFrame을 구현하기 위한 Source Data를 구현해보도록 하겠습니다. 이전 포스팅에서 설명 드린 것처럼 DataFrame을 구현하기 위해서는 Dictionary로 구현되어 있는 Data Source가 필요합니다. 아래와 같이 예시 Data를 구현해보도록 하겠습니다. (참고로 이 부분은 이전 포스팅에서 똑같은 Source Data를 사용하고 있다는 걸 참조 해주세요.)

 

# 필요한 패키지를 먼저 선언을 합니다.
import pandas as pd
import numpy as np

# 예시 Source Data를 구현하여, pandas를 이용하여 DataFrame화 시키는 코드입니다.
data = {"names": ["Kim", "Park", "Jang", "Kim", "MC-Yoo"],
"NumberofYear" : [2014, 2015, 2017, 2018, 2019],
"Value": [90, 86, 77, 99, 75]}
df = pd.DataFrame(data, columns=["names", "NumberofYear", "Value", "remarks"],
index=["first_row", "second_row", "third_row", "forth_row", "fifth_row"])

▼ 위의 Data는 예시로 한 것이고, Source Data는 원하시는 내용으로 다시 수정해서 구현하셔도 됩니다.

 

Random Data를 이용하여 DataFrame 만드는 방법

 

: 이전 Pandas DataFrame 관련해서 Data를 만드려고 하면 어떤 Column과 각 Column 별 행 단위로 Value를 선언을 해주었습니다. 그런데 이런 작업이 귀찮고, 그냥 숫자로만 DataFrame을 구성을 하려고 한다면 random 한 Value 값으로 행과 열의 갯수만 가지고도 구현이 가능합니다.

 

▼ 즉 이것 저것 다 신경쓰기 싫고 그냥 단순한 DataFrame만 만들고 싶다고 하면 아래와 같이 random 값으로 DataFrame 구성이 가능하다고 이해하시면 됩니다. 

# Random Value를 6 행 4열의 DataFrame을 구현하는 코드

print('===== 이것 저것 신경쓰기 싫을 때 무작위 값으로 DataFrame 만드는 법 ====')
df = pd.DataFrame(np.random.randn(6,4))
print(df)

 

 위의 코드를 구현을 하면 random value를 가진 6행 4열의 DataFrame이 구현이 되는 걸 확인하실 수 있습니다. 기존에 Modeling을 하였고 무작위 random 숫자 value로도 테스트가 가능할 경우에 유용하게 사용하시면 될 거 같습니다. 

===== 이것 저것 신경쓰기 싫을 때 무작위 값으로 DataFrame 만드는 법 ====
          0         1         2         3
0  0.803901  1.293697  1.027687 -0.050752
1 -1.558667  0.238241  2.088632  0.813190
2  1.157608 -0.704973 -0.445599  0.694575
3  0.689937 -0.238306 -0.514838  0.322554
4  0.631926  1.195770 -0.273247 -0.672003
5  1.056096 -0.675526  0.026584 -0.130922

Process finished with exit code 0

이상입니다. 지금까지 Python의 Pandas 패키지를 이용한 DataFrame 함수를 활용하는 방법 중에 Random Data를 이용하여 DataFrame 만드는 방법에 대해서스팅을 작성하였습니다. 최고의 프로그래머가 되는 데 조금이나 도움이 되었으면 좋겠습니다. 항상 말씀드리지만 코드 분석이 끝나면 직접 해보시길 추천 드립니다. 그럼 이만 마무리 하도록 하겠습니다. 감사합니다.

 

[저작권이나, 권리를 침해한 사항이 있으면 언제든지 Comment 부탁 드립니다. 검토 후 수정 및 삭제 조치 하도록 하겠습니다. 그리고, 기재되는 내용은 개인적으로 습득한 내용이므로, 혹 오류가 발생할 수 있을 가능성이 있으므로, 기재된 내용은 참조용으로만 봐주시길 바랍니다. 게시물에, 오류가 있을때도, Comment 달아 주시면, 검증 결과를 통해, 수정하도록 하겠습니다.] 

 

관련 다른 글

728x90

댓글