1. 지도학습 모델을 학습하기 위한 훈련데이터를 생성
  2. 지도학습을 위한 데이터 엔지니어링 방법을 이해하고 올바른 특성을 만들어 낼 수 있다

1. 정의

분석을 하거나 모델을 만들기 전에 데이터를 사용하기 쉽게 변형하거나 맵핑하는 과정

2. 종류

  1. 데이터프레임 만들기

  2. Tidy Data

    1. 원하는 대로 데이터 정렬

    스크린샷 2022-01-19 오전 2.11.40.png

    스크린샷 2022-01-19 오전 2.11.35.png

  3. Group Data (groupby 사용)

    1. 데이터 그루핑

    스크린샷 2022-01-19 오후 1.54.41.png

  4. Summarize Data

    1. 데이터셋에 대한 요약 / 정보 얻기 (.describe, .shape 등)
  5. Make New Variables

  6. Combine Data sets

    1. 데이터셋을 합쳐 새로운 데이터셋 만들기 (merge)
  7. 결측치 채우기

  8. Plotting

출처 : https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

스크린샷 2022-01-19 오후 1.55.19.png

스크린샷 2022-01-19 오후 1.59.40.png