데이터 인코딩 썸네일형 리스트형 [파이썬/머신러닝] 사이킷런 기초다지기 - 3 [파이썬/머신러닝] 사이킷런 기초다지기 - 3 데이터 전처리 머신러닝 알고리즘은 데이터에 기반하고 있기 때문에 어떤데이터의 입력을 가지느냐가 아주 중요합니다. 사이킷런의 머신러닝 알고리즘을 적용하기 전에 데이터에 대해 미리 처리해야 할 기본사항이 있습니다. - 결손값(Null, NaN)은 허용되지 않음 - 문자열 값을 입력값으로 허용하지 않음 따라서 결손값들은 각 경우에 맞게 평균값으로 변환되거나 Drop 하는 형태로 변경해 주어야 합니다. 그리고 문자열 값을 입력하는 것을 허용하지 않기 때문에 숫자형으로 변환해야 합니다. 여기서는 레이블 인코딩, 원-핫 인코딩 순서로 예를 들어 보겠습니다. 레이블 인코딩(Label Encoding) from sklearn.preprocessing import Label.. 더보기 이전 1 다음