인공지능을 좋아하는 곧미남

데이터 전처리 방법(지속적으로 업데이트) 본문

데이터분석 및 전처리방법

데이터 전처리 방법(지속적으로 업데이트)

곧미남 2022. 3. 7. 11:39

데이터 전처리를 통해 중복되지 않고 일관적으로 대표할 수 있는 데이터 셋을 구축하는 것이 목적입니다. 이를 통해 AI 학습 모델의 정확도는 월등히 높아질 것입니다.

 

< INDEX >

1. 시계열 데이터 누락, Unordered 및 중복 데이터 일반화


1. 시계열 누락, Unordered 및 중복 데이터 일반화

  • 데이터가 누락되거나 정렬되지 않고 중복되는 데이터로 구성되어 있을때, 백분위수를 사용하여 데이터 셋을 일반화 할 수 있습니다.
  • 백분위수는 전체에서 %별로 데이터를 라벨링 할 수 있습니다. 

 

 

Comments