본문 바로가기

Data

데이터 분석 및 이해

데이터 분석 및 이해

 

<전처리 (Preprocessing)>

 

원본 데이터를 분석에 사용하기 좋은 형태로 바꾸는 것.

 

1. 전처리 프로그램 구현.

2. 데이터 불러오기.

3. 불필요한 데이터 필터링.

4. 원하는 형태로 변환.

5. 분석에 적합한 형식으로 저장.

 

주요 대상

 

1. 결측값(Missing Value) : 누락된 값, 비어 있는 값.

2. 이상치(Outlier Value) : 데이터 샘플에서 관찰된 값이 다른 관측값과 거리가 있을 때

3. 중복값(Redundancy Value) : 불필요한 반복

 

<탐험적 데이터 분석 Exploratory Data Analysis = EDA> 참고

 

- 주어진 데이터를 다양한 각도에서 들여다보고 좀더 잘 이해하기 위해 노력하는 과정.

- 데이터를 직접 가공하며 데이터에 대한 직관을 키운다.

- 시각화를 통해 데이터가 어떻게 이루어져 있는지 어떤 성질이 있는지 여러 가설을 세울 수 있다.

 

<특정값 추출 Feature extraction> 참고

 

- 데이터의 여러 특징을 나타내는 값을 가공해 저장하는 일.

 

'Data' 카테고리의 다른 글

데이터와 질문  (0) 2021.01.25
Tidy data  (0) 2021.01.25
탐색적 데이터 분석 단계  (0) 2021.01.25
탐색적 데이터 분석 Goals of EDA  (1) 2021.01.25
데이터 과학  (0) 2021.01.18