데이터 셋(Data set)
Data set
- 자료 집합 또는 자료의 모임.
- 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치한다.
- 하나가 각각 여러 속성으로 묘사되는 관측치의 집합인 데이터로 구성
- 데이터 세트의 가장 기본 형식은 분석 기록(Analytics record)라고 부르는 n x m의 형태의 데이터 행렬.
- n은 관측지의 개수(행), m은 속성의 개수(열)
분석 기록은 보통 다양한 출저의 정보를 합쳐서 구축이 된다.
- 여러 데이터베이스
- 데이터 창고
- 다양한 형식의 파일(스프레드시트, csv)
- 인터넷 수집 데이터
- 소셜미디어 수집 데이터
'Data' 카테고리의 다른 글
데이터베이스 정규화 (0) | 2021.03.08 |
---|---|
결측치 처리(Missing Value) (2) | 2021.01.26 |
Dataframe, Series (0) | 2021.01.26 |
데이터 축소(Data Reduction) (0) | 2021.01.25 |
특징값 추출(Feature Extraction) (0) | 2021.01.25 |