[수학]/[데이터 과학을 위한 통계] 2

[데이터 과학을 위한 통계] 2. 데이터와 표본분포

[데이터 과학을 위한 통계] 2. 데이터와 표본분포 이전 포스팅에 이어서 이번 포스팅에서는 두 번째 챕터를 리뷰해보려고 합니다. 우선 다음의 교재를 공부한 내용을 개인적으로 정리하는 포스팅임을 밝힙니다. 글을 읽으시다가 이상한 점이나, 궁금하신 점은 편하게 댓글로 남겨주시면 감사하겠습니다. 1. 표본추출과 표본편향 표본이란? 표본은 모집단(큰 데이터 집합)으로 부터 얻은 데이터의 부분집합을 의미합니다. 임의표본추출은 모집단으로 부터 샘플을 무작위로 추출하는 과정을 말합니다. 임의표본추출은 복원추출과 비복원추출로 나뉩니다. 표본편향 표본편향이란 모집단에서 표본을 추출할 때(샘플링할 때) 표본을 잘못 선택하여 통계 분석이 왜곡되는 것을 의미합니다. 한 예시로, 1936년 미 대선에서 루즈벨트와 랜던의 경선에..

[데이터 과학을 위한 통계] 1. 탐색적 데이터 분석

[데이터 과학을 위한 통계] 1. 탐색적 데이터 분석 이번 포스팅은 한빛미디어의 "데이터 과학을 위한 통계"라는 교재를 공부한 내용을 정리하려 합니다. 다음의 교재를 참고했음을 미리 밝힙니다. 1. 정형 데이터와 비정형 데이터 데이터는 정형 데이터와 비정형 데이터로 나뉩니다 (반정형 데이터라는 개념도 있기는 합니다). 정형 데이터는 수치만으로 의미 파악이 가능한 데이터를 의미하는데, 예를 들어 키, 몸무게 데이터 등이 있습니다. 비정형 데이터는 텍스트, 이미지, 음성 등 정형화 되지 않은 데이터를 의미합니다. 정형 데이터는 크게 수치형 데이터, 범주형 데이터로 나뉩니다. 다시 수치형 데이터는 연속적인 값을 갖는 연속형 데이터, 이산적인 값을 갖는 이산형 데이터로 나뉘고 범주형 데이터는 0과1의 이진 값을..

반응형