목록Self Study (5)
Shonny Data

표본분포와 중심극한정리 | 표본분포 (Sample Distribution) 표본에서 도출되는 통계량에 대한 확률분포 표본분포는 모수를 추정하기 위한 표본 통계량의 확률분포 (여러 번 측정) ① 문제 정의 ② 표본을 2개, 3개 추출하는 경우의 수는 각각 10가지씩 나옴 ③ 표본 평균들의 최고와 최저점의 차이가 2개는 크고 3개는 적고 → 요 차이를 오차라고 한다 ④ 각각의 오차를 계산 | 표본평균의 오차 : 표본으로부터 모수를 축정했을 때, 모수와 통계량 간의 차이 - 2개로 했을 때의 오차의 폭 - 3개로 했을 때의 오차의 폭 폭 간의 높이 차이가 다르다 (오차가 적은 것을 선택해야 한다) | 중심극한정리 (CLT) Central Limit Theorem 표본의 갯수(n)가 충분하다면 모수를 모르더라도..

표본의 분포 | 정규분포 표본분포 중 가장 단순하면서 많이 나타나는 형태의 분포 어떤 사건이 일어난 빈도(Frequency)를 계산하여 그래프로 나타내면 중심(평균)을 기준으로 좌우가 대칭되는 분포 | 표준화 단순한 현상은 정규분포만을 이용하여도 가능 복잡한 관계에 대한 분석 결과가 필요하므로, 여러 특성에 대한 분석 결과들을 서로 비교할 수 있도록 만드는 과정 표준화란 기준점을 동일하게 맞추어 조사자가 자료들을 쉽게 비교할 수 있도록 만드는 과정 표준정규분포는 평균은 0, 표준편차는 1로 만든다. | Z분포와 T분포 Z분포 T분포 시그마 - 모집단의 표준편차 S - 표본표준편차 자유도 Z분포와 T분포의 차이 · 자유도가 작아지면 t분포의 그래프가 점점 완만 · t분포의 표본의 숫자가 늘어나면 점점 z분..

통계량(중심) | 최빈값 (mode) 발생빈도가 가장 높은 값 자료들 중 가장 많은 값 극단값에 영향을 받지 않으며 2개 이상 존재 가능 | 중앙값 (median) 크기 순으로 정렬된 자료에서 가운데에 위치하는 값 극단값에 영향을 받지 않음 중앙값이 없을 경우에는 가운데 두 값을 더해서 평균을 낸 값을 중앙값으로 정의 | 산술평균 (Arithmetic Mean) 모든 자료의 값을 더하여 자료의 수로 나누어준 값 모든 값을 반영하여 결과가 나오므로 극단값에 영향을 받는다 | 가중평균 (Weighted Mean) 자료의 중요성이 각기 다를 경우 중요도에 따라 가중치를 부여한 평균 | 기하평균 (Geometric Mean) 자료가 성장률, 증가율 등 앞 시점에 대한 비율로 나타난 경우 유용한 통계량 음수가 아..

| 통계학이란? 통계는 데이터의 수집, 분석, 추론, 요약 등의 방법론을 배우는 학문 통계학은 수량적인 비교를 기초로 많은 사실을 관찰하고 처리하는 방법을 연구하는 학문 기술통계 (Descriptive Statistics) 표본에 대한 분석 결과의 각종 수치들을 활용하여 집단의 특성을 설명 추론통계 (Inference statistics) 표본을 활용하여 모집단의 특성을 나타내는 것 ex) 표본이 이렇게 때문에 전체적인 것들도 이렇게 될 것이다 | 통계분석과 그 한계 수집 → 정제 → 추정 → 검정의 과정을 따른다 (1) 수집 - 조사 과정에서 자연스럽게 수집 - 조사자가 특정 목적에 맞는 자료를 얻기 위해 설계한 수집 도구 이용 (2) 정제 - 분석에 적합한 자료를 선별 - 적합하지 않은 자료는 삭제 ..