티스토리 뷰
반응형
2. 추론통계
- 점 추정 = 모수를 특정한 수치로 표현 point estimation
- 조건 :
- 불편성, 모든 표본 추정량의 기댓값 = 모집단의 모수
- 효율성, 추정량의 분산이 작을수록 좋음
- 일치성, 표본 크기 커지면 추정량이 모수와 같아짐. 표본의 크기가 모집단 규모에 근접해야 함.
- 충족성, 추정량은 모수에 대해 모든 정보를 제공. 표본이 충분히 모집단의 대표성을 가져야 함
- 사용하는 통계량 : 표본평균, 표본분산, 중위수, 최빈값
- 조건 :
- 구간추정 = 모수를 범위로 추정.
- 신뢰수준
- 신뢰구간 : 평균 -z X 표준오차 ≤ 평균 ≤ 평균 + z X 표준오차
- 가설검정
- 귀무가설 : 현재까지 주장되어온 것.
- 대립가설 : 입증하고자 하는 것. = 연구가설
- 가설을 기각/채택하는 기준은 유의수준 (a, 제1종오류)
- 귀무가설을 기각한 경우 통계적으로 유의하다
- 유의수준 몇%에서 기각했는지 보고 가설이 유의한지 아닌지 결정
- 검정 통계량
- 가설 검정의 대상이 되는 모수를 추론하기 위해 사용되는 표본 통계량
- 귀무가설이 참이라는 전제하에 모집단에서 추출한 확률표본의 정보를 이용해 계산
- p-값
- p값이 작을수록 귀무가설을 기각할 증거를 충분히 제공한다는 뜻임.
- 유의미한 p값일때 p < a 면 귀무가설 기각함.
- 가설 검정
- p값이 유의수준보다 작다 = 검정통계량의 값이 나타날 가능성이 작다 = 귀무가설 기각 = 대립가설 채택
- 양측검정 : 모수가 특정값과 같은지
- 단측검정 : 모수가 특정 값보다 큰지 작은지
- 가설 검정 오류
- 표본 기반으로 모집단에 대한 결론을 내리는 것이기 때문에 오류 가능성이 있음
- 제1종 오류 : 귀무가설이 사실인데 거짓이라고 판정 (유의수준 a, 신뢰수준)
- 제2종 오류 : 귀무가설이 거짓인데 사실이라고 판정 (베타 수준, 검정력
- 제1종 오류를 범할 최대 허용 확률을 유의수준이라고 함. 귀무가설을 기각할 수 있는 최소의 유의수준을 유의확률이라고 함.
반응형
'Data Analyst > 빅데이터 분석기사' 카테고리의 다른 글
[2.2 데이터 탐색_기초] 상관관계, 수치형, 순서형, 명목형 속성에 따른 상관성 분석 종류 (0) | 2022.03.21 |
---|---|
[2.1 데이터 전처리_분석변수 처리] 불균형 데이터 처리 (0) | 2022.03.21 |
[2.1 데이터 전처리_분석변수 처리] 차원 축소, 파생변수 생성, 변수 변환 (0) | 2022.03.21 |
[2.1 데이터 전처리_분석변수 처리] 변수 선택 , 지도 방식, 비지도 방식 (0) | 2022.03.21 |
[2.3 통계 기법의 이해] 기술통계 (0) | 2022.03.21 |