Data Analyst
[통계량 계산, 확률론 기본] 표본분산, 불편분산, 집합, 사상, 주관확률 = 베이지안확률, 조건부확률, 독립
Data Analyst / PO
2022. 3. 17. 17:57
반응형
7. 통계량 계산
- 표본
- 평균값 = 산술평균 (아는 데이터의 대푯값)
- 기댓값 = 확률 X 그때의 값 (모르는 데이터의 대푯값)
- 모평균과 표본평균
- 분산(표본분산) = 편차의 제곱합 / N
- 분산(불편분산) = 편차의 제곱합 / N-1
- 표본분산이 편향성을 가지는 이유.
- 표준편차 = 불편분산에 제곱근. = Standard Deviation
8. 확률론 기본
- 집합
- 요소
- 집합의 2가지 표현 A = { a; a (- Z 그리고 0 ≤ a ≤ 5 }
- 부분집합
- 벤다이어그램
- 교집합과 합집합
- 차집합
- 공집합
- 전체집합
- 여집합
- 표본점, 표본공간, 사상
- 표본점 (w) = 일어날 수 있는 가능한 결과. = 요소
- 표본공간 (Ω) = 표본점 전체의 집합. = 전체집합
- 합사상
- 결합사상
- 근원사상 = 단 1개의 표본점(요소)만 있고, 그 이상 분해가 안되는 사상
- 복합사상 = 2개 이상 표본점을 가지고, 2개 이상의 근원사상으로 분해가 가능한 것
- 공사상 = 표본점 없는 경우.
- 표본점 : w1, w2, w3... w6 표본공간 : {1,2,3,4,5,6} 복합사상 : 짝수가 되는 사상 A = {2,4,6}, 홀수가 되는 사상 B = {1,3,5} 근원사상 : 1의 눈이 나오는 사상 C = {1} , 2의 눈이 나오는 사상 D = {2}
- 배반사상
- A,B의 교집합이 공집합이고 사상간의 겹침이 없을때 서로 배반사상이라고 부름
- 짝수가 되는 사상과 홀수가 되는 사상은 배반사상임.
- 주사위를 던졌을 때 추정 가능한 여러가지 확률분포
- 확률의 공리주의적 정의(2) P(Ω) = 1 (표본공간 = 전체집합)3개 공리를 모두 만족해야 확률이라고 함.
- (3) 배반사상 A1, A2...에 대해 P(A1 합 A2 합...) = P(A1) + P(A2) +...
- (1) 모든 사상 A에 대해 0 ≤ P(A) ≤ 1
- 빈도에 의한 확률 해석
- 확률을 상대도수의 극한값이라고 간주함. 도수=사상이 발생한 횟수
- 주관확률 = 베이지안확률
- 확률을 상대도수의 극한값이라고 가정하면 누가 계산해도 동일값이지만,
- 주관확률은 개인이 주관적으로 확률을 할당함 = 베이지안 확률
- 확률의 덧셈정리
- a합b = a+b - ab교
- 조건부 확률
- 사상 B가 발생한 조건에서 사상 A가 발생할 확률.
- = P(A|B) = P(A교B) / P(B)
- A=3의배수= {3,6} , B= 5이상의수 = {5,6}
- P(A|B) = 5이상 나온다는 조건에서 3의 배수가 나올 확률
- = P({6}) / P({5,6}) = 1/6 / 2/6 = 1/2
- 확률의 곱셈정리
- P(A교B) = P(B) X P(A|B)
- 3의 배수이면서 5이상인 수가 나올 확률은, 5이상인 수가 나올 확률 X 5이상의수가 나올때 3의배수가되는 확률
- 독립
- P(A교B) = P(A) X P(B) 가 성립하면 A와 B는 독립.
- P(A|B) = P(B) 랑 같은 의미임.
- 짝수가 나오는 사상과 3의 배수가 나오는 사상은 독립임.
반응형