사회조사분석사

사회조사분석사 2급 필기 사회통계 정리

에메랄드82 2020. 7. 9. 22:34
반응형

통계의 개념

기술통계: 자료를 수집하고 정리, 요약한다.

추론통계: 기술통계 다음으로 이루어지며 자료를 통하여 추측한다.

비표본오차: 표본추출과정에서 발생하는 누락, 오기, 관찰 실수로 인한 오차

                (표본의 크기가 증가하면 같이 증가하는 경향)

표본오차: 표본을 통해 전체를 해석하는 과정에서 발생하는 오차

모수: 모집단의 특성을 나타내는 수치

 

도수분포표

도수: 각 계급구간에 해당하는 빈도수

상대도수: 각 계급구간의 도수를 전체도수로 나눈 값

누적도수: 각 계급까지의 도수를 합한 값

(도수분포표는 자료의 일부 손실이 발생할 수 있다.)

 

파괴조사: 반드시 표본조사로 시행 (자동차 파괴 실험 등)

 

통계분석의 목표

자료를 수집하고 자료를 요약한다.

변수들간의 인과관계를 파악한다.

자료를 바탕으로 미래 수준을 예측한다.

 

중위수: 유일한 값, 자료의 수가 짝수일 경우 가운데 위치하는 두 개의 수를 평균한 값

최빈수: 명목 자료의 대표 값, 모든 자료가 동일한 빈도를 가질 것

 

산포도

자료가 평균을 중심으로 얼마나 흩어져 있는지를 나타낸다. (범위, 분산, 표준편차)

 

분산: 개별 자료와 평균과의 거리를 제곱 한 평균의 값

표준편차: 분산의 양의 제곱근, 평균과 단위가 동일

 

분포의 왜도

극단적인 값에 영향을 많이 받는 대표치는 평균이며 분포가 오른쪽 꼬리를  갖는 경우 극단적으로 큰 값이 존재하는 것이며 왼쪽으로 꼬리를 갖는 경우 극단적으로 작은 값을 가지며 음수이다.

 

상호 배반사상: P(A∩B)=0

 

베이지안 법칙

사전적 확률이 주어지면 이를 활용, 사후적 확률을 구하는 방법 (결과를 가지고 원인을 구한다.)

 

공분산

Cov[XY]= E[XY] -E[X]E[Y]

 

상관계수

상관계수의 절대값이 1에 가까울수록 두 변수의 선형관계는 높다. (-1에서 1)

공분산을 두 변수의 표준편차의 곱으로 나눈 값

상관계수가 0일 경우 선형관계만 없다는 것을 의미

 

연속확률변수: 특정값을 가질 확률은 반드시 0 이므로 구간으로 계산

 

정규분포

정규분포의 확률밀도 함수는 평균을 중심으로 좌우대칭

 

t분포

평균이 0이며 좌우대칭이나 분산은 자유도에 의해 달라짐

(모집단이 정규분포이고 소표본일 경우 )

자유도가 커질수록 표준정규분포에 근접

소표본에서는 자유도 n-1

 

카이제곱 분포

표본분산의 분포를 설명

항상 0의 값을 가지며 자유도에 따라 모양이 달라진다

 

모평균의 구간추정

대표본일 경우 표준정규분포로 추정 가능

구간추정의 중심 값은 표본평균

 

모분산의 구간추정

자유도 n-1의 카이제곱 분포 활용

신뢰계수는 두개의 값으로 나타냄

 

신뢰구간

모수가 포함될 확률, 상한치와 하한치에 해당하는 영역

 

Z검정

모분산이 알려져 있고 정규모집단, 모집단의 분포를 모르고 모분산이 알려져 있으며 대표본, 모집단의 분포와 모분산을 모르지만 대표본.

 

p값

확률 , 귀무가설이 기각될 최소의 유의수준, 주어진 유의수준보다 p값이 작아야 귀무가설이 기각된다.

 

귀무가설과 t분포

가설검정 시 귀무가설은 μ1-μ2=0

t분포를 이용, 두 모집단의 모평균을 비교하는 경우 등분산을 가정

등분산을 가정할 경우 가중평균된 분산을 유도할 수 있고 자유도는 n1+n2-n2

 

F검정

양측, 좌측 우측검정 모두 가능 ( 사실상 우측 검정만)

표본분산의 비율로 설정, 분자는 항상 표본분산이 더 큰값

 

대응표본

각각 다른 상황의 표본의 차이를 설정해야 하므로 반드시 자료는 쌍

 

분산분석

각 모집단의 모분산은 모두 같다고 가정하고 정규분포를 따르며 2개 이상의 요인에 의해서도 구분이 가능 (무작위, 독립표본)

 

총변동 도출= 주효과+ 교호효과+ 오차

 

회귀계수

단순회귀계수 = 회귀계수 2개

α는 절편, β는 기울기

기울기는 독립변수에 의한 종속변수의 민감도

가설검정을 통해 유의미한가를 알수 있음

절편은 독립변수 X가 0일 때 종속변수의 값

 

결정계수= 0과 1 사의 값

 

요인점수

회귀분석과 판별분석을 위한 독립변수로 사용

 

 

 

 

 

 

 

반응형