'심리통계'에 해당되는 글 2건

1. 통계 방법론에 대한 정리

t검증 -> one-way ANOVA -> two-way ANOVA -> MANOVA

             (공변량분석)

상관분석 -> 단순회귀분석 -> 중다회귀분석 -> 경로분석
                                                                                  ->  구조방정식                                                  
                                                            -> 요인분석

빈도분석 -> 교차표분석



2. 변수

독립변수        종속변수

범주               연속             ANOVA

연속               연속             회귀

연속               범주             판별

범주               범주             잠재계층분석

ex) 보험료 수가 계산, 대출 받을 때 이자 계산 모두 회귀분석임


3. 상관관계

Galton : 찰스 다윈의 조카. 진화론을 숫자로 증명해보고자 했음
            Galton의 수제자가 Pearson 임.

             '아버지와 아들의 키' 이런 주제를 연구했음
             '아버지가 190, 어머니가 185면, 2세가 190을 넘을 확률이 높을까?'
             -> 어머니 아버지대에서 그 수치는 굉장한 극단치. 예) 2%
             -> 아랫대에서 또다시 그러한 극단치가 나올 가능성은 별로 없다
             -> 평균으로의 회귀

변량: 한 변수가 평균으로부터 얼마나 흩어져 있느냐
상관계수: 표준화 시킨 두 변수 사이의 공변량., 두 변수 사이의 직선적 관계의 강도

y=ax+b

회귀분석은 회귀계수(a)를 찾는 것, 즉 우선 '선'을 찾는 것임.
x로 y를 예측하는데, 예측치인 y hat과 실제 y는 차이가 있음
y-y hat이 최소가 되어야 함. 그렇게 되는 선을 찾는 것

회귀분석 시뮬레이션 사이트(쵝오!!)


독립변인에 의해 설명되는 부분이 R squared
측정오차

예: 조직연결과 업무수행: 자기조정의 효과에 관한 연구
- 무차상관계수
- 부분상관계수


4. 산점도, 상관분석과 회귀분석

상관계수에서 *은 (유의도)는 큰 의미가 없음
상관계수의 절대값을 볼 것

회귀분석 결과
변량분석: 회귀모델의 확률적 유의성을 보는 작업


중다회귀
X는 왜 고정인가? 왜 오차가 없는가?
given variable
주어진 변수



다중공선성(multi-co-linearity): 독립변수들 사이에 상관관계는 없다

변수선택

모형선택: 전방선택, 후방소거, 단계별회귀





음..역시 무언가 순식간에 훝고 지나간 느낌이랄까..

ㅎㅎ열심히 나머지 해야지 ㅎㅎ
블로그 이미지

브라보맨

,
회귀

1. 독립변인과 종속변인의 관계
 - 독립 변수: 예언, 예측, 설명 변수
 - 종속 변수: 준거, 성과 변수
 - 정적관계, 부적관계

2. 회귀와 상관
  - A 와 B의 관계에서 cause/effect 를 보면 좋지만, 그것이 쉽지 않으니까,
  - regression/correlation 을 보는 것임

Tip. 그래서 분석시에는 항상 regression/correlation 을 먼저해보는 것이 더 용이 할 수 있음

3. 회귀분석의 목적
  - 특정 변수를 통제했을 때 다른 변수의 효과를 보는 것

Tip. 통제란? 
 - 초기값이 동일 한 것

Tip. 베타값이 많다고 좋은 모델인 것은 아님, 
 -> 문헌리뷰를 통해서 베타값을 논리적으로 줄여야 함!

4. ANOVA와 회귀분석의 차이
 - ANOVA: X변수가 없으므로 cause & effect 의 관계가 아님
 - Regression: 원인과 & 결과의 관계
   - 1차 함수와 차이: e(에러)값을 가지고 있다는 것.

5. 단순회귀모형
 - 모수를 추정하는 방법에는 여러가지가 있음. ex) 베이지안, 최대우도...
   -> 그 중에 가장 쉬운 방법이 최소자승값(OLS)을 이용하는 것

6. 공분산과 상관의 차이
 - 공분산: 표준화된 값이 아님, 원래 값을 그대로 가짐
 - 상관: 표준화된 값 -> 비교가능. but 표준화 과정에서 조작을 하게 되므로 원래의 값을 잃게 됨

7. 단순회귀모형의 검증
 - precision: 얼마나 추정되었는가?
 - 모형의 설명력: R자승

8. ANOVA Table
 - 모형 전체에 대한 정보
 - source of variation은 2개: 모형, 오차

9. 회귀계수검정결과 Table
 - 각 베타1과 베타0의 효과를 검정
 - 베타0: 대부분의 사회과학에서 의미 없음. 변수(키, IQ)가 0인 경우는 없기 때문. 예외> 사전/사후 검사
 - 베타1: 의미있음

10. ANOVA와의 차이
 - ANOVA: 단순한 차이를 보는 것임
 - Regression: Relationship(영향, 효과)을 보는 것임.
 - 종속변수가 비연속변수인 경우 단순회귀분석이 안됨....


아. 즐거운 통계여~! 

내 너를 가열차게 사랑하리.


블로그 이미지

브라보맨

,