'SAS'에 해당되는 글 1건

4주차.

지난주 까지만해도 끼리끼리만 놀던 사람들이
신입생 환영회로 안면을 좀 텄다고 서로 인사하느라 강의실이 시끌시끌하다.

오늘의 강의 주제는?

SPSS 간략 소개 및 교차분석.

1. SPSS 소개

Tip. SAS vs SPSS
- SAS: 통계학과나 회계학쪽에서 쓰는 진짜(?) 통계 패키지
- SPSS: 사회과학을 위한 통계 패키지
- 둘 다 미국 대학 연구소에서 만든 것
- SAS는 회사 복지 시설이 좋다고 ㅋㅋㅋ

사실 굉장히 궁금했고 갈등했고 고민중인 부분이다.
대학원에서는 온통 SPSS를 쓴다고 난리인데
국내외 마케팅 관련 공고들에서 통계하면 죄다 SAS를 다룰줄 아는가를 보고 있었기 때문

지난주 분산분석과 회귀분석 교수님께도 여쭤봤지만
역시 SAS를 공부해야 할듯.

우선 SPSS부터 마스터하자 --;


데이터를 만드는 것이 제일 힘든 과정임
*.sav 는 SPSS 데이터 파일
*.spo 데이터를 통해 계산해서 나온 출력 파일

SPSS의 장점
사용자가 통계적 지식이 없을 때 신경 써야 할 것들을 디폴트로 잡아준다. (결과 표 양식 등)

일련 번호를 매기는 것이 굉장히 중요함
나중에 에러가 발생했을 경우 추적 할 수 있음
데이터 수집 후 제일 먼저 해야 하는 것이 일련 번호!

금주과제
공유자료실에 올라와 있는 자료에서
틀린 곳을 5군데 찾으시오.
목요일 밤 12시까지 가능한 찾아서 올려 주시기 바랍니다.
-> 코딩 미스를 찾으라는 것!
-> 기숥통계, 빈도분석에서 찾을 수 있을 것임
=> 데이터 활용에 익숙해지는 것이 목적임

syntax에 대해서 공부하면 좋다!
- 변수를 변환해야하는 작업이 반복적으로 있을 때(기타 작업에도 사용되겠지?)
-> 일종의 매크로?라고 보면 맞을까?
-> 반복된 작업을 프로그래밍화해서 한 번에 실행하는 것


다시 강의로...
결국 spss설치만 50분 소요, 과제에 대한 대략적인 설명 까지해서 1시간 반이 날아갔넹.
강의실 마다 spss 안깔아준 학교 탓이 크다.


교차분석(카이자승 분석)
- '빈도'를 가지고 분석하는 것이라 심리학에서는 잘 안씀.
- 마음대로 쓸 수 있는 칸은 1개 밖에 없었음. 이것이 자유도. df=(a-1)x(b-1)
- 자유도는 언제나 분석대상 데이터에서 자유롭게 움직일 수 있는 값이다.

- 카이자승 =  [(관찰빈도-기대빈도)/기대빈도] 의 자승합

- 영가설: 성별과 취업여부 관계가 없다.
- 영가설을 판단하기 위한 임게치가 필요함
- 카이자승의 분포는 자유도에 따라서 달라진다.

우리가 하는 것은 통계치를 얻는 것이다.
영가설 기각 채택을 해야하는데 기각 채택은 모집단에 대한 것임
.05 수준에 해당하는 이 높이가 .05 수준에 해당하는 어떤 특정한 값이면 
그것을 못넘어 갔을 경우 영가설 채택, 넘어갔을 경우 기각

어느 셀 하나가 유독 튀면, 카이스퀘어값은? 
- 기대빈도와의 차이가 커질테고, 카이스퀘어값도 커짐
- 어느 한 셀이던지 간에 5미만의 값을 가진다면 카이스퀘어 값은 신뢰롭지 않다.
-> 카이스퀘어에서는 셀당 빈도가 어떠냐에 따라서 차이가 날 수 있음

기대빈도와 실제빈도와의 차이...카이스퀘어값을 통해서 의사결정을 하게 됨
카이검증에도 통계학의 모든 가설 검증 메카니즘이 다 들어가 있음
* 참고: 구조방정식 모형에서는 카이스퀘어 값이 작을 수록 좋은 것임


오늘도 약간 의외의 강의 내용.
보통 책에서는 그 중요성 강조되지 않는 카이분포, 교차분석에 대해서만 1시간여를 할당하셨다.

하지만 통계에서 안중요한 건 없다고 생각한다.
모든게 베이스가 된다. 하나하나 차곡차곡.

이번주 정복 과제는 ==> 카이스퀘어, 교차분석, SPSS 데이터 다루기!

이번주는 꼭 복습을!!!



블로그 이미지

브라보맨

,