전상진 서강대 교수

새학기가 시작됐다. 매년 이맘 때면 향후 진로를 고민하는 학생들이 연구실 문을 두드린다. 취업이나 진로와 관련된 학생들의 고민을 듣고 상담을 해주지만, 그래도 답답한 마음은 가시지 않는다. 취업 기회가 충분치 않은데다 그들의 고민이 좀더 일찍 시작됐어야 하는 것은 아닌가 하는 아쉬움 때문이다. 취업의 문호를 넓히는 것은 한국 사회가 안고 있는 과제다. 당장 취업을 앞둔 학생들이 그 과제를 담당할 수는 없는 일, 따라서 취업을 앞둔 학생들의 이른바 '경쟁력'에서 고민은 시작될 수밖에 없다.

과거에도 그랬지만, 오늘날 많은 학생이 시키는 대로 공부하고 성적에 맞춰 대학에 들어가서 주어진 커리큘럼에 따라 수동적으로 공부하는 것에 익숙하다. 그런데 어느새 사회라는 정글에 나가야 하는 시간이 된 것이다. 물론 최근의 캠퍼스는 과거와 다르다. 신입생들도 이른바 '스펙 경쟁'에 관심이 높다. 안타까운 점은 그것 역시 수동적이라는것이다. 남들이 하니까, 그것의 이유와 필요성을 절감하지 못하고 마치 대학입시를 위해 억지로 공부하듯 새로운 경쟁에 몰입한다.

뛰어난 어학 능력이나 자격증과 같은 스펙은 중요하다. 그러나 이들에게서 자율적 선택과 판단을 위해 주어진 상황을 객관적으로 인식하고 분석하는 습관은 찾기 쉽지 않다. 어릴 때부터 분석적이고 통계적인 마인드를 길러줘야 하는 이유가 여기에 있다. 통계는 과거에 대한 축적된 정보이고, 현재 한국 사회의 자화상이자 미래를 읽을 수 있는 지표다. 통계를 읽을 수 있다는 것은 사회와 역사를 읽을 수 있다는 의미이고, 그 속에 위치한 '나'를 읽을 수 있다는 뜻이기도 하다. 

반드시 기능적인 관점에서만 통계교육이 필요한 것은 아니다. 더 중요한 것은 바로 인성적인 측면이다. 서구의 중등교육 과정에서 시행되는 통계교육은 바로 이런 점을 겨냥한다. 통계의 기술적인 측면을 일방적으로 가르치는 것이 아니라 학생 자신의 실생활과 자신의 사회적 조건, 예를 들어 취업시장이나 기업의 활동, 그리고 국가의 재정 등에 관련된 통계들을 읽고 활용할 수 있는 능력의 함양이 통계교육의 목적이다. 이러한 통계교육이 지향하는 바는 크게 두 가지다.

먼저, 올바르게 대화하는 법이다. 통계를 통해 전체적 맥락을 읽어낼 수 있기에 '올바르게 대화할 줄 아는 소통형 인간'으로 성장하는 데 큰 도움이 된다. 자신의 의사를 우격다짐이나 폭력으로 관철하는 것이 아니라, 자신의 현실으 ㄹ포함한 객관적 사실에 입각해 문제를 '대화'로 풀어나갈 수 있는 '소통형 인간'을 만드는 데 기여할 수 있다는 점이다.

다음으로, 자율적 판단을 위해 상황을 객관적으로 인식하고 분석하는 습관과 능력의 함양이다. 통계의 설득력이 강한 만큼 특정한 의도에 따라 '조작'될 가능성도 크다. 통계가 '사실'을 반영하는 것은 분명하지만, 어떤 주장의 근거로 활용되는 과정에서 자료들이 의도적으로 누락되거나 비교의 준거점이 엉뚱한 것으로 설정되는 경우가 생길 수 있다. 통계교육은 잘못된 통계들을 가려 읽을 수 있는 능력을 배양해 왜곡된 논변에 휘둘리지 않도록 한다.

하지만 지금까지 한국 사회에서 통계는 전문가들의 영역으로 간주됐다. 일상생활 속에서 많은 통계 자료들을 만나면서도 통계를 남의 일로 간주하는 경향이 강하다. 그러나 통계를 잘 만드는 일 못지않게 중요한 것은 통계를 읽고 활용할 수 있는 능력이다. 어릴 때부터 이러한 체계적인 교육이 이뤄질 때 자녀들은 '경쟁력 있는 소통형 인간', 동시에 올바른 상황 판단을 하는 시민으로 성장할 것이다.



============================================================================================================

흔히들 말하는 '통계적 사고'라는 것이 이런것인가? 석박사 과정에서 사용되는 통계 방법 다시 말해, 통계적 방법을 활용한 사고 방식도 같은 맥락일까? 

통계는 확실히 얼마든지 의도적으로 조작될 수 있는 것이기 때문에 자료의 함정에 빠지지 않기 위해 통계적으로 사고할 필요가 있다. 

전부터 관련 도서들을 읽어 보고 싶었는데, 조만간! 읽으시겠따.




 
블로그 이미지

브라보맨

,
1. ANCOVA 는 ANOVA에 Regression 을 합친 것

2. ANCOVA의 목적
 1) 공변인이 Blocking Variable의 역할을 함으로써 -> 에러 감소 -> 검증력 증가
 2) 두 집단간에 애초에 가지는 차이를 통계적으로 통제
 * 2)의 의미가 더 많이 쓰임

3. ANCOVA의 기본원리 (그래프로 설명)

4. ANCOVA의 모델(수식)

5. 공변인
 - 양적변수 또는 질적변수(더미변수)로 둘 다 할 수 있음
 - 질적변수 선정 시 명확한 근거가 있어야 함.

6. Statistical Model for ANCOVA
 - 공변인의 효과 = 집단간 분산 + 집단내 분산

* 해석할 떄 ANCOVA의 자유도에 주의! 공변인 때문에 1개가 빠지는 것임

tip. 모든 과정에 대해 숫자로 직접 계산해보는 것도 의미가 있긴 함.


SPSS실습

예습 좀 제대로 하고 수업 들으니 기분이 상쾌하구나.

"네? 맞죠? 맞습니까?" 메아리 없는 울림.
교수님 죄송하게스리...






 


블로그 이미지

브라보맨

,
4주차.

지난주 까지만해도 끼리끼리만 놀던 사람들이
신입생 환영회로 안면을 좀 텄다고 서로 인사하느라 강의실이 시끌시끌하다.

오늘의 강의 주제는?

SPSS 간략 소개 및 교차분석.

1. SPSS 소개

Tip. SAS vs SPSS
- SAS: 통계학과나 회계학쪽에서 쓰는 진짜(?) 통계 패키지
- SPSS: 사회과학을 위한 통계 패키지
- 둘 다 미국 대학 연구소에서 만든 것
- SAS는 회사 복지 시설이 좋다고 ㅋㅋㅋ

사실 굉장히 궁금했고 갈등했고 고민중인 부분이다.
대학원에서는 온통 SPSS를 쓴다고 난리인데
국내외 마케팅 관련 공고들에서 통계하면 죄다 SAS를 다룰줄 아는가를 보고 있었기 때문

지난주 분산분석과 회귀분석 교수님께도 여쭤봤지만
역시 SAS를 공부해야 할듯.

우선 SPSS부터 마스터하자 --;


데이터를 만드는 것이 제일 힘든 과정임
*.sav 는 SPSS 데이터 파일
*.spo 데이터를 통해 계산해서 나온 출력 파일

SPSS의 장점
사용자가 통계적 지식이 없을 때 신경 써야 할 것들을 디폴트로 잡아준다. (결과 표 양식 등)

일련 번호를 매기는 것이 굉장히 중요함
나중에 에러가 발생했을 경우 추적 할 수 있음
데이터 수집 후 제일 먼저 해야 하는 것이 일련 번호!

금주과제
공유자료실에 올라와 있는 자료에서
틀린 곳을 5군데 찾으시오.
목요일 밤 12시까지 가능한 찾아서 올려 주시기 바랍니다.
-> 코딩 미스를 찾으라는 것!
-> 기숥통계, 빈도분석에서 찾을 수 있을 것임
=> 데이터 활용에 익숙해지는 것이 목적임

syntax에 대해서 공부하면 좋다!
- 변수를 변환해야하는 작업이 반복적으로 있을 때(기타 작업에도 사용되겠지?)
-> 일종의 매크로?라고 보면 맞을까?
-> 반복된 작업을 프로그래밍화해서 한 번에 실행하는 것


다시 강의로...
결국 spss설치만 50분 소요, 과제에 대한 대략적인 설명 까지해서 1시간 반이 날아갔넹.
강의실 마다 spss 안깔아준 학교 탓이 크다.


교차분석(카이자승 분석)
- '빈도'를 가지고 분석하는 것이라 심리학에서는 잘 안씀.
- 마음대로 쓸 수 있는 칸은 1개 밖에 없었음. 이것이 자유도. df=(a-1)x(b-1)
- 자유도는 언제나 분석대상 데이터에서 자유롭게 움직일 수 있는 값이다.

- 카이자승 =  [(관찰빈도-기대빈도)/기대빈도] 의 자승합

- 영가설: 성별과 취업여부 관계가 없다.
- 영가설을 판단하기 위한 임게치가 필요함
- 카이자승의 분포는 자유도에 따라서 달라진다.

우리가 하는 것은 통계치를 얻는 것이다.
영가설 기각 채택을 해야하는데 기각 채택은 모집단에 대한 것임
.05 수준에 해당하는 이 높이가 .05 수준에 해당하는 어떤 특정한 값이면 
그것을 못넘어 갔을 경우 영가설 채택, 넘어갔을 경우 기각

어느 셀 하나가 유독 튀면, 카이스퀘어값은? 
- 기대빈도와의 차이가 커질테고, 카이스퀘어값도 커짐
- 어느 한 셀이던지 간에 5미만의 값을 가진다면 카이스퀘어 값은 신뢰롭지 않다.
-> 카이스퀘어에서는 셀당 빈도가 어떠냐에 따라서 차이가 날 수 있음

기대빈도와 실제빈도와의 차이...카이스퀘어값을 통해서 의사결정을 하게 됨
카이검증에도 통계학의 모든 가설 검증 메카니즘이 다 들어가 있음
* 참고: 구조방정식 모형에서는 카이스퀘어 값이 작을 수록 좋은 것임


오늘도 약간 의외의 강의 내용.
보통 책에서는 그 중요성 강조되지 않는 카이분포, 교차분석에 대해서만 1시간여를 할당하셨다.

하지만 통계에서 안중요한 건 없다고 생각한다.
모든게 베이스가 된다. 하나하나 차곡차곡.

이번주 정복 과제는 ==> 카이스퀘어, 교차분석, SPSS 데이터 다루기!

이번주는 꼭 복습을!!!



블로그 이미지

브라보맨

,

고급심리통계학 첫수업

지난주 월요일이 휴일이었던터라 오늘에서야 첫수업.
강의 계획서 조차 업로드 되어 있지 않아서 참 궁금했었다.

솔직히 개강이 되도록 강의계획서를 올리지 않는 교수님에 대해서는
'성의가 없다'라는 느낌이 강하게 들기 때문에 '대체 어떤 교수님인가'하는 의문도 있었다.

결과는 역시.

뭔가 다른 교수님들과 통계적으로 유의하게 다른 분이 아닐까? 하는 생각을 들게 해주셨다.

교수님께서는 통계 과목과 통계 개요 등에 대해서
교수님은 모두의 예상을 깨고 쉬는 시간 까지 가지면서 2시간 반여 열강을 해주셨다.
섣부른 기대가 모든 대인관계 갈등의 근원이라며...

계속해서 쏟아져 나오는 사례와 예시들을 통해서 그 분의 방대한 지식과 경험들을 엿볼 수 있었다.

재미있었던 건, 교수님이 강조해서 말씀하신 것 중에
내가 요즘 따르는 박사선배님이 평소에 하셨던 말씀과 동일한 부분이 두개나 있었다!

1. 
어떤 노교수님이 말씀하시길,
교수로서 성공한 사람들의 두가지 공통점이 있는데

하나는 "정말 공부 밖에 할 게 없어보이는 사람"
또 하나는 "엉덩이가 무겁게 오래 앉아 있는 사람"

후자의 경우 박사 선배님으로부터 사실 그날 아침에도 들었던 이야기 이다.
공부는 잘해서 하는게 아니라 끝까지 보고 끈기 있게 매달리는 사람이 잘하는 것이다.


2. 
각 전공 별로 유명한 이론들의 원논문이 있다.
그것들을 일주일에 한 편씩이라도 읽어보아라.
너희들의 인생이 달라 질 것이다.

이 또한 박사 선배가 지난 여름 방학때 몇번씩 강조한 이야기 였지.
결국 실천하진 못했지만...

요즘 Kahneman & Tversky의 고전 논문을 읽으면서도 느끼던 바이긴 하다.
읽기가 분명 어렵긴한데 읽을 수록 새로운 의미로 다가오고
뭔가 의미가 더 와닿기도 하고...

정말 꼭 해야 할 일 같다.

그 외에도 "20대에 어떻게 살았는지는 30부터 몸에서 차곡차곡 나타나게 된다."는 등
재미있는 의미있는 말씀들 많이 해주셨다. 


수업에 관련해서는 소문대로 '쉽게' 가르쳐주실거란다.

기대가 되는 수업이다.

이번 수업을 통해서 통계에 대한 기본 개념과 기본 자신감은 꼭 획득해야 한다.
아니 이번 학기를 통해서...

화이팅!





블로그 이미지

브라보맨

,