성적과 통계학 (1)
게시글 주소: https://orbi.kr/00067993601
평균이 50점이고 표준편차가 20점인 시험이 있다고 합시다.
그렇다면 이 시험에서 70점을 받은 학생은 일반적으로 3등급 후반이 된다는 사실을 아시나요?
이 시험에서 85점을 받으면 웬만하면 1등급이 됩니다. 물론 다 된다는건 아니고, 안되는 특이 케이스도 있기는 하지만 대부분은 1등급이 됩니다.
오늘은 이런 이야기를 한 번 해보려고 합니다.
수능이나 모의고사에서 표준점수는 응시자들의 성적을 적절하게 조작해서 평균과 표준편차를 일정하게 맞춘 점수입니다.
원점수가 100점 만점인 국어, 수학에서는 응시자들의 표준점수 평균이 100점, 표준편차가 20점이 되도록 맞추고,
원점수가 50점 만점인 탐구에서는 응시자들의 표준점수 평균이 50점, 표준편차가 10점이 되도록 맞춥니다.
표준점수의 평균이 100점이고 표준편차가 20점인 국어, 수학에서
표준점수가 100점이라는 것은 어떤 의미일까요? 표준점수의 평균이 100점이라고 했으니 그냥 딱 평균만큼 받았다는 의미입니다.
그렇다면 표준점수가 120점이라는 것은 어떤 의미일까요? 평균보다 1표준편차만큼 잘 봤다는 의미가 됩니다. 평균이 100점, 표준편차가 20점이니까 (평균) + 1×(표준편차)를 하면 딱 120이 되죠
마찬가지로 표준점수가 140점이면 평균보다 2표준편차만큼 잘 봤다는 의미가 되고
표준점수가 130점이면 평균보다 1.5표준편차만큼 잘 봤다는 의미가 됩니다.
이렇게 평균보다 몇 표준편차만큼 잘(못) 봤는지를 따지는게 이번 글 내용의 핵심이라고 할 수 있습니다.
그렇다면 이걸 왜 따지느냐? 이걸 따지면 나의 상대적 위치를 예측해볼 수 있기 때문입니다.
국어나 수학에서 표준점수 100점이면, 그러니까 딱 평균만큼 받았으면 몇 등급이 나올거라고 예상하시나요?
사실 이건 너무 쉽죠. 평균이라고 하면 보통 가운데 등급인 5등급이 연상되잖아요?
실제로 국어나 수학에서 표준점수 100점을 받으면 5등급이 나옵니다.
탐구에서도 마찬가지로 표준점수 50점을 받으면 일반적으로 5등급이 나옵니다.
그러면 처음에 소개했던 것처럼, 평균보다 1표준편차만큼 잘 본 경우에도 등급을 예측할 수 있을까요? 그러니까 국어나 수학에서는 표준점수가 120점, 탐구에서는 표준점수가 60점이라면 보통 몇 등급인지 예측할 수 있을까요?
복잡하게 생각할 것 없이 과거 사례들을 찾아보면 답이 나옵니다.
국어, 수학에서 표준점수 3등급컷은 보통 116 ~ 118에서 형성되는 경향이 있습니다. 작년 뿐만 아니라 그 전년도를 찾아봐도 마찬가지입니다. 3등급컷이 높게 나오면 119까지도 올라가긴 하지만 120을 넘어가는 시험은 거의 찾아보기 어렵습니다. 따라서 표준점수 120점이 나오면 매우 높은 확률로 3등급이 된다는 사실을 알 수 있습니다.
탐구 같은 경우에도 표준점수 60점이면 웬만하면 3등급이 됩니다. 그렇다고 모두 3등급이 된다는건 아니고, 다음과 같이 4등급으로 떨어지는 경우도 있습니다.
이거는 성적 분포 양상에 따라 차이가 있어서 그렇습니다. 평균보다 1표준편차만큼 잘 보면 무조건 3등급이 된다는 절대적인 법칙은 없어요. 하지만 작년 수능의 경우, 한국지리를 제외하면 표준점수 60점이면 모두 3등급이 되었습니다. 따라서 100%는 아니지만, 탐구 표준점수 60점도 높은 확률로 3등급이 된다는 사실을 알 수 있죠.
그렇다면 혹시 내신에서도, 평균과 표준편차만 가지고 나의 상대적인 위치를 파악할 수 있지 않을까요? 오늘 그걸 알아보기 위해 제가 대략 코딩을 해왔습니다.
먼저, 실제 내신 시험처럼 학생 수를 250명으로 가정하였습니다.
그리고 0부터 100까지의 정수를 학생 수만큼 랜덤으로 추출합니다. 학생 수가 250명이니까 250개를 추출하게 되겠군요. 이때 추출된 숫자가 각 학생의 시험 점수가 됩니다.
그리고 추출된 250개 점수의 평균과 표준편차를 구해서, (평균)+z×(표준편차)에 해당하는 학생이 몇 등급에 속하는지를 기록합니다. 이 과정을 10,000번 반복해서 최종적으로 이 학생이 몇 등급에 속할 확률이 가장 높은지 따져보는 것입니다.
먼저 z=0으로 했을 때의 결과입니다. 딱 평균만큼 받았을 때죠. (국어 수학 표준점수 100점, 탐구 표준점수 50점에 해당)
반복 횟수 10,000번에 대해서 10,000번 모두 5등급이 나왔습니다(등급 분포 양상의 왼쪽부터 1등급이 나온 횟수, 2등급이 나온 횟수, ...로 읽으시면 됩니다.). 평균적으로 상위 49.95%로 딱 중간 위치를 차지하고 있다는 것을 알 수 있네요
이번에는 z=1로 해보겠습니다.
예를 들어 원점수 평균이 52점이고 표준편차가 23점인 시험이 있다면, 52+23=75점을 받은 학생은 보통 몇 등급에 속하는지를 알아보려고 합니다. (국어 수학 표준점수 120점, 탐구 표준점수 60점에 해당)
반복 횟수 10,000번에 대해서 3등급이 나온 횟수는 9,183회이고, 4등급이 나온 횟수는 817회입니다.
그러니까 대부분은 3등급이 나오는데 운이 나쁘면 4등급으로 떨어질 수도 있는 것이네요
이렇게 z값을 변경시켜가며 각 z에 대해 응시자들의 등급이 어디에 해당할지 몇 가지 살펴봤습니다.
z=1.2일 때 (국어 수학 표준점수 124점, 탐구 표준점수 62점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.2×23=79.6점은 보통 몇 등급에 해당되는가?
3등급일 확률이 가장 높다!
z=1.5일 때 (국어 수학 표준점수 130점, 탐구 표준점수 65점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.5×23=86.5점은 보통 몇 등급에 해당되는가?
2등급일 확률이 가장 높다!
z=1.8일 때 (국어 수학 표준점수 136점, 탐구 표준점수 68점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+1.8×23=93.4점은 보통 몇 등급에 해당되는가?
1등급일 확률이 가장 높다!
z=0.5일 때 (국어 수학 표준점수 110점, 탐구 표준점수 55점에 해당)
ex) 원점수 평균 52점, 표준편차 23점일 때, 52+0.5×23=63.5점은 보통 몇 등급에 해당되는가?
4등급일 확률이 가장 높다!
결과 자체는 꽤 일리 있어 보이게 나왔습니다.
그런데 사실 이렇게 점수를 완전 랜덤으로 추출하면 별로 마음에 들지 않는 분포가 나옵니다.
뭐가 마음에 들지 않을까요?
점수를 완전히 랜덤으로 추출했다는 것은, 0부터 100까지의 숫자가 나올 확률이 1/101씩으로 완전 동일하다는 의미입니다.
그러니까 거의
90점대 인원 = 80점대 인원 = 70점대 인원 = ... = 10점대 인원 = 한 자리수 인원
꼴로 인원 분포가 나온다는 것입니다.
그런데 이는 현실적인 성적 분포와 좀 동떨어져 있죠
보통 성적 분포라고 하면 90점대 인원보다 80점대 인원이 조금 더 많고, 80점대보다 70점대가 조금 더 많은 분포를 생각하지, 저렇게 각 점수대별 인원이 다 똑같을 거라고 생각하진 않죠.
실제로 저렇게 추출하면 표준편차가 거의 28~30으로 나오는데, 이것도 현실의 표준편차와 많이 동떨어져 있다고 할 수 있습니다.
따라서 다음 편에서는 확률 분포를 직접 커스터마이징해서 등급 분포 양상을 구해보도록 하겠습니다.
감사합니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
오빠 너무 더워 1
기사오빠 버스에 애어컨좀...
-
8 0
888 8 8 888 8 8 888
-
나도 가끔 이런저런 가벼운 글 쓰긴 하는데 어떻게 입시관련 얘기는 하나도 없고 싹다...
-
킬캠 2회차 3
만점맞음 히히
-
2트나 길게봐도 3트쯤에서 끝내야 했던걸 너무 길게 하는 느낌..
-
참을수없는 간질간질한 기침을 계속하는데 엄마가 이번 약까지 먹고도 안 멈추면 거기...
-
수특은 독서 문학 다 풀었긴했는데 6평전에 문학 2장르정도밖에 못 보고 갈 것...
-
8 2
8 8 8 8 8 8 8
-
미드 3밴을 안한다고? Blg는 무조건 미드 3밴 이상 확정일텐데 좋다 말았네
-
내신 기간 때 ㅈㄴ 힘들었는데 자꾸 그 꿈 꾸면서 가위눌려 ㅈ같음 빨리 입시판 탈출해야겠다
-
권은비 싸이 잔나비 불러놓고 정작 재학생 90%는 아예 보지도 못함ㅋㅋㅋㅋ
-
토욜 밤이나 일욜에 각잡고 적어볼게요... 문제 따와서 제가 떠올리는 생각 이런것도...
-
전공도 안 맞고 물지러라 화학 흥미도 없고 ㅈㄴ 못함!
-
도장깨기 가보자~.
-
먹성이 커서 피자2판도 혼자가능 연애할때 메뉴 많이 시켜도 다먹을 수 있어서...
-
최저 꿀 과목 0
1위는 당연히 영어라 뺌. 뭐라 생각하시나요?
-
알바 짤렸네요ㅎㅎ 14
정직원 뽑아서 알바생이 필요없다네요..ㅠㅠ
-
풀때 합동일것 같다고 느꼈는데 근거를 못찾겠음
-
마성의 여자 a 1
이 노래 묘하게 중독적이네요
-
안풀어도 되나요..? 6모 직전에 수1 수2 파데랑 킥오프 겨우 끝낼꺼 같은데 6모...
-
이거 원작자 초6인거 아시나요 님들?
-
사실 연계는 6
영어랑 제2외 제외하면 학습부담을 늘리는 것도 아니고 줄이는 것도 아님 도대체...
-
ㄹㅈㄷㅋㅋㅋㅋ
-
다이아임
-
관심없다고 ㅇㅅㄲㅇ!
-
훈식쌤 식스피드 0
작년 개택 책 있으면 이걸로 들어도 무방한가요? 필기 또 하기 귀찮은데
-
덕코가 4
정확하게 뭐할 때 쓰는 거임?
-
ㅅㅂ나도 갈껄
-
내가 이상한건가.... 뉴진스 누님들 일반인 외모같은데 7
30년 전 여자연예인 보다가 지금 아이돌들 보면 밋밋하고 그때하고 겁나 외모...
-
피자집 왔는데 1
사장님 내외분 국밥드시네ㅋㅋㅋ
-
총 3만덕 나눔 66
댓글 30등까지 천덕 중복 가능
-
과제가 싫어요 0
근데 조별과제라 안해갈 수도 없어요
-
낙지 수시 모의지원은 믿을게 못되는거 맞나요? 이색기들중 상당수는 재미로 양학용으로...
-
나만 고양이 없어 10
나만고양이없어나만고양이없어나만고양이없어나만고양이없어나만고양이없어나만고양이없어나만고양이...
-
덕코를 모으겠읍니다
-
광기의 오르비언 하나가 11
새로 들어왔다 ㄷㄷ
-
고3이 연애? 7
수능 180일 남은 시점에서 썸녀가 생겼어요 공부하는 시기라서 좀 고민되긴 하는데...
-
먼가 음... 기억하겠읍미다
-
지금 이매진이랑 계간지 매우 고민중인데 혹시 추천가능하신지...? (인강민철...
-
파이썬 matplotlib FuncAnimation 할줄 아는사람 3
제발 도움좀 ㅠㅠㅠㅠ
-
열품타 뒤졌네 2
이런..
-
글 대충 갈갈이 0
몇개 남겨둔건 다음에 다시 삭제할예정
-
연락하고싶긴한데 7
당최 뭐라고말을해야할지모르겠다...........
-
수학 한정해서 말하는거 ㄹㅇ 4월 더프 수학 60점 나왔는데 5월 학평 34점 나옴...
-
긍미님 어디가셨어 12
ㅜㅜ
-
지금은....축의금 매우중요하게느낌 너무세상에물들었나;;
-
오르비 망했네 19
그나마 물2얘기는 ㅇㅈ이긴한데..
Sexual & statistics
그 성적 아니고...
개재미따