투타임즈 [1136344] · MS 2022 (수정됨) · 쪽지

2025-08-27 11:16:37
조회수 286

231122는 몇 명이 찍맞했을까?

게시글 주소: https://orbi.kr/00074458629


평가원 오피셜 변별도(우리가 아는 변별력의 개념과 다름)와, 예상 정답률(2.8%)로 알아보자


피어슨 상관계수 수식이 말하는 바는 아주 간단함.

"이 문제 맞힌 놈(X=1)이 시험 전체를 잘 본 놈(높은 Y값)이 맞더냐?"


이 질문에 대한 대답이 바로 변별도 R값임. R이 1에 가까우면 "ㅇㅇ, 공부 잘하는 놈들이 귀신같이 맞힘"이고, 0에 가까우면 "아니, 아무나 찍어서 맞혔는데?"가 되는 거임.


그럼 수능 수학 응시자 43만명과 0.12라는 변별도를 역으로 분해해봄.


N (총응시자 수): 430,000명. 이 거대한 모래사장에서

X (문항 점수): 정답 다이아몬드를 찾아낸 (약)12,255명과, 못 찾은 417,745명의 흙더미.

Y (총점): 학생 개개인의 전체 시험 성적.


저 복잡한 수식의 분자, NΣXY - ΣXΣY가 핵심. 

이걸 쉽게 풀어쓰면, (22번 맞힌 놈들의 평균 총점)이 (전체 수험생의 평균 총점)보다 얼마나 높은가?"를 재는 척도임. 이 차이가 클수록 변별도는 높아짐.


변별도 0.12가 나왔다는 건, 이 차이가 거의 없었다는 뜻임.


이제 이걸 바탕으로 12,255명의 정답자 분포를 역산해봄.


1.  전체 수험생 평균 총점: 대략 100점 만점에 50점이라고 가정함. (실제와는 다르겠지만, 상대적 비교를 위한 기준점이라고 생각하자)


2.  22번 정답자 집단의 평균 총점: 이 값이 50점에서 얼마나 높은지를 계산하면 됨. 변별도 0.12라는 건, 이 값이 50점에서 아주 약간만 높았다는 뜻.


최상위권 (만점자 약 1000명 포함, 총점 90~100점대): 이 집단에서 약 3,000명이 정답을 맞혔다고 가정함. 이들은 실력으로 풀었거나, 실력 기반으로 어찌저찌 답을 도출한 표본.

중위권 (총점 40~60점대): 이 문제의 핵심. 변별도를 나락으로 보낸 주요 표본. 어차피 어려운 거, 소신껏 찍었는데 맞혀버린 운 좋은 다수. 여기서 약 6,000명이 정답을 맞혔다고 가정함. 이들의 평균 총점은 50점.

하위권 (총점 0~30점대): 그냥 진짜 아무 생각 없이 찍었는데 맞힌, 로또 당첨자들. 여기서 나머지 3,255명이 나왔다고 가정함. 이들의 평균 총점은 25점.


자, 이제 이 분포를 바탕으로 22번 정답자 집단의 평균 총점을 계산해봄.


> (3,000명 * 95점 + 6,000명 * 50점 + 3,255명 * 25점) / 12,255명

> = (285,000 + 300,000 + 81,375) / 12,255

> = 666,375 / 12,255

> ≈ 54.37점


전체 평균은 50점인데, 이 22번을 맞힌 표본의 평균 총점은 고작 54.37점으로 4.37점 높음. 대략 3000명이 풀맞할 때 9000명의 찍맞이 존재했을 것


이 미미한 차이가 바로 저 상관계수 R을 0.12라는 '변별력 매우 낮은 문항' 이라는 지표를 뜨게 원인이 됨. 저 수식은 거짓말을 하지 않으니 "이 문제를 맞힌(실제 풀맞보다, 압도적인 찍맞으로 인해) 집단은, 전체 집단과 비교했을 때 통계적으로 유의미한 실력 차이를 보이지 않았다"라는 결과가 나오는 거임.


결론적으로, 만점권을 제외 시 나머지 모두가 고르게 찍은 극상위권의 뚝심, 중위권의 운빨, 하위권의 기적이 뒤섞인 거대한 무작위 추첨기가 됨. 검토진 전원 오답 제출이 보여주듯..

어려우면 낮아지냐는건 사실이 아님. 표를 보면 다른 킬러들은 이것보다 변별도가 높은 것들도 많음

rare-YouTube rare-서강대학교

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.