송희석입니다 [732693] · MS 2017 · 쪽지

2019-11-19 22:49:21
조회수 4,969

표본분석이란?(기초)(재업)

게시글 주소: https://orbi.kr/00025557318

예전에 썼던 글을 다소 수정해서 재업합니다.


표본분석이란?(기초)

표본’의 사전적 정의를 찾아보면 다음과 같이 쓰여 있다. ‘전체 모집단의 축도 또는 단면이 된다는 가정 하에서 모집단에서 선택된 모집단 구성단위의 일부’. 정시에서 표본은 단순하게 접근하면 된다. '내가 지원하고자 하는 대학과 학과에서 나보다 높은 점수를 갖고 있는 지원자‘라고 생각하면 된다.

표본분석은 대체  왜 해야 할까?

현행 입시는 ‘수시’와 ‘정시’로 구분되어 있다. ‘정시’는 각 대학마다 산출방식이 다르다. ‘표준점수’ or '백분위‘ or '표준점수 + 백분위’ 등 반영방법이 다른 상황에서 심지어 영역별 반영비도 대학마다 다르고 특정 대학마다 가산점이 있는 경우도 있고 거기에 탐구과목에서 변환표준점수까지 다르다.

결국 전국에 있는 대학별로 내 수능점수가 각기 다르게 환산되고 내가 받은 점수의 유불 리가 극명하게 갈리기 때문이다. 그래서 나온 게 상위누적백분위이다. 대학별로 내 상위누적백분위를 알고 예전 입결을 가지고 대략적인 몇등까지 합격했는지 안다면 큰 라인을 설정하는데 무리가 없다.

문제는 상위누적백분위는 정시지원자전체를 가지고 순위를 산출하는 것인데, 현행 제도에서 수시합격자는 정시를 지원할 수 없다. 그 합격생이 어느 정도 되는지 알 수 없기에 상위누적백분위를 완벽하게 맞다고 할 수는 없다.

그래서 표본분석이 정시에서 언급되기 시작했고, 표본분석을 잘하면 입시에 성공한다는 이야기가 돌게 되었다.

표본분석을 하려면 여러 가지 조건이 있다.

1. 나의 점수가 해당대학 해당학과에 모의 지원했을 때 환산점수 몇 점이고 몇등인지 알수 있는가?
2. 나의 등수보다 높은 등수의 지원자들에 성적과 등수를 알 수 있는가?
3. 실제 지원자들중 몇 퍼센트가 존재하는가?

이 외에도 여러 가지 있겠지만 크게 3가지일 것이다 .가장 중요한건 3번이다. 정시 접수를 하기전 표본이 가장 많이 모이고 그게 실제 지원까지 얼마나 이어지는지 알아야 의미가 있다. 막상 아무도 실제 지원을 안 하면 표본분석 의미가 없기 때문이다.

그래서 다들 J사 유료 모의지원프로그램을 이용한다. 왜냐하면 가장 많은 지원자가 사용하기 때문이다.


가장 큰 문제 중 하나는 ‘허수’ 구분이다. ‘유료’임에도 불구하고 '허수‘는 존재할 수밖에 없다. 과연 이 ’허수‘를 스스로 추론을 해서 ’제거‘할 것인지 혹은 ’제거‘하지 않고 오차범위를 ’허수‘로 조정 할것인지 선택해야 한다.

‘허수’가 완벽히 제거하지 못할 거라면 차라리 실제 이용률이 100%로 잡고 ‘허수’를 차라리 포함시키는 것도 나쁘지 않을 것이다. 이용률 100%로 잡으면 굉장히 보수적인 접근이 되고 합격가능성은 매우 높아진다. 물론 그만큼 다소 손해볼 여지도 있다.

그렇다면 어떻게 이용해야 하는가?

가장 좋은 방법은 매일 ‘등수’를 확인하는 방법이다. 원서 접수 7일 전부터 오전과 오후중 특정 시간을 구분해서 확인한다. 일반적으로 J사에서 하루에 한번 업데이트 하는 칸수가 나오는 리포트를 이용하는 경우가 많은데 개인적으로 그걸 사용하는걸. 반대한다. 칸수를 보고 이동하는 지원자들을 파악하기 어렵기 때문이다.

따라서 시간대는 업데이트 이후 1~2시간 지난 후 실제지원자리포트를 통해 나의 등수를 확인하고 보통 지원자들이 아침에 일어나 확인해서 지원 대학을 바꾸는 타이밍에 가서 다시 확인하는 게 좋다.

이렇게 매일 체크하면서 칸수가 바뀔 때마다 지원자들이 어떻게 옮겨가는지 큰 흐름을 볼 수 있다. 예를 들어 A대학 모든 학과를 내 점수로 각각 몇등인지 확인하고 매일 2번씩 내 등수를 확인하다 보면 비슷한 점수로 갈 수 있는 학과는 그 등수가 매일 다르게 나타난다는 걸 발견할 것이다.

2019학년도 케이스를 하나 살펴보자

어느 지원자 점수가 대구한의대 한의예(자연)과를 모의 지원한 결과 27일 업데이트 이후 32등이라고 해보자. 근데 모의 지원한 점공을 보니 3명은 아무리 생각해도 허수로 생각해서 그 3명을 빼니 29등이었다. 최초모집인원은 22명이고 이월이 11명이면 33등안에 들 경우 최초 합이 된다. 몇 년간 추합인원을 봤는데 13명까지 돌거라 예상하지만 보수적으로 10명으로 잡아서 43등안에 들면 추합으로 합격한다고 생각했다면 43등안으로 변함없이 어이지면 될 것이다.

마지막 원서접수 1시간 전까지 43등이고 그 순위가 들쭉날쭉 하지 않아서 과감하게 지원했더니 결국 예비번호 2번을 받았다면 결과적으로 생각보다 허수가 많았거나 내 위 등수 일부가 무서워서 쓰지 못했다는 이야기가 되는 것이다.

사람들은 그곳 ‘칸수’를 너무 맹신하는 경우가 있다. 철저히 모두가 등수만 본다면 칸수는 무시해도 된다. 내 ‘등수’가 합격권에 있는지 없는지만 매일 실시간으로 체크할 수 있다면 칸수가 무슨 의미가 있겠는가? ‘허수’제거를 해주는 것 때문에 믿기에는 요즘 ‘그곳’은 제대로 제거하지 못한다는 건 다 알고 있을 것이다.

따라서 ‘칸수’는 무시해도 된다. 특히 2019학년도 연대 문과는 ‘칸수’를 무시하고 ‘등수’만 본 지원자들이 성공했다. 마치 2~3칸인데 최초 합이나 추합권이 많을테고 예상으로 1칸 합격자도 생길 것이다.

이렇게 되면 마치 칸수를 뚫었다는 착각을 하면서 뿌듯할 수 있지만 엄밀히 이야기하면 칸수는 믿을게 못 된다는 이야기와 같은 것이다.

표본분석이란게 생각보다 만만치 않은 작업일 것이다. 모집단위에 따라 표본 유동성이 심한곳도 있고, 아예 없는곳이 있다. 거기에 그 해 특정 이슈에 따라 특정 모집단위 인기가 폭발할 때도 있다. 또한 모집인원이 매우 적은곳에 허수를 판별하기도 어렵고, 수시합격자가 모의지원에서 빠져야 하는데 빠지지 않아서 고민이 되기도 하다.

이런것들은 결국 본인보다 점수가 높은 학생들과 경합할때 그 높은 학생들에 특성들을 파악해야 하고 본인과 비교하면서 합리적인 선택이 맞는지 따져봐야 한다.

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.