원서영역 도구(chapter2: 표본분석법)
게시글 주소: https://orbi.kr/00019328026
앞선 글들을 읽고 오시길 권장합니다!
저번 글에서 객관성, 일반성에 대한 피드백을 받았습니다. 경험과 추론을 이용한 것이 아닌, 논리적으로 생각하여 최대한 모두가 공감할 수 있는 내용만을 전해드리도록 노력해보겠습니다.
이번 글은 표본분석법에 대한 글입니다. 표본 하나하나에 대한 판단부터 전체적 분포에 대한 내용으로 확대해 나가며 진행하겠습니다.
---------------------------------------------------------------------------------------------------------------------
표본분석법
1.표본분석의 한계
표본분석을 하는 것은 상향지원 할 학과의 합격확률을 조금이라도 더 높이고, 안정지원 할 학과의 확실함을 조금이라도 더 보증하기 위해서 입니다. 표본분석은 만능이 아닙니다.
철저한 분석을 통해 확신을 가지고 상향지원한 학과에 모의지원 사이트 상 단 한번도 찾아볼 수 없었던 표본이 실제지원에 몇 명만 등장해도 노력은 물거품이 됩니다.
애초에 모집인원이 100명이 넘어가는 대형과는 하루에도 자신 앞에 수십명의 표본이 들락날락 할 수 있습니다. 그런 학과의 표본을 하나하나 판단하고 매일 상태를 체크하는 것은 불가능합니다.
저는 당연히 표본분석 방법에 관련된 모든 정보와 진리를 전달해 드릴 수는 없습니다. 불충분한 정보들을 차곡차곡 쌓아 완벽하게 해나갈 자신이 없다면 컨설팅 팀에 맡기거나 타임머신, 페잇등을 이용하는 것이 훨씬 나을 수 있습니다.
그럼에도 고된 수험생활 끝의 휴식이라고 할 만한 12월을 표본분석에 갈아 넣을 준비가 된 수험생은, 1%라도 합격확률을 높이기 위한 그 희생이 가치가 있다고 판단한 것 이겠지요!
2.모의지원 사이트의 예상합격자 산출방식
저번 글에서 말씀드렸듯이 자세한 수식이나 산출법은 각 회사의 기밀인 것으로 압니다. 하지만 관찰에 따라 대강 다음과 같은 방식을 따르는 것을 알 수 있습니다.
지난 경쟁률 등으로 예상경쟁률 산출 - 예상지원자 수와 모의지원자 수의 비율로 예상최초합격자 수 계산 – 각 표본의 가,나,다군 우선순위에 따라 추가합격자 수 계산
예를 들어 봅시다. (당연히 실제 수치와 다릅니다)
모집인원이 8명인 학과가 있습니다. 모의지원 사이트는 예상경쟁률을 3.3:1로 잡았고, 모의지원자 수는 20명입니다. 모의지원 프로그램은 그들의 비밀 공식을 이용해 모의지원자들 중 6명을 최초합격자로 예상했습니다.
6명의 최초합격자 중 3명의 표본이 다른 군에 지원한 학과를 우선순위로 입력했고, 그 중 2명의 표본이 우선순위 학과에 합격이 예상됩니다.
이에따라 모의지원 사이트는 2명의 1차 추가합격자를 예상할 것이고, 추가합격자들의 지원상황에 따라 2차 추가합격자가 같은 방식으로 계산될 것입니다.
복잡한 메커니즘이 있겠지만 그 방식을 대강이라도 알고 있는 것이 좋을 것 같습니다. (자세히 알기가 힘들기 때문입니다 ㅜㅜ)
저번 글에도 말씀드렸듯, 각 합격예측 프로그램의 원리를 알면 알수록 그들을 남들보다 잘 이용할 수 있습니다!
3. 허수 거르기
표본들 중에는 가짜표본이 있습니다. 실제 수능 응시자가 아닌데 재미로 넣어 보거나, 점수를 허위로 입력하거나, 어쩌면 다른 수험생들을 교란하기 위해 누군가 만들어낸 표본이 있을 수도 있습니다.
우선 각 모의지원 사이트는 자체적으로 어떤 알고리즘을 이용하여 허수들을 걸러냅니다. 이번 오르비 모의지원에는 인공지능이 사용된다고 들은 것 같습니다.
작년 가장 큰 모의지원 사이트에서 제거된 허수는 2만건에 육박했던 것으로 기억합니다. 하지만 이와 같은 노력에도 허수표본들은 완전히 제거되지 못합니다.
저번 글에 말씀드렸듯이 저는 개인 수험생이 자신만의 생각으로 표본들의 허수 여부를 마구 판단하는 것은 좋지 않다고 생각합니다. 다만 여러가지 조건을 통해 어떤 표본이 허수일 ‘확률’이 높을지 생각하는 것은 유의미하다고 생각합니다.
여태 오르비에 표본분석에 대한 글을 남겨 주신 분들은 허수의 판단에 쓰일 수 있는 몇 가지 주된 요소를 언급하셨습니다. 주로 다음과 같습니다.
-전혀 상관없는 학과들의 조합
-더 높은 대학/학과를 쓸 수 있음에도 굳이 낮춰 쓴 듯한 표본
-움직이지 않는 표본
-지원할 만한 대학이 있음에도 특정 군에 지원하지 않은 표본
이 요소들에 해당되더라도 그 표본이 허수라는 확신을 할 수 없습니다. 하지만 한가지가 아닌 여러가지 요소를 가지고 있는 표본이라면, 허수일 확률이 비교적 높아진다고 할 수 있겠지요.
특히나 움직이지 않는 표본은 확률이 높다고 생각합니다. 취향이 확고한 수험생이라도 12월초부터 원서접수 직전까지 단 한번도 다른 학교, 다른 학과에 모의지원조차 안해보는 수험생은 굉장히 적을 것입니다.
반면 상관없는 학과들의 조합은 그닥 허수의 조건이 아니라고 생각합니다. 실제지원자 중에 상관없는 학과의 조합으로 지원하는 학생이 오히려 더 많은 것 같습니다.
이는 본인의 판단에 맡깁니다.
제가 지원 했었던 학과의 실제 있었던 허수 표본을 예로 들겠습니다.
Ex)
가군 해당 학과 (1순위)-사이버 국방과 전혀 연관성 x
나군 고려대 사이버국방학과(2순위)
다군 지원x
해당 표본의 성적은 고대식 누백 0프로 중반으로 기억합니다.
전혀 상관없는 학과의 조합 에다가, 성적이 남는 학과를 1순위로 하였고, 다군을 지원하지 않았으며 무엇보다 전혀 움직임이 없었습니다.
실제로 차후 허수였던 것으로 확인했습니다.
그럼에도 다시 말씀드리지만, 100%는 없습니다.
4.표본 카테고리화, 추적
허수일 확률이 있는 표본들을 분리하고 나면, 실제표본들이 남습니다. 이제 앞으로의 판단을 위해이 표본들을 종류에 따라 대충 나눌 필요가 있겠습니다.
어떻게 나눠서 생각해볼지는 개인의 판단입니다. 저는 대강 다음과 같이 나눴습니다.
-해당 군에는 이 학과를 쓰는 것으로 확고한 표본
-고민하는 표본
-밀려 내려오는 표본
이를 위해서는 표본을 추적해볼 필요가 있습니다. 먼저 표본들의 점수와 각 군의 희망학과를 메모 해 둡시다. 가군의 학과에서 어떤 표본이 사라졌다 나타났다 한다면, 나,다군에 그 표본이 썼던 학과에 모의지원을 하여 그 표본을 찾아 볼 수 있습니다. 어떤 학과를 두고 고민하고 있는지 알 수 있는 방법입니다.
이는 최상위권에서 강력한 방법입니다.
하지만 성적대가 내려갈수록, 스쳐 지나가는 표본이 많아지고 나중에는 전체적으로 칸수가 떨어지며 더 안정적인 학과로 엄청나게 밀려 내려오는 표본들 때문에 미리 해 뒀던 표본분석 자료들의 표본들은 온데간데 없어질 수도 있습니다.
5.유동성
이제 개개의 표본에 집중하기보다 좀더 멀리서 바라보도록 합시다.
매일매일 지원예정 학과들 에서의 자신의 등수와 상위표본의 출입을 지켜보며 기록하다 보면 차이점을 발견할 때가 있습니다.
어떤 학과에서는 자신의 등수가 14~16등 사이를 진동하는데, 어떤 학과에서는 10~20등 사이를 오르내립니다.
그 학과에 지원하는 것을 망설이고 고민하는 표본이 많다면, 실제지원에서 모의지원과 결과가 달라질 확률이 그렇지 않은 학과보다 조금이라도 높은 것은 공감하실 수 있을 것입니다.
이는 합격선이 예상보다 낮아질 확률도,높아질 확률도 높인다고 할 수 있습니다.
하지만 반복해 말했듯 단지 조금이라도 확률을 높이기 위한 일들입니다. 유동성이 적었던 과가 오히려 크게 폭발하거나 빵구날 수도 있습니다.
그저 최선의 선택을 하기위해 참고할 만한 이야기입니다.
6.도미노
상향지원을 위해 표본분석을 하는 분들을 위한 내용입니다. 이는 모의지원 사이트의 예상합격인원 산출법과 관련이 있습니다.
2번에서 말했던 예시를 그대로 가져와 봅시다.
(모집인원이 8명인 학과가 있습니다. 모의지원 사이트는 예상경쟁률을 3.3:1로 잡았고, 모의지원자 수는 20명입니다. 모의지원 프로그램은 그들의 비밀 공식을 이용해 모의지원자들 중 6명을 최초합격자로 예상했습니다.
6명의 최초합격자 중 3명의 표본이 다른 군에 지원한 학과를 우선순위로 입력했고, 그 중 2명의 표본이 우선순위 학과에 합격이 예상됩니다.
이에따라 모의지원 사이트는 2명의 1차 추가합격자를 예상할 것입니다.)
이때 1차 예상 추가합격자 2명 모두 해당학과를 1순위로 설정해 놓았다고 합시다. 모의지원 프로그램은 여기서 예상 합격자를 마감할 것입니다.
하지만 그 뒤 표본들의 우선순위와 다른 군의 예상합격 현황이 변수가 될 수 있습니다.
최종추가합격자와 나 사이에 5명의 불합격자 표본이 있다고 합시다.
만약 5명 모두 해당 학과의 우선순위가 낮고 우선순위가 높은 다른 학과에 합격할 것으로 예상된다면, 모의지원 프로그램이 모의지원자들 중 합격예상 인원을 한명만 더 잡아도 추가합격자가 도미노 쓰러지듯 늘어나 자신까지 합격할 수 있게 됩니다.
이런 조건을 찾는 것 또한 상향지원의 합격확률을 조금이라도 높일 방법이 될 것입니다.
7. 점수절벽
6번과 관련하여 추가적인 내용입니다.
보통 지원자들의 분포는 x축을 성적, y축을 학생수로 했을 때 정규분포를 그리게 됩니다.
이를 모의지원사이트에서 볼 수 있는 흔히 y축을 성적, x축을 등수로 하여 표본들을 점으로 표현해 놓는 그래프로 보면 ‘~’자를 좌우반전 후 시계방향으로 약간 돌려놓은 모양새가 됩니다. (마땅히 표현할 방법이 없네요,,)
통계학적인 이유에 따라 지원자가 많은 대형과들의 경우 특히 크게 벗어나는 일이 없겠지만,
지원자도 적고 모집인원도 적은 작은 모집단위 에서는 이 모양을 벗어나곤 합니다.
이때 ~표 모양의 허리가 끊어져 중간에 표본의 점수가 뚝 떨어진다거나 하는 현상이 있고,
그것이 6번의 도미노 구간에 걸쳐 있다면
해당학과의 입결이 소위 말하는 ‘배치표’상의 점수보다 많이 떨어질 가능성이 있는 것이겠지요!
8.정리
표본 분석법에 대한 글은 이미 오르비에 꽤 많은 걸로 압니다.
이 글 말고도 다양한 내용과 근거들을 조합하여 2번에 대입해보고 생각해 봅시다. 자신이 판단한 예상합격 표본 수를 산출할 수 있을 것입니다. 거기에 추가적으로 비 모의지원자까지 고려해서 생각해 본다면 예상되는 최종합격 예비번호 등을 계산해 낼 수 있을 것입니다!
절대적으로 맞출 수 있는게 아닌, 확률을 높이는 시도일 뿐이라는 것을 마지막으로 다시 강조해서 말씀드립니다.
---------------------------------------------------------------------------------------------------------
글이 길어져서 정리한다고 힘들었네요 ㅜㅜ
글 중간중간에도 언급했지만 절대적인 내용이 아니기에 수험생 여러분들이 각자 판단하시고 객관성과 일반성이 부족하다고 생각되는 부분은 스스로 생각해 주시고,
부족한 내용, 틀린 부분 있다면 피드백 해주시면 감사하겠습니다!
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
그럼 내가 한 말이 사실이라는거네?ㅋㅋ ㅋㅋ
-
김기현 아이디어 듣기 시작햇는데 시간낭비일까요? 뉴런은 아직 할 단계가 아닌거같아서...
-
저게 암걸렸을때 치과 안가니까 치의학은 비과학적이라 하는거랑 뭐가 다른건지 궁금해짐요..
-
수능은 아무것도 아니구나
-
애매하긴해
-
친권박탈ㄷㄷ
-
너무 내신틱하게 가르치시는거 같은데 표현상 특징, 뒷배경 이런것도 외우기에는 벅찬 느낌
-
으흐흐
-
15,22,28,30 각각보면 할만한데 시간 제한 있는 한 시험지에서 마주치면...
-
2028 부터 과연 정시/수시가 어떻게 흘러갈까요???? 2
5등급 내신만으로 수시러들을 나눌 수 있는지 1학년 과목 탐구 / 미적기하없는 수학...
-
실친이 나땜에 오르비 시작했는데 얘랑 같이 놀면 옯만추인거임??ㅡㅡ
-
아래 문항은 새벽 3시 아무 생각없이 만든 문제입니다~ 오류가 눈에 보이시나요
-
누구세용
-
대로센딕이여 왜 꺼라위키 실검 1위에 등판하셨나이까
-
다 남자들밖에 없는거같음 ㅠ
-
내가왜
-
영어 실모 0
영어 실모를 풀려고 하는데 유명한게 이명학 모의고사랑 조정식 모의고사(더데유데?)가...
-
미적 3틀 거의 고정인데 다른과목은 어느정도 나오는데 수학을 너무 못해서… 차라리...
-
고딩때도 방학때 스카에서 이정도는 공뷰했는데..
-
원래 김동욱 t 커리만타다가 문학이 시간이 너무 오래걸려서 이번주부터 문학만...
-
속이 쓰리고 따갑고 어지럽고 그러네
-
오늘 내세상이 무너졌어..
-
쉴때 머해용?? 9
공부하다 쉴때 보통 뭐함 다들?
-
깐따삐야! 6
https://orbi.kr/00043354533
-
수학을잘하고싶다 0
9
-
컴공 vs 전자 14
컴학 희망했는데 코딩 못따라갈거같고 레드오션이라해서 쫄림 그래서 전자 희망중이긴한데...
-
이거 좀 어렵네,,,,,
-
ㅈㄱㄴ 문과기준 여자기준 설사범vs경희한
-
점메추좀 0
ㅃㄹ
-
공식유튭 음원은 드라마판 합응에서나 쓰는거지 실제 현장에서 안쓰고 한 1.1?...
-
전전vs컴공 3
지금 3학년인데 물2를 들어보니까 전전붙는다 해도 물리를 못따라갈것 같습니다 그래서...
-
신한은행 차장이셨는데 사내 정치에서 밀리셨는지 승진이 안돼고 만년차장이긴 하셨음...
-
오전필수수업 대형 강의실에 1반 2반 분반수업이고 강사개인질의응답 2번정도 갔고...
-
이거보고 밖에서도 당당하게 디시하기로 했다
-
매일 7시 쯤 일어나서 8시에 학교 갔다가 12시 전에 집에 와서 1,2시 쯤 자요...
-
주변 씹덕들 1ㅗ묜 다 극과극이라 못하면 아예 못하고 잘하는 놈들은 아예 잘함
-
몰래하는 아찔함으로 잠 깨는데 잠들면 지읏된다
-
사문 개념 문제 정답률 30퍼 대는 왜 그런가요? 14
양적 연구 쪽 풀고 있는데 암만 봐도 이 정도는 아닌데 시간 문제인가요? 그렇다기엔...
-
개지리네 시발 정진하겠습니다.
-
아 고생일 것 같긴 힌데 가야지 그래도...
-
문법 문제가 무슨 "이건 몰랐지? ㅋㅋㅋ" 이런 문제가 많고 매체는 왤케 많아 하...
-
많이 바보같은 질문이지만 해결하고 가야할 것 같아서 질문합니다 f(x)를 구하고...
-
호감을 좋아하는 걸로 착각함
-
필수 수업 빼먹고 다른 반 수업을 도강할 예정
-
작수 백분위 70으로 4등급 맞고 지금부터 공부 시작하는 반수생입니다.국어는 이미...
-
오전수업빼야지 2
이미 빼놓고 글쓰기
-
작년에는 강의하지 않았었나
-
고3 수학 과외한다하면 일주일 숙제 몇문제 내줘야하지 21
200문제면 괜찮나... 수업을 지수 로그랑 함수의 극한 할거여서 문제 쉽게...
-
신기.. 하루에 계정 방문자수 1000회 꼴이네
선추
닥추

정보글은 추야~
가즈아사실 허수인걸 거르는과정이
허수임이 확실하다는 걸러지는 허수 10개중 1개 정도고
나머지 9개는 '허수였으면 좋겠다 ㅎㅎ' 라는 심정으로 거르는거.. ㅋㅋㅋ
ㅜㅠ 수험생의 마음이 그렇지요
너네들이 찾는건 허수
이글을 읽는 나는 하수
yo
비 모의지원자는 몇%정도 있겠다고 잡는게 좋을까요?
쪽지 드리겠습니다 ㅎㅎ
저도 궁금합니다!
저도 쪽지 부탁드려봐요ㅠㅠ
쪽지 드렸습니다 ㅎㅎ
로켓님 제가 가입한지 10일이 안되서 못보내나봐요ㅠㅠ 어떻게하죠?
저도 궁금하네요.. 조심스럽게 쪽지 부탁드려도 될까요ㅎㅎ
저도 부탁드려도 될까요ㅠㅠ
쪽지 보내주실 수 있나요?ㅠ
저도 쪽지 주시면 감사하겠습니다아아!!
저도 궁금합니다
저도 부탁드립니다!^^ 항상 감사해요
저도 쪽지부탁드려도될까요?ㅜㅜ
저도 부탁드려요 ㅠㅠ
국숭세단라인 성적대에서 표본분석을 통해 유의미한 원서영역 성공을 거두려면 어떤식으로 해야할까요?
수능때 대학 급간이 너무 떨어져서 ㅠㅠ
쪽지 드리겠습니다 ㅎㅎ
저도 쪽지 부탁드립니다
저도 같은 질문으로 쪽지 부탁드립니다!! ㅎㅎ
저도 쪽지 부탁드립니다
저도 부탁드려요ㅠㅠ
쪽지 부탁드립니다!!
저도 쪽지 부탁드려요!
저도 쪽지 부탁드려요ㅠㅜ
저도 쪽지 부탁드려요 퓨ㅠㅠ 감사합니당
글 잘 읽었습니다. 1년 전 글이지만 혹시 댓글을 보신다면 저도 쪽지 부탁드려도 될까요? 비모의지원자는 몇퍼센트로 잡아야 하는지, 모의지원사이트가 예측한 합격인원에 맞춰서 해도 되는지, 지거국 상위라인과 교대 지원에서 표본분석으로 유의미한 결과를 얻으려면 어떻게 하면 좋을지 조언 부탁드립니다. 메리크리스마스!
너무잘읽었어요 ㅎㅎㅎ
쪽지 봐 주시겠어요??
적절한 분석 시기가 언제부터인가요?
빨리 시작하신다면..성적표가 나오고 나서 몇일 후가 좋지 않을까 합니다 ㅎㅎ
감사합니당
감사합니다!
사람이 많아서 헷갈리네요 ㅜㅜ
개인적 질문 있으신 분들은 내용을 쪽지로 보내주시기 부탁드립니다!
좋은 글 감사합니다~
어렵다...
표본은 어떤 식으로 얻는건가요? 건동홍~국숭세단같이 중위권 학교들은 어떤 식으로 해아 하는지도 궁금해요!
저도 이게 궁금하네요 ㅠㅜ
글 감사히 잘 읽었습니다. 많은 도움이 됐어요 ~ ^^
이런 방법이 인서울 하위권 (국숭세단 이하)에서도 도움이 되는 방법일까요? 상위권은 몰라도... 이 구간은 약간 표본에 변수가 많은 걸로 알거든요 ㅠㅠ 어떻게 하면 좋을까요?