dk0723 [707243] · MS 2016 (수정됨) · 쪽지

2017-01-01 06:10:23
조회수 544

fait 합격예상률에서 평균의 의미....

게시글 주소: https://orbi.kr/00010410611

fait는 과거 입결자료를 통해서 해당학생의 학과별 합격예상률을 제공하고 있다..


합격예상률 50%라면 과거 입결로 보아서 학생의 성적이 평균적으로 과거 입결의 실제 최종합격컷 언저리에 있다는 것이다..


fait에서 제공하는 학과별 예상합격률을 보면 나의 성적이 과거 평균 쵱종합격컷에서 어느 정도의 위치에 있는지를 파악할 수 있다..


이러한 통계자료는 ㅈㅎ사 같은 실제 모의지원결과로 최초합, 추가합, 불합 등을 평가하는 시스템과는 별개로 나름 상당히 유익한 정보를 제공해준다.. 


각종 통계분석자료를 제공하는 것은 fait의 장점 중의 하나이다..



이러한 통계자료를 해석함에 있어서는 매우 신중할 필요가 있다..


예를 들어서 합격예상력을 측정할 때 예측오차의 평균을 잘못 사용하면 평균의 오류를 범할 수가 있다..



즉, A학과의 실제 합격최종컷이 합격예상률 90%,

B학과의 실제 합격최종컷이 합격예상률 10%에 해당된다면,


합격예상력(forecasting power)은 실제 합격최종컷이 합격예상률 50% 근처에 머무를 때 최고인 것이다.. (원래 fait의 합격예상률이 그렇게 디자인되었기 때문임)


위의 A와 B 두 학과의 경우에는 합격예상력이 엉망인 것이다..


그런데, 합격예상력을 측정할 때 두 학과의 합격예상률의 평균인 50%(90%와 10%의 평균)을 사용한다면 이는 흔히 범하는 평균의 오류인 것이다..


서로 예상방향이 다른 것을 평균을 내어버리면 오류를 범하게 되는 것이다..


즉, 예측오차들을 단순히 합하여 평균을 구한 것이나 마찬가지인 것이 된다..

예측오차의 합은 샘플수가 많아지면 zero에 수렴하기 마련이다..


fait와 같은 경우에 있어서 합격예상력을 측정하려면


실제 최종합격컷이 합격예상률 50%에서 어느 정도 벗어나는지를 측정하여야 한다..

(위로 벗어나든 아래로 벗어나든)


말하자면 예측오차의 평균이 아니라 예측오차의 절대값의 평균같은 분산개념으로 합격예상력을 측정하여야 예상력을 언급할 수 있다...


이른바 통계능력이 상당한 fait관계자들이니 합격예상률의 예상력을 측정할 수 있으리라 본다..

예를 들어 합격예상률 데이터를 시뮬레이션하여 예상오차를 생성해낸다면 예상력을 측정할 수도 있으리라 생각된다..


추신... 막내딸의 입시관계로 한달여간 오르비 폐인이 되었음....




 













 

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.

  • 95년 응애 · 453954 · 17/01/01 06:15 · MS 2013

    자식한테 이런 부모님 계시면 정말 입시 편하게 할 듯

  • Fait · 366553 · 17/01/01 18:09 · MS 2010

    이것은 정확한 해석은 아닙니다. 많은 분들이 쉽게 이해하기 어려워하시는 주제이긴 한데,

    만약 저희가 예상 최종합격선(합격확률 50.00%) 근처에서 확률이 천천하게 변하게 하면
    대부분의 합격선이 50% 근처에서 형성되게 만들 수 있습니다.
    가령 530점에서 합격선이 형성될 것으로 예상될 경우
    529~531점에게 모두 50%를 주고
    528, 532점에게는 49%, 51% 를 준다면
    나중에 합격선 형성 지점을 조사해 보면, 대부분의 학과에서 49%, 50%, 50%, 49%, 51% 같은 식으로 합격선이 형성될 것입니다.
    하지만 이렇게 되면 예상합격률 55% 에서는 실제합격률이 51%가 아니라 100%인 셈이 됩니다.
    반대로 예상합격률 45% 에서는 실제합격률이 0%인 셈이 되지요.

    예상합격률 20%라고 했으면 20%만큼의 학과는 정말 20% 에서도 합격이 가능해야 합니다.
    예상합격률 70%라고 하면, 30%만큼의 학과는 70%에서도 불합격해야 합니다.

    이렇게 만들기 위해 합격확률 50% 근처 위치에서는 아주 예민하게 확률이 변하게 됩니다.
    소수점 만큼만의 변화로도 40~60% 를 왔다갔다 합니다.


    5개 학과에 대해 추정을 했을 때 그 추정이 최고의 정확도를 보이려면,
    합격선이 형성된 지점에서의 추정 합격 확률이
    50.5%, 48%, 52%, 55%, 46% 같은 식으로 되는 것이 아니라,

    이를테면 56%, 83%, 17%, 34%, 66% 같은 식이 되어야 합니다.
    이렇게 되면 80% 지점에서 원서를 넣었을 때 80% 의 확률로 합격을 하고 (83% 인 학과에만 불합격하게 되니까)
    20% 지점에서 원서를 넣었을 때는 20% 의 확률로 합격을 하고 (17% 인 학과에만 합격하게 되니까)
    40% 지점에서 원서를 넣었을 때는 40%의 확률로 합격을 하게 됩니다. (17%, 34% 인 학과에만 합격하게 되니까)

    그러면서 동시에 위 확률들을 평균하였을 때에도 50%에 가깝다면 추정 자체가 어느 한 쪽으로 치우침 없이 균형을 맞춘 것이 됩니다. (위의 예에서는 평균 51.2%가 되지요)

  • XuANhb9CfpxDWv · 722085 · 17/02/08 20:46 · MS 2016

    Fait에서 80% 라고 하더라도 안심하면 안되겠군요. 하지만 지난번 2016 년 Fait 실적 분석을 보면 80%인가 이상이면 실질 합격 확률이 100%로 나오던데.. 이 부분은 오르비가 지원자 수의 증가 등을 모두 반영한 덕분으로 보아도 되나요? 그래도 올해 지원자와 과거 지원자의 지원 성향 차이가 있는데(예시: 의치한에 대한 선호도 증가 등) 이러한 부분도 보정을 해주나요?