페로즈(이유섭) [194126] · MS 2007 · 쪽지

2015-04-16 01:01:23
조회수 2,557

2013 연세대 편입 논술고사 시험문제 (사회계열)

게시글 주소: https://orbi.kr/0005892285



2013학년도 연세대학교 논술(편입)

입학시험 문제지(사회계열)



아래 제시문을 읽고 물음에 답하시오.




<제시문 가-1>



회귀분석은 미가공 데이터를 활용하여 다양한 원인 변수들이 하나의 관심변수에 어떤 영향을 미치는지 추정하는 통계
절차다. 와인 애호가인 마센필터는 무엇이 훌륭한 와인을 결정하는지 알기 위해 이러한 회귀분석 기법을
사용하였다. 그는 수십 년에 걸친 프랑스 보르도 지방의 날씨 데이터를 활용해 포도 수확기의 강수량이
적고 여름철의 평균기온이 높을 때 최상의 와인이 탄생한다는 사실을 발견했다. 보르도 지방에서는 여름철
기온이 높을 때 포도가 잘 익어 신맛이 덜하고, 수확기 강수량이 평균 이하인 해에 과즙이 진하게 농축되어
최상의 품질이 된다. 아래와 같은 그의 회귀분석 결과는 실제 데이터와 놀랍게도 잘 들어맞으며 와인 전문가들보다
높은 예측력을 보였다.



 



와인의 품질



  • 12.145
    * (0.00117 *
    겨울철 강수량 ) +
    (0.0614 *
    여름철 평균기온) -
    (0.00386 *
    수확기 강수량)



그렇다면 이러한 예측 과정에서 인간이 기계를 능가할 수 있는 힘은 무엇일까? 간단하게 말하면, 가설을 세우는 것이다, 인간에게 남겨진 가장 중요한 일은 우리의
경험, 직관, 논리 등을 사용하여 통계분석에 사용되지 말아야
할 변수들을 추측하는 것이다. 통계적 회귀분석은 다양한 요소들 각각에 어느 정도의 가중치를 두어야 하는지
알려줄 수 있다. 그리고 동시에 이러한 비중을 얼마나 정확하게 산정할 수 있는지 알려줄 수 있다. 그러나 각 요소들의 인과관계에 대한 가설을 세우는 데에는 결정적으로 인간이 필요하다. 회귀분석은 관심변수에 영향을 끼치는 원인이 있는지를 파악하고 그 영향력의 규모를 산정할 수는 있지만, 그러한 원인변수를 구체적으로 설정하는 데에는 인간이 필요하다.



 



<제시문 가-2>



통계적 예측 방법 중 신경망 기법을 이용한 한 연구팀은 사냥개 경주의 우승견을 예측하는 가상 신경망을 구축했다. 그들은 수천 건에 달하는 일일 경주결과표에서 50가지가 넘는 정보를
무작위로 추출하여 입력하고, 각 정보별로 다양한 가중치를 신경망이 시험하게 하여 어느 정도의 가중치를
두었을 때 가장 정확한 평가 결과가 산출되는지 파악했다. 이러한 반복 시험을 통해 가중치를 적절하게
적용하여 이후에 열리는 100차례 경주 결과를 예측했다. 심지어
연구들은 사냥개 경주 전문가들과 예측을 비교하는 시합을 벌였는데, 신경망 기법이 우승견에 대해 더 높은
적중률을 보였을 뿐만 아니라, 신경망 기법의 예측이 더 높은 배당금을 받기도 했다. 그러나 신경망 기법의 가중치 추정 과정은 매우 미묘해서, 각각의
개별 입력 정보가 예측 결과에 왜, 얼마나 영향을 미치는지 파악할 수 없는 경우가 많다. 회귀분석이 각 입력 정보가 해당 예측에 얼마나 영향을 미치는지 알려주는데 반해, 신경망 기법은 가중치 설정체계의 설계도를 모르느 것과도 같다. 예를
들어 회귀분석은 경주견의 과거 승률에 0.47의 가중치가 적용되어야 한다는 점을 알려주는 반면, 신경망은 강력한 예측을 제공할 수는 있지만 그것이 효과를 발휘한 이유를 알려줄 수 없다.



 



<제시문 나>



영국의 한 대형은행에서 일하는 호슬리는 범죄 프로파일러들과 데이터 분석가들로 팀을 꾸려 은행 데이터베이스를 샅샅이
뒤져 금융사기행각을 감지해 낼 수 있는 컴퓨터 프로그램을 작성했다. 그들은 뛰어날 프로그래머였다. 그러나 사기꾼들 역시 뛰어나고 민첩했다.기존의 금융사기 수법이 빠른
속으로 변형되자 호슬리 역시 나날이 사기꾼처럼 사고하는 능력을 연마해 나갔다. 수십억 개의 은행 데이터를
훑으면서 범죄 행위를 누설해줄만한 은행거래 패턴들을 모색했다. 그러면서 그의 알고리즘은 점점 더 촘촘해져
갔다.



호슬리가 무수히 많은 소액 은행 거래 데이터를 엄밀히 조사해서 사기꾼들을 감별해 낼 수 있었다면 해당 데이터로
잠재 테러리스트들의 신원을 파악할 수 있지 않을까? 실제로 9.11 테러에 가담한
19
명의 은행기록은 일반 은행 고객과는 구별되는 특정 형태를 보였다. 그들은 대형은행에
평균 4,000 달러를 넣고 계좌를 개설, 자주 바뀌는 사서함을
주소로 사용하고, 은행 거래 내역에 공과금, 할부금, 보험료 등의 일상적 생활비 지출이 반영되어 있지 않았으며 한 번에 큰돈을 예치하고 조금씩 현금을 인출하는 경향을
보였고 수표 이용에 비해 현금 인출 비용이 이례적으로 높았다.



은행 거래 특징을 소급해서 파악하는 것은 아직 행동을 개시하지 않은 테러리스트들을 파악해줄
만한 단서가 된다. 또 이들 19명의 프로필이 영국 테러범들의
은행거래 프로그램과 일치하라는 법도 없다. (복원되지 못한 부분) 테러리스트를
파악할 수 있는 은행거래 알고리즘을 개발할 수 있다고 가정해 보자. 해당 알고리즘은 그중 99퍼센트 정확성을 갖는다면 500명중 496명을 정확하게 구분해낼 것이다. 하지만, 해당 알고리즘은 또한 그들 가운데 1퍼센트, 5천만 영국인 중 무고한 50명의
사람들이 의심을 받을 수 있으므로, 그들이 테러리스트라는 의혹을 받고 당국에 꿀려 왔을 때, 얼마나 분개할 것인지를 생각해 보아야 한다.



제시문 가에서는 경험적 데이터를 분석하는 두 가지 통계적 예측방법을 보여준다. 두 방식의 차이점을 비교, 평가하시오. (글자 수 제한 없음, 50점)



통계적 예측방법이 제시문 나와 같이 인간의 행위에 적용될 경우 생기는 방법론적 한계와 사회적 문제점에 대해 논하시오. (글자 수 제한 없음, 50점)








0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.


  • 첫번째 댓글의 주인공이 되어보세요.