Chat-Gpt에게 수능 수학을 풀리고 출제시키면?
게시글 주소: https://orbi.kr/00062088124
Chat-Gpt에게 수능 수학을 풀리고 출제시켜보자.pdf
(글이 좀 길어서 첨부파일 받아서 보시면 압축적으로 볼 수 있을겁니다 ㅎㅎ)
안녕하세요. 파급효과입니다.
요즘 Chat-Gpt가 핫하죠 ㅎㅎ
저는 22년 11월 출시 2~3일 후부터 사용해 잘 이용하고 있습니다.
뉴스에 Chat-Gpt가 리트, 의사국가고시, 수능 영어, 수능 국어 등등 언어처리나 암기형 테스트에는
100% 정확도는 아니지만 어느 정도 강점이 있다는 것을 확인했습니다.
3~4년 전에 AI에게 수능 국어인가 풀렸더니 9점 나온거 보고
다들 깔깔거리며 '안심하십쇼. 휴먼'하던게 주마등처럼 스쳐가네요.
진짜 기술 발전의 속도는 빠른 것 같습니다.
근데 이걸 Chat-Gpt에게 수능 수학을 풀려 봤다는 기사는 못 봐서 제가 직접 해보기로 했습니다.
미국 SAT 수학문제는 데이터베이스가 많은지 쉽게 출제하고 쉽게 풀더라구요.
뭐 이거야 일도 아닐테고 이번엔 한국 수능 수학 문제를 내달라 했습니다 ㅎㅎ
만약 잘 내준다면 와따시 어쩌면 부자가 될 수도....
하지만 바로 컷!
한국 수능 관련 문제는 온라인에 풀린 문항들이 많이 없고
거의 다 한컴으로 작업해 코드가 많이 풀린게 없는지 이런 반응이네요.
하지만 여기서 포기하지 않았습니다.
"직접 수능 수학 문제를 번역해서 갖다주고 학습시킨 후에 비슷한 문항을 출제시켜보자!"
일단, 쉽게 쉽게 23 수능 4번을 가져다 주었습니다.
이를 오른쪽 그림과 같이 번역하여 풀게 하였습니다.
사람보다 속도는 살짝 느리지만 정답을 내긴 했네요.
여기에 감명을 받아 이 문제랑 비슷한 문제를 내보라고 시켰습니다.
실제로 비슷한 문제를 냈고 답도 잘 냈습니다.
근데 수능 4번은 너무 쉽고 간단하죠?
23학년도 수능 4번은 단순한 계산 문제에 가깝기도 하고 대수적인 해석만 필요한 문제입니다.
그래서 이번에는 기하적 해석이 필요한 문제로 테스트를 진행하였습니다.
난이도도 적당하고 기하적 해석이 필요하며 단순해 보이는 23학년도 수능 11번을 선택하였습니다.
여기서 의문이 드는 사람도 있을 겁니다. Chat-Gpt에는 그림 첨부가 안 되는데 어떻게 하나요?
수능 수학 문제는 원칙적으로 지문에 문제 구성에 필요한 모든 정보가 다 나와야 합니다.
그림이 없더라도 지문만 봐도 문제가 풀려야 한다는 의미입니다.
이는 시각장애인을 위한 배려로 알고 있습니다.
점자 수능 시험지를 만들 때 도형까지 옮겨올 수는 없으니까요.
(실제로 수능 문제에 주어진 그림을 가리고 풀어도 풀립니다. 좀 불편할 뿐이죠.)
말이 길었는데 결론은 수능 수학 문제는 그림을 넣을 필요 없이 굳이 지문만 번역해서 넣어도 됩니다.
문제를 열심히 번역해서 집어넣었는데 아쉽게도 자연스럽게 헛소리를 하며 오답을 냅니다.
그래도 희망을 잃지 않았습니다.
문제 푸는건 못하지만 비슷한 문제는 만들어낼 수 있지 않을까요?
오! 비슷한 문제를 출제했고 유효한 공식으로 잘 풀어냅니다.
다만, 수능 트렌드에는 벗어난 문제라 살짝 아쉽긴 하네요.
이번에는 욕심을 좀 더 내서 23학년도 수능에서 가장 어려운 문항인 22번으로 테스트했습니다.
제가 번역을 최대한 열심히 해봤는데 번역이 맞는지 모르겠네요.
사실 Chat-Gpt가 수식 쓸 때 Latex으로 작성하는 것 보면 저도 Latex으로 적는게 나았을까 싶네요.
아무쪼록 Chat-Gpt에게 ‘Continue Solving’으로 30분간 계속 풀게 해보았으나
답을 내지 못하고 헤메는 모습을 보여줬습니다.
다만, 인상 깊었던 점은 여러 헛소리로 문항을 풀려하다가
어느새 조건 (가)의 주요 아이디어인 기울기 함수(형광펜 쳐둔 ‘the Mean Value Theorem’)에
어느 정도 접근을 한 모습을 볼 수 있었습니다.
저기서 제가 올바른 방향성을 좀 알려주면서 lead했다면 답을 낼 수 있었을까 싶네요.
비슷한 문항을 만들라고 하니 비슷한 거 들고 온 거 같긴 하네요.
다만, 풀이는 헛소리이고 문항이 유효한지는 검토가 빡세게 필요할듯 하네요.
결론적으로 단순 개념 및 계산 문항들은 Chat-Gpt에게 번역된 문항들을 가져다준다면 잘 풀고
비슷한 문항들까지 알아서 출제가 가능하다는 겁니다.
문제가 좀 복잡해질수록 문항은 잘 못 풀지만 그래도 숫자나 설정을 살짝 바꿔 문항 출제는 가능합니다.
출제자는 이렇게 출제된 문제들을 숫자를 적절히 가공하거나 문항 출제에 좋은 아이디어를 얻을 수도 있습니다.
다음에 해 볼 실험은 좀 어려운 문항들과 ‘올바른 해설’을 Chat-Gpt에 넣고
비슷한 문항을 출제하고 풀 수 있는지입니다.
직접 해보고 어떤 모습을 보이는지 시간이 된다면 공유를 하도록 하겠습니다.
좋아요와 팔로우하시면 놓치지 않을겁니다.
제가 요즘 퇴물이라 글이 잘 묻힙니다 ㅋㅋㅋㅋ
PS)
요즘 출판과 별개로 수능 수학 관련해서 새로운 프로젝트를 준비하고 있습니다.
기존에는 없는 서비스이며 아마 5월 쯤에 정식적으로 선보일 듯 합니다.
0 XDK (+1,010)
-
1,000
-
10
-
손절하는 이유를 상대방한테 알려줘야할 이유는 또 뭐임? 6
내가 손절하는 사람 공통점이 상황 1: 이미 개같은짓거리를 나한테 너무 많이 했다...
-
.
-
이태린 이랑 다른 두명 제 조언은 거르시길바랍니다,,
-
밑에 드라마글 보고 생각남ㅋㅋㅋ
-
오늘 진짜 너무 집가고싶다
-
달라붙는게 4
제일 싫음
-
과외알바를 생각하시는 분들을 위한 매뉴얼&팁입니다. 5천원 커피값에 미리 하나...
-
양자 역학(거짓말쟁이 문장) 지문<<이거 어려운 거 맞음? 5
얼마만에 풀어야 함? 마지막 문단이 존나 엄인데 어려운 거 맞지? 지문 독해에 6분...
-
범바오보고싶다 0
베이스는 정병듀오로 다지고 허들링가면 조았던것 같음 깊생 아카이브에 잇는 문제들이...
-
폭삭 속았수다 1회부터 16회까지 몰입해서 정주행하면 7
현대 소설 배경지식이나 맥락 파악 부분에 있어서 싹다 마스터할 수 있음
-
중도에 왓름 1
사실 마음만 갓음 사실 마음도 안갓음
-
모르겠고 맛점 2
오늘 점심은 뚝불
-
신청완 3
시험보는거 오랜만이라 벌써 떨린다
-
시험 끝났어요 0
집 가서 자고 과외 준비 하고 오면 10시쯤 될듯
-
팔레트몰 여기엔 없던디
-
내신휴강인데 스블 미적 일주일 동안 0개 업로드면 도대체 뭘 하는거임 풀커리는...
-
ㅋㅋㅋ
-
절대 아무 약속도 없어서 강제로 쉬게된거 아님
-
상담받을 때 다른 반 선생님은 해주셨던거 같은데 우리반 담임은 해주려너 모르겠네 표본은 잇으려나..
-
팩트는 나같은놈도 오는곳이라는거임..
-
그래서 이거라도 신청했는데..
-
근데보정도상식밖인데 그냥 이해를 하면 안되겠다
-
ㅎㅎ 님들 밑자리 하나 사라짐
-
5덮 신청완뇨 6
-
[속보]이재명, 대통령 적합도 41%…가상 3자 대결도 모두 압도-NBS 3
이재명 더불어민주당 대선 경선 후보. 연합뉴스 더불어민주당 대통령 후보 경선에서...
-
회피 동생들 케어잘하는 착한 형인데
-
ㅇㅋ 2
ㅇㅋ
-
드릴중인데 공미 다해서 25문제?정도인듯 이정도면ㄱㅊ나
-
수행평가 대행 알바는 신이다.. 시급 12만원 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
-
ESD 2
(E)xtra (S)uper (D)uralumin..... 융합...
-
5월 21일 0
5덮이네 1달이면 되겠지
-
공보의 모자라단얘기는 존나 나오는데 저말이안나오는게 이해가안된다 걍나라가 말이안됨이게
-
너무 스트레스 받네요..
-
지금 그 개판을 쳐놓은 성적으로도 보정 2인데 가능하지않을까
-
과외 잘 할 자신 있는데
-
어느라인 갈 수 있나요 4덮 무보정이랑 보정컷 중간이 수능컷이었다고 뇌피셜로 가정해서 낸 백분위인데
-
미적분 lecture18에서 정체중이심ㅋㅋ 2월 완강 -> 3월 완강 -> 4월 완강(과연?)
-
국어 간신히 무보 1이네
-
회피형 싫어 0
회피형 회피하기
-
ㅇㅇ
-
등급은 정법 빼곤 똑같거나 오르긴 했는데 백분위가 궁금하구만요.. 화작확통정법사문...
-
생1 질문 0
무릎반사=척수반사라 연합뉴런 안 거치는거 아닌가요? 왜 ㄷ이 옳은 선지일까요… 되게 헷갈려요
-
1.무보정과 보정컷 사이에서 무보정에 더 가깝게 2.무보정과 보정컷 딱 중간...
-
이것도 회피형인가요? 19
사람들 손절할때 손절하는 이유 말하거나 화내면 그사람 기분나빠하는거 못보겠기도 하고...
-
현실은
-
신청했던 기억이있는데 신청 잘 됐나 궁금해가지고 신청 잘 됐는지 어디서 보나요??
-
96 96 1 99 95면 서울대 아무데나 뚫리는곳있나요? 10
더프 보정컷에서 이건 아닌거같아서 자체페널티줬음
-
37이 어캐 1등급 ㅋㅋ
-
등급컷 공식은 0
(무보+보)/2이니 즉 83점이 1컷 나는 84점 ㄴㅇㅅ!!!

AI: 난 대화가 하고 싶었는데.. 수능 출제 도구가 되버렸어..퇴물이라뇨
https://n.news.naver.com/mnews/article/448/0000394413?sid=102
있긴한데..
그 풀이방법등을 잘 리드하면 맞출 수도 있을 것 같기도 합니다. 뉴스에 나온 장면은 뭔가 걍 찍은거 같다는 느낌이 드네요. (저도 잘은 모르겠습니다)
전 저 chat-gpt와 22년 11월부터 함께해서 어느정도 답을 내놓는거 같습니다. 저도 초반엔 걍 엉뚱한 답들만 나왔어요. 매번 돌릴 때마다 답이 다르기도 하구요
주관식으로 냅두면 얘가 풀이 잔뜩 늘어놓으면서 괴정 보여줍니다.
Chain of Thought라고 해서 그 해결 과정을 프롬프트에 잘 넣어서 리딩해주는 것이 중요할 것 같네요.
계속 시도해봤는데도 잘 되지 않는다면 knowledge injection이 부족한 것 같기도 합니다.
minerva라는 모델은 좀 더 프로페셔널한 날리지들을 주입해서 만든 모델이라 자연과학을 꽤나 잘 푸는데, 이런식으로 chat gpt를 finetuning하면 수능 수학정도는 퓨샷으로 꽤 풀 수 있을 것 같네요
동의합니다. 당장은 아니겠지만 시간만 좀더 지난다면 충분히 가능할 것 같네요.

휴 아직 ai보단 수능공부를 잘하는거같아서안심
근데 멀지 않았을지도....
대수능 멸망의날
그러니까 이놈을 잘만 훈련시키면 저도 드릴에 한 문제 정도는 실을 수 있다는건가요?넵넵 그렇다고 볼 수 있죠.
다만, chat-gpt가 내놓는 문항을 검토하고 개조시키는 것과
본인이 직접 아이디어 내서 출제하는 것 중 어느것이 효용이 더 큰지 살펴보야 겠죠
원준쌤이 계속 말하시는게 이거구나 ㄷㄷ

대단하신 선생님이죠 ㅎㅎ수능개념 몇개 조교시키니까 22번도 풀순 있더라고여 근데 답은 나와도 좀 지저분하게 푸는 느낌이..
오 좋은 정보 감사합니다. 아마 chat-gpt가 미국 sat 수학에 맞춰져 그에 따른 해설을 따르느라 한국 수능 수학에 좀 약한거 같은데 저도 잘 교육시켜봐야겠네요
그냥 신기하네요 몇년만에 기술이 캬
그니까요 ㅎㅎ 저도 너무 기대가 되고 앞으로는 '어떻게 문제를 잘 풀어내느냐'보다는
'어떤 질문을 하고 어떻게 학습시키는지'가 중요할 듯 합니다.

미래에는 완벽학습된 ai가 자작문제 만들어 낼 수도 있겠네요.. ㅎㄷㄷN제시장 멸망 도래하나???
그런 ai를 만드려면 좋은 문항 데이터들을 많이 가지고 있는 개인이나 회사가 유리하겠죠 ㅎㅎ
이제는 더프가 아니고 "몇개년의 수능 문제들을 분석하여 만든 20xx학년도 A.I 실모" 이런게 시중에 나올수도..? 평가원... 해고가 머지 않았ㄷ.....

평가원은 계속 발전할 겁니다. 누가 먼저 따라잡힐지 ㅎㅎ오 수학문제도 ai로 완전히 새로운 문제 만들기는 어렵더라도 문제 벡터들의 유사도를 구해 유사한 유형의 문제들을 충분히 만들어낼수 있겠네요 좋은 아이디어 감사합니다
그렇다고 볼 수 있죠
수학기호들 f(x)나 이러한 기호들은 보통 unk 불용어처리될텐데 챗지피티가 워낙에 방대해서 그런지 이거까지 커버를 해주네요 ㄷㄷ
넵넵 ㅎㅎ 그래도 latex 도입하는게 제일 잘 알아들을 거 같네요
Question-answering 할때는 answer를 인풋으로 집어넣어주면 (ex: the answer for this quesion is: 8sqrt(5)) 더 잘 학습될거에요 화이팅!
ㅈ간이 미안해..

스앵님.. 스앵님이 퇴물이라 하시면....선생님은 워낙 월클이시라 ㅎㅎ 항상 존경합니다. 나중에 기회가 되면 꼭 뵙고 싶습니다 ㅎㅎ
사람 생각 다 똑같네요.. 저도 바로 수능 수학부터 번역해서 풀렸는데 조건은 잘풀어놓고 헛소리 하니까 아쉽
미국 sat 방식으로 푸는 것이 default여서 그럴거예요. 아무래도 시험마다 스타일이 있기에 ㅎㅎ
이거 돈복사 버그네
풀이 교육을 잘 시킨다면 충분히 활용할만한 거 같아요. 하지만 아직 1~4번을 벗어나는 난이도를 풀고 문제를 내려면 많은 노력이 필요할 듯 합니다.
수능 11번 문제에 square을 집어넣으셔서 정사각형이라고 생각하고 문제를 푼 거 같은데... 혹시 tetragon으로 집어넣으면 어떻게 되었나요?
말씀 주신것처럼 혹시 몰라 해봤는데 또 헛소리하는거 보면 ㅎㅎ
좋은 제안 감사합니다.
챗지피티한테 수능수학문제 풀리기라 ㅋㅋㅋㅋㅋ 생각지도 못한 발상이네요 ㅎㅎ

사실 생각은 다들 한번 쯤 했을 거 같은데 오답 내는거 보고 걍 ㅃㅃ 하지 않았을까 싶네요.전 풀이과정 접근까지 본거구요
혹시 수능트렌드와 벗어나는 문제라고 하셨는데
수능트렌드와 맞는 문제는 뭔가요...?
수능 문제와 형태나 풀이과정이 비슷한 문제라고 할 수 있겠네요. 근데 이 기준은 주관적이라 ㅎㅎ
혹시 n제 나오나요?
파급 n제는 나올 수도 있고 그렇지 않을 수도 있는데 윤곽 잡히면 말씀드리겠습니다 ㅎㅎ
ai출제가 요새 업계 화두긴 한가봅니다. 여러 곳에서 얘기가 나오는 걸 보니… 저는 부정적인 입장이지만, 긍정적으로 보시는 분들고 계시더라구요
저도 아직까지는 사람이 문제 만드는게 시간적으로나 퀄리티적으로나 비용적으로 더 효율적인 것 같습니다.
특히 과탐은 더욱요
답 남겨주신 걸 이제 봤네요! 의견 감사합니다 :)