chatGPT 소개 + 공부 방법 예시
게시글 주소: https://orbi.kr/00062417862
오늘 아침 chatGPT (GPT-3.5)의 최신형 모델인 GPT-4.0이 출시했다.
GPT-4.0 개발사인 OpenAI 블로그 포스트를 살펴보면,
https://openai.com/product/gpt-4
GPT-4.0은 단순히 성능이 나아진 것뿐만 아니라,
이제는 이미지를 인식하고 입력할 수 있을 뿐더러
사이트에 대한 링크를 제공하면 웹사이트의 내용을 요약할 수 있다.
위 두가지 task는 기존 NLP (자연어처리 – 인공지능의 한 분야)로
얼마든지 할 수 있었던 작업이긴 하지만,
chatGPT라는 아주 무거운 모델에 메모리 부하 없이 해당 기능을 추가했다는 점에서
아직 인공지능이라는 방대한 영역에 한 발자국 담근 학부생 입장에서
이러한 혁신을 일궈낸 openAI 개발자들이 정말 대단하다고 생각한다.
이번 글에서는 chatGPT에 대해서 간단하게 설명하고
chatGPT를 활용해 공부에 도움받는 방법을 소개하고자 한다
직접 해보면 어떻게 쓰는지 빠르게 감을 잡을 수 있으니까
웹사이트에 들어가서 일단 시도해보자.
기존 chatGPT 모델 (gpt-3.5)는 무료고
성능이 좋은 GPT-4.0 은 한달에 20달러다.
처음부터 인공지능이 이렇게 똑똑한 건 아니었다
인공지능 기준으로 18년도는 아주 오래 전이지만
불과 5년 전만해도 AI는 우가우가 침팬지만도 못한 성능을 보였다
수능은 5지선다고 하나의 숫자로 답을 밀기만 해도 최소 20점은 확보하니까
4번으로 답을 몰아 쓴 침팬지만도 못한 것이 자연어처리 AI의 현실이었다.
사실 chatGPT의 근간이 되는 기술은 이 때 수능을 푸는 AI와 거의 동일하다.
하지만 어느 점을 보완했기에 이렇게 엄청난 발전을 이룰 수 있었을까?
그 원인은 바로 이 멍청한 학생에게 아주 뛰어난 과외 선생님을 붙여줬기 때문이다.
알파고의 학습방법이기도 한 강화학습 (Reinforecement Learning)은
우리 침팬지가 오답을 내더라도, 답변에 대한 보상 (Reward)을 정의하고
이 보상을 최대화하는 방향으로 수백 번 모델을 훈련시켜서
각 훈련마다 조금씩 정답에 가까워지도록 공부시키는 AI계의 일타강사라고 할 수 있다.
chatGPT도 이와 같이 매 판마다 오차를 줄이고 정확도를 높여가면서
결국에는 이렇게 뛰어난 학습모델이 된 것이다.
그러면 우리는 이 프로그램을 사용해서 어떻게 공부에 도움을 받을 수 있을까?
대학생들은 이미 과제를 푸는 데에 있어 많이 사용하고 있을 거라 생각해서
수능 영어문제 풀이를 예시를 들어 설명하겠다.
이 문제는 작년 2023년 수능 영어 32번 문제다.
정말 당연한 듯이 정답을 맞추었지만, 이 해설을 가지고 공부하기에는 답변이 많이 빈약하다.
그래서 우리가 진짜 원하는 답변을 받으려면
선생님 혹은 과외선생님한테 질문하는 것처럼 조금 더 자세한 해설을 요구해야 한다.
설명을 요구하니까 조리 있게 잘 설명한 것 같긴 하다.
하지만 나는 영어 문단을 처음부터 독해하는 것부터 막히는 실력이라,
문단 내용을 잘 모르기 때문에 이 설명도 잘 이해가 되지 않아서 처음부터 독해하는 해설이 필요하다.
그래서 문장 단위로 해석하라고 지시해서 나온 내용이다.
그런데 영어 문단 해석에서 문법이 중요한 역할을 하는데, 문법 분석이 빠진게 약간 아쉽다.
그래서 문장 단위로 문법을 설명하라고 지시하면 얘가 알아서 출력해준다.
디테일에서 조금 빈약한 점이 느껴져서 이 부분은 다음에 더 개선된 모델을 기다리거나
내가 질문을 조금 더 자세히 입력해야 한다.
가끔가다 출력이 5000자를 넘기면 답변이 끊기는 일이 발생하는데,
이 때 이어서 출력하라는 명령을 하면 그대로 이어서 출력해준다.
내가 공부하고 있는 해설지에서는 이러한 공부방법을 제시했는데,
이 수능 문제에 해당 공부방법을 적용하고 싶어 생각이 들면
그대로 해주라고 지시하면 바로 결과가 나온다.
이렇게 chatGPT를 활용해서 실제 과외선생님에게 질문하는 것처럼
자신이 막히는 문제에 대한 해설을 요구할 수 있다.
하지만, 앞선 예시와 같이 자신이 알기를 원하는 내용을 상세히 적어야 원하는 답을 얻을 수 있다.
자신이 부족한 점이 무엇인지 인식하고,
이에 대한 해답을 chatGPT에 넣어서 해설을 보고 공부함으로 복습한다면,
정말 괜찮은 공부 방법이 될 수 있을 거라고 생각한다.
위의 문제는 2023년 국어 10번 문제인데, 너무 뻔뻔스럽게 정답을 맞혀버렸다.
이렇게 국어 등 다른 과목도 영어 때의 접근방식과 비슷하게 풀이를 불러올 수 있다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
김승리 ebs 0
엡스키마랑 kbs랑 다른 점이 뭐임? 엡스키마는 켑에서 한거 가지고 문제 푸는건가
-
2학년이고 선택과목을 경제를 선택했는데 인원수가 33명이라서 1등급이 1명이기에...
-
레이드 가야하는데
-
다들 화이팅입니다.. 혹시 제 커리도 한 번 봐주실 수 있으시련지요 ㅠ 의대에서...
-
누가 칼들고 협박한거임
-
https://orbi.kr/00072877419 투표 고고혓
-
흐음.
-
화1이랑 화2중에 뭐할까요? +지구는 고정인데 47나왔습니다
-
3월 더프 국어 100 수학 100 영어 97 화2 47 생2 48 4월 더프 국어...
-
생윤 사랑꾼 솔직히
-
고루고루 좀 하는 편
-
뭐가 낳냐
-
더프 특 0
독서론이 어려움 ㅋㅋ
-
근데 내가 밀고 있는 이론인데 독서론이 생각보다 좀 까다로운거 같음 차라리 독서...
-
고대vs성대 0
유튜브 댓글 보는데 성대가 고대 2년 연속으로 입결 땄다, 지금 고3들한테 성대갈래...
-
현역 4덮 국어 0
언매 다맞췄고 문학 1틀 비문학 2틀 첫페이지 독서론 2틀... 장애인이 맞는듯...
-
백분위 몇 정도 뜰까요?
-
첫 풀이 5000덕 드리겠습니다!
-
말리지마라
-
머리 딸리고 논리 딸리면 꼭 메신져 공격밖에 못함. 메시지에는 반박도 못하면서
-
내가 대학 다닌다 밝혔을 때 와 너 땡땡대 다녀?? 소리 나오면 충분하다고 생각함...
-
독서지문 풀 때 단기기억력이 안좋아도 상관없을까요? 0
이해만 하고 넘어가는게 아니라 머릿 속에 지문내용 집어넣어야 하는지요
-
ㅈㄱㄴ
-
확통 사탐인디 국민대 건축 확통으로 뚫으려면 수학 안정2는 받아야하겠죠.? 미적...
-
작년입결 3
서성한이랑 연고랑 별로 차이안낫던거로 기억하는데 맞나요?
-
놀러가고 싶어 3
내일 갈까
-
밥머꼬합시다 10
배고파
-
오르비에 고학력자들만 있어서 그런지 너무 눈이 높아벌임... . 나도 명문대 보내달라구우웃
-
방학때 기숙학원 들어가서 1달 공부했는데 그게 무리가 된 건지 갑자기 숨이 너무...
-
4덮 공통 1
고3 현역이고 찍맞 없이 15,21,22틀인데 이정도면 어느정도 실력일까요..
-
아아.. 한강 이남 최고의 종합대학..
-
여기서나 n수쳐서 눈 높아진 애들 + 머리에 마 낀 현연들 때문에 그렇지 애초에...
-
허수유입은 없는데 의반 대깨설 등등 상위권들은 생2끼고 들어오네 23수능급으로...
-
[국어못함주의] 4덮 언매 73 보정 몇등급 예상임요? 4
원래 국어 오지게 못했어서 3뜨면 성장인데 4뜰라나
-
수리적 요소가 강한 도표, 선거구, 기후같은 유형 업그레이드가 아닌 개쓰레기 지엽...
-
외출이라 시간 한가해서 잠깐 질문 받을게여 아는 선에서 답해드립니다
-
1의 자리까지 맞춰야함 특이사항: 노뱃, 측정한지 오래됨
-
28분정도..? 50점 사문을 시간 다 써서 풀 줄은 몰랐는데 좀 사문 공부를 더...
-
흠 6
-
으
-
기출 벅벅 입문 N제 여러개?
-
막 80 90 뜨는 이런사람들은 대체뭐임 화학러인가
-
닉변 뭘로하지 5
추천좀
-
무 1
물
-
만우절 닉변의 폐해가
-
윤석열 전 대통령의 지지자들이 19일, 주말을 맞아 서울 도심 곳곳에서 '윤...
안녕하세요. 글의 내용에 약간 오류가 있는 거 같아 댓글 남깁니다~ chatGPT 아키텍처는 강화학습 모델이 적용되지 않았습니다. 자연어 처리 분야에서의 획기적인 성능 향상은 Encoder-Decoder에 Attention 노드를 도입한 Transformer 아키텍처의 개발 덕입니다. 사진에서 첨부한 2018년 즈음이면, attention node의 연구가 막 이루어지던 시점인 것으로 생각됩니다. 아마 사용된 모델의 아키텍처도 Transformer가 아닌 LSTM이나 GRU 계층에 의존하는 Rnnlm이었을 걸로 예상됩니다. 이 아키텍처를 개선한 Transformer모델이 성능 향상의 핵심이었지 강화학습이 자연어 처리에 적용됐다는 건 정확하지 않습니다. 강화학습은 자연어 처리보다는 다른 영역에서 더 적합한 기술이기 때문입니다. 예를 들어 말씀해주신 알파고 같은 경우가 그렇습니다. 하지만 자연어 처리 영역은 많이 다르다는 것이죠.
또한, chatGPT는 비지도 학습 또한 적용되어 학습되었기 때문에 보상을 늘리는 방식의 학습이 애플리케이션 성능을 향상시켰다는 것은 적절치 않습니다.
이 외의 chat GPT를 공부에 활용하는 방법은 참 좋은 거 같네요~ 저도 많이 배워갑니다~
즐거운 하루되세요 ^^
무슨 틀린 얘기를 이리도 길게... ㅋㅋㅋ chatgpt는 논문이 따로 없는데 instructgpt를 그대로 사용했습니다. 그러니 해당 논문을 참고해보면 RLHF를 사용했다는걸 알 수 있어요.
gpt3의 결과를 랭킹한다음 그걸로 학습한 모델을 일종의 리워드 함수로 사용한거죠..
사실 검색만 해봐도 나오는 사실을 이제막 ai배우시는분인 것 같은데...
알파고같은데만 쓰이는게 아니라 최적화와 관련된 모든 분야에 강화학습을 사용할 수 있어요.
예를들어 퓨샷같은 메타러닝에도요.. 찾아보면 in context learning을 더 잘하기 위해 퓨샷 전용 강화학습 적용하는 경우도 있어요
강화학습이 쓰이지 않았다니 ㅋㅋㅋ 당장 유저 인풋을 반영해서 새로운 보상을 제시한다고 밝힌 내용인데 chatgpt는 절대 순수 generative model로는 만들 수 없는 모델이에요 그리고 gpt모델의 베이스 모델인 transformer가 쓰이지 않았다는거는 무슨 말씀이신가요? Gru는 디퓨전 모델이나 GAN에 자주 쓰이지 gpt는 순서정보가 중요해서 트랜스포머가 우월전략이 확실합니더
트랜스포머가 아니라 rnnlm을 사용했다고 너무 당당하게 단언해버리시면 zzzzzz 설마 트랜스포머의 feed forward층에 있는 gru층을 rnn구조라고 생각하신건가요 ^^b
트랜스포머가 2018년의 혁신이긴 했지만 그로부터 gpt2까지 오면서 대중들에게 크게 와닿지 않았던 이유는 nlp모델로만 이루어진 모델은 성능에 한계점이 있었기 때문이에요 당장 gan만 봐도 아무리 비지도학습을 열심히 해도 모델 collapsing현상이 나오잖아요? 그래서 강화학습이 쓰인거고 그래서 빅테크랑 개인간의 간격이 벌어지느 거에요. 빅테크가 주도하는 사회변화는 이제 거부할 수 없을 겁니다