궁구리당당~ 개발일지
게시글 주소: https://orbi.kr/00078718629
오늘은 피곤하구만요.. 통시적 순서에 따라 보고할게요 이제부턴!
오늘 새벽의 경험을 바탕으로 내장SSD, USB, 클라우드 연동 이렇게 3단계에 걸쳐서 정보를 저장하기로 했어요. 따라서 이젠 파일 손실 문제는 발생하지 않을 거예요.
논리블록을 활용해 문제를 뽑았지만 불만족. 이후로 2차례에 수정을 거쳐서 나름 괜찮은 문제를 뽑았다고 생각했어요.(나중에 보니까 완전 똥똥인 듯.)
25년도에 시행된 고3 10모를 학습시키고, lint 체계 보완(3차에 거쳐서)을 했어요. 보완은 사진 짤림 문제를 해결하고자 한 것이에요.
아침에 나름 제 생각에는 획기적인 발상이 떠올랐어요. 직원을 한 명 더 고용하는 거지요. 그래서 codex씨를 델꼬 왔어요. 제가 생각했을 때, 이 방식을 통해 제가 기대한 것은 토큰 관리 수월성, 업무 분담에 따른 할루시네이션 현상 감소, 상호 비판을 통한 변증법적 수렴 발전이에요.
구체적으로 설계, 점검, 관리의 업무와 생성, 정리의 업무를 분리했어요. 우리의 신입 코덱스씨는 후자를 담당했지요. 상호간에 소통과 진행도 공유를 위해 일종의 채팅방 겸 log저장소를 개설했어요.
이 체계를 어느 정도는 완성하고 문제를 생성했어요. 문제는 꽝..
따라서 1차 검수뿐만 아니라 2차 검수 과정도 계획했습니다. 2차 검수의 초기 목표는 이 문제가 평가원스러운 문제인가를 검증하는 게 목표였어요.
몇 차례 추가 테스트를 거쳐, 2차 검수의 범위와 과정을 대폭 확대하게 되었어요. '교육과정 정합성 검수 -> 난이도 적절성 검수 -> 평가원 적합도 검수' 이렇게 3축 체제로 진화시켰어요.
자동적인 업무 진행을 위해 scheduling과 모니터링 시스템을 도입하여 이제 에이전트들끼리 피드백을 자동으로 할 수 있게 되었어요.
또 몇 차례 테스트를 진행하다가, 기존 생성된 문제와의 유사성 제한을 3축 체제에 추가하여 4축 체제로 발전시켰어요.
오늘의 가장 큰 문제는 이 4축 체제를 통해 문제를 완전히 걸러내는 시스템 구축이었어요. 4축에 각각의 점수와 단계를 부여해서 특정한 점수나 조건이 만족되지 못하면 검수자인 안티그래비티가 문제를 반려하고 코덱스에게 수정을 요구하는 그런 방식이에요. 이렇게 루프를 돌면서 수정을 거치면 최종적으로 만족스러운 문제가 나올 것이다는 게 제 생각이었죠.
하지만 여러 차례의 테스트에서 검수 과정에서의 빈틈이 조금씩 보이더군요. 그래서 생각해 본 결과.. 하위 에이전트와 그들 간의 동기화를 통해서 한 번에 수 개, 수십 개의 문제를 뽑아내고 각 문제들마다 검수 과정에서의 문제점을 분석하여 검수 체계를 보완하려고 했어요. 또한 표본도 매일 조금씩 늘려서 문제의 가능한 풀과 학습량을 늘리고자 25년도 시행된 고3 9모도 학습시켰어요.
하지이만~ 토큰 이슈로 일단 오늘은 여기까지~~
(저번에 바이브 코딩인가? 얘기하셨던 분이 있으셨는데 제가 그 땐 몰랐지만 지금 제가 하는 게 바이브 코딩이더군요! 죄송해요)
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
방금 Jit 시즌1 2회 풀었는데요 천안에서 고속국도가 영남 호남 이렇게 나뉜다고...
-
JIt 라운드 오프 세지 한지 9 1
1회씩 풀어봤는데 진짜 개 좋다 이모다 이미다 다 푸신 분들은 꼭 사서 풀어보세요...
-
JIT시즌2 1회차 0 0
근래에 풀었던 시험지들중에서 최근 기조를 제일 잘 반영한 시험지 같네요. 기존...
-
JIT N제 프로 1 2
어제 서점에 있길래 사서 5일차까지 풀어봤는데 문제가 맛있네요. 추론이 필요한...
-
2024학년도 대학수학능력시험 한국지리/세계지리 간략 총평 15 3
안녕하세요. ilovemarin입니다. 먼저 2024학년도 대학수학능력시험...
염소보단 역시.. 소고기!

실망이예요
ㅈㅅㅎㄴㄷ..