누가 봐도 07이 확실한,
게시글 주소: https://orbi.kr/00078726798
대한민국이 공식적이며 진실되게 보증하는 응애07, Rees의 오늘자 개발일지입니다.
![]()
저번에 토큰 부족으로 생성하지 못했던 서로 다른 모델을 포함하는 하위 에이전트들의 복합적 문제 생성은 가능한 것으로 확인되었습니다. 다만, 생성하다가 말고, 다시 생성해서 그런지 문항 생성 규칙을 위배하는 오류를 발견했습니다. 분명 이중으로 1차 검수를 진행하게 되어있으나.. 뭐 암튼 결과는 그렇습니다. 추가로 antigravity의 scheduling 기능은 powershell 종료시 같이 종료되기에 모델 활성화 이후, 최소 한 번의 명령이 필요한 것을 확인하였습니다.
토큰으로 고통받았기에, 오늘은 토큰 사용량 최적화를 위해 힘썼습니다. 우선, 에이전트 자체 기능을 활용한 방안부터 보고하겠습니다. antigravity의 context caching을 활용하여 AGENTS, 수학_문제_제작_및_설계_지침, 2차_검수법 파일을 클라우드 저장하였습니다. 이를 통해, 각 파일을 다시 읽으며 발생하는 토큰 손실을 줄였습니다.
다음으로 codex에게는 처음 문항 생성시, 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할만 한 최대 7개의 문항을 추려서 작업하도록 설정하였습니다. 이를 통해 토큰 낭비를 줄이고 참고 문항에 대한 할루시네이션 현상도 줄일 수 있음을 테스트를 통해 확인하였습니다.
오늘 한 일의 가장 핵심이 되는 구조적인 개혁을 설명드리겠습니다. antigravity는 a로 codex는 c로 표기하겠습니다. 명령과 수행 순서입니다.
1. '수학1, 15번 최상 난이도, 삼각함수, 3문제.' 와 같은 형식으로(과목, 난이도, 대단원, 문항수)를 c에게 지시합니다.
2. c는 AGENTS, 수학_문제_제작_및_설계_지침를 확인하고 database 내의 모든 기출 문항 중 자체적이고 임의적인 판단을 통해 선별된 문항들을 선별.
3. c는 이를 통해 문제의 초안 겸 완성본의 구조를 지닌 문제를 제작
4. c는 자체적인 1차 검수를 수행 후 a에게 문제의 1차 및 2차 검수를 요청
5. c의 요청을 받은 a는 1차 및 2차 검수를 통해 문제별 점수를 책정 후 c에게 피드백 전달.
6. 기준 점수 미달인 문제는 c가 피드백을 바탕으로 수정 후, a에게 전달. 기준을 충족한 문제는 최종본으로 database에 분류 기록.
7. 이와 같은 2차 검수를 loop하여 마지막 문제까지 database에 분류 기록.
하지만 이 과정은 토큰 소모가 큽니다. 따라서 다음과 같이 구조를 수정하였습니다.
1. '과목, 난이도, 대단원, 문항수'를 c에게 지시합니다.
2. c는 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할 만한 문항 최대 7가지를 추려서 reference digest라는 참고사항이 포함된 문제의 LaTex형식 축약본을 작성.
3. 이 reference digest만을 이용하여, c는 문제의 1차 및 2차 검수는 가능한 초본을 작성.
4. c는 초본을 1차 검수 후, a에게 1차 및 2차 검수 요청.
5. a는 초본에 대한 1차 및 2차 검사를 수행 후, patch형식으로 수정을 요구.
6. 이를 통과한 문항은 c가 최종본으로 작성하여 database로 분류 기록. 수정요구된 문항 중 65점 미만의 문항은 폐기 후 재제작. 65점 이상 85점 미만의 문항들은 Delta recheck방식을 최우선으로 수정 및 재검수 요청.
7. 마지막 문제까지 loop과정이 완료되면 database에 분류 기록.
다음으로 직접 문제를 생성하여 효과를 테스트해보고 싶었으나.. antigravity의 주간 토큰 한도 제한으로 실패..
따라서 남은 시간에는 이러한 토큰 제약을 타파할 방법과 이론적인 개선안 구상, 프로그래밍 공부에 시간을 썼습니다.
이론적인 개선안은 클라우드가 아닌 로컬 기반 모델 Qwen과 opencode를 결합하여 ingest의 일부, 생성 과정의 일부 검수 과정, 개발일지 작성, 등을 맡기는 방안을 세웠습니다. 문제는 노트북 사양이죠. 새 노트북이 배송될 때까지는 구현 불가능입니다. 추가로 claude code까지 도입을 검토하고 있습니다.
이론적인 개선안으로는 표본 분석에 대한 최적화가 있습니다만.. 아직 구상 중이라 여기선 생략하겠습니다.
마지막으로 프로그래밍 공부는 뭐.. 그냥 공부입니다.
이상 명명백백하고 투명하고, 확실하며, 공식적이며, 보장받는, 엄연한 07 Rees의 24일자 개발일지였습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
틀린건 우리나라 실력
-
안 보고 곤부한 내가 슨리자 ? 19 1
근가
-
한국 축구 특 8 4
1. 조별에서 개 털림 근데 한 경기는 또 갑자기 존나 잘함 2. 32강 자력 진출...
-
축구 괜히봄 0 0
그냥 이럴거면 공부할걸 재미있게 진것도 아니고 보다가 졸았음.. 수비수 셋이서...
-
이 허함을 어케 채우지 0 1
아 공허해졌어
-
이제 손흥민 0 3
없다고??
-
뭐 16강에서 한일전이 어쩌고 한다고?
-
매국노 메타 4 0
일본 응원한다
-
3백축구 0 0
지고 있어도 3백이라니.. 감독님은 콘테가 아닙니다.. 막판에도 후방에 5명이나...
-
요즘 국뽕들 속상해죽을듯 1 2
그래도 하이닉스 잘나가니까 상관없나?
-
홍명보 구속시켜라 2 6
특검하자 다른 걸 할 때가 아니다
-
국뽕은 정신병 6 5
개 씨 발 ! ! !
-
파마늘이 전술 더 잘 짤거같으면 개추 13 37
마늘아 너가 대신 감독해라
-
미쳤다
-
이정도면 선견지명 ㅇㅈ?? 11 4
https://orbi.kr/00078681413#c_78681450 6.19에...
-
행복부엉이 개빡쳐서 1 2
말투 고쳐진게 웃음벨임
-
내가 밉다 2 0
아흐 오늘 롯데 야구나 봐야지
-
ㅋㅋㅋㅋㅋㅋㅋ
-
와썅 1 1
시발
-
아 우리 학교 개웃기네 0 1
축구 졋다고해서 밥을 굶으면 안 된다고 안내방송나옴
-
아다때주는착한누나포지션이냐 시발 ㅋㅋㅋㅋㅋ
-
[속보] 한국, 남아공전 0-1 패배 18 18
[속보] 한국, 남아공전 0-1 패배
-
대규모 산책회 ㄷㄷ 0 1
근데 국비지원을 받는。
-
그래서 32강 가는거임? 5 2
룰 머무 헷갈리네
-
축구가 아님 그냥 1 1
로또크로스만 계~~~~~속올리네
-
대 윈 터 ㅋㅋㅋㅋㅋㅋㅋㅋ
-
ㅋㅋ 0 0
멕시코전때부터 싸했다 에후..
-
[속보]'남아공전 충격패' 홍명보호, 조 3위 추락…자력 32강 진출 실패 3 3
홍명보호가 남아프리카공화국에 충격적인 패배를 당하며 자력 32강 진출에 실패했다....
-
존나 모다네 1 0
어휴 눈만 버렸네
-
꿀같은방학에 이게뭐냐 ㄹㅇ
-
축구 보다 인생이 더 중요 0 0
-
난 뭘 바래 2시간을 버렸지 1 1
ㅅㅂ
-
골이 터져야 매상이 올라가는데 0 1
으이!!
-
ㅂㅅ들 0 1
볼돌 존나하네
-
우리 진짜 32강 못가는거야? 3 0
명보야 넌 돌아오지 마라
-
졌느 0 0
ㆍ
-
전개가 느린가 0 0
공격할려그럼 그냥 상대 다 내려와있어
-
나가라 0 0
ㅇ니ㅣㄷㄱㄷㅂㅈㅍㅊㅂ
-
추가 6분 0 1
에휴 끝났지 뭐
-
한완수 스블 3 0
한완수 스블 두개 같이 하는거 어떰?? 만약 같이하면 한완수는 상,하 뭘 해야할지 모르겟음
-
한화보다 더빡치네 1 0
그냥 접어라
-
수능 국어보다도 쉬운거 같은데
-
라인 올리고 내리는게 느리다 0 0
그리고 제공권이 안잡히는데 왜 자꾸 공을 비행기 태워
-
제육덮밥 만원이면 먹음? 4 1
난안먹음
-
다들 왜 걸어다니는거임 4 0
산책할려고 경기장왔나
-
명보야 앞으론 니 대가리로 굴려서 전술 짜지 말고 2 3
제미나이 프로 구독해서 풀어봐라
-
내돈 시발 0 0
하
-
상상 이감 1 0
이감만 주구장창 풀다가 상상 푸니까 느낌이 다르네
-
@ㅐ미 4 1
무슨 롯데 자이언츠 보는 거보다 속이 더 터지네 내가 롯데를 7년째보고 있는데
죄송합니다. 깜박하고 잡담 태그를 안 달아서 수정했습니다.
문과생이라 하나도 모르개써요!
근대 먼가멋짐 ..
저도 문과에요!
97

뭐.시.라.?.할부이요기홍삼캔디.

으이이익 나쁜 삼칠!흐잉
용서해조

귀여우니.. 용서해주지..고마오