누가 봐도 07이 확실한,
게시글 주소: https://orbi.kr/00078726798
대한민국이 공식적이며 진실되게 보증하는 응애07, Rees의 오늘자 개발일지입니다.
![]()
저번에 토큰 부족으로 생성하지 못했던 서로 다른 모델을 포함하는 하위 에이전트들의 복합적 문제 생성은 가능한 것으로 확인되었습니다. 다만, 생성하다가 말고, 다시 생성해서 그런지 문항 생성 규칙을 위배하는 오류를 발견했습니다. 분명 이중으로 1차 검수를 진행하게 되어있으나.. 뭐 암튼 결과는 그렇습니다. 추가로 antigravity의 scheduling 기능은 powershell 종료시 같이 종료되기에 모델 활성화 이후, 최소 한 번의 명령이 필요한 것을 확인하였습니다.
토큰으로 고통받았기에, 오늘은 토큰 사용량 최적화를 위해 힘썼습니다. 우선, 에이전트 자체 기능을 활용한 방안부터 보고하겠습니다. antigravity의 context caching을 활용하여 AGENTS, 수학_문제_제작_및_설계_지침, 2차_검수법 파일을 클라우드 저장하였습니다. 이를 통해, 각 파일을 다시 읽으며 발생하는 토큰 손실을 줄였습니다.
다음으로 codex에게는 처음 문항 생성시, 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할만 한 최대 7개의 문항을 추려서 작업하도록 설정하였습니다. 이를 통해 토큰 낭비를 줄이고 참고 문항에 대한 할루시네이션 현상도 줄일 수 있음을 테스트를 통해 확인하였습니다.
오늘 한 일의 가장 핵심이 되는 구조적인 개혁을 설명드리겠습니다. antigravity는 a로 codex는 c로 표기하겠습니다. 명령과 수행 순서입니다.
1. '수학1, 15번 최상 난이도, 삼각함수, 3문제.' 와 같은 형식으로(과목, 난이도, 대단원, 문항수)를 c에게 지시합니다.
2. c는 AGENTS, 수학_문제_제작_및_설계_지침를 확인하고 database 내의 모든 기출 문항 중 자체적이고 임의적인 판단을 통해 선별된 문항들을 선별.
3. c는 이를 통해 문제의 초안 겸 완성본의 구조를 지닌 문제를 제작
4. c는 자체적인 1차 검수를 수행 후 a에게 문제의 1차 및 2차 검수를 요청
5. c의 요청을 받은 a는 1차 및 2차 검수를 통해 문제별 점수를 책정 후 c에게 피드백 전달.
6. 기준 점수 미달인 문제는 c가 피드백을 바탕으로 수정 후, a에게 전달. 기준을 충족한 문제는 최종본으로 database에 분류 기록.
7. 이와 같은 2차 검수를 loop하여 마지막 문제까지 database에 분류 기록.
하지만 이 과정은 토큰 소모가 큽니다. 따라서 다음과 같이 구조를 수정하였습니다.
1. '과목, 난이도, 대단원, 문항수'를 c에게 지시합니다.
2. c는 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할 만한 문항 최대 7가지를 추려서 reference digest라는 참고사항이 포함된 문제의 LaTex형식 축약본을 작성.
3. 이 reference digest만을 이용하여, c는 문제의 1차 및 2차 검수는 가능한 초본을 작성.
4. c는 초본을 1차 검수 후, a에게 1차 및 2차 검수 요청.
5. a는 초본에 대한 1차 및 2차 검사를 수행 후, patch형식으로 수정을 요구.
6. 이를 통과한 문항은 c가 최종본으로 작성하여 database로 분류 기록. 수정요구된 문항 중 65점 미만의 문항은 폐기 후 재제작. 65점 이상 85점 미만의 문항들은 Delta recheck방식을 최우선으로 수정 및 재검수 요청.
7. 마지막 문제까지 loop과정이 완료되면 database에 분류 기록.
다음으로 직접 문제를 생성하여 효과를 테스트해보고 싶었으나.. antigravity의 주간 토큰 한도 제한으로 실패..
따라서 남은 시간에는 이러한 토큰 제약을 타파할 방법과 이론적인 개선안 구상, 프로그래밍 공부에 시간을 썼습니다.
이론적인 개선안은 클라우드가 아닌 로컬 기반 모델 Qwen과 opencode를 결합하여 ingest의 일부, 생성 과정의 일부 검수 과정, 개발일지 작성, 등을 맡기는 방안을 세웠습니다. 문제는 노트북 사양이죠. 새 노트북이 배송될 때까지는 구현 불가능입니다. 추가로 claude code까지 도입을 검토하고 있습니다.
이론적인 개선안으로는 표본 분석에 대한 최적화가 있습니다만.. 아직 구상 중이라 여기선 생략하겠습니다.
마지막으로 프로그래밍 공부는 뭐.. 그냥 공부입니다.
이상 명명백백하고 투명하고, 확실하며, 공식적이며, 보장받는, 엄연한 07 Rees의 24일자 개발일지였습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
사람에게는 가소성이 있음 4 1
변화의 가능성이 있음 근데 이게 정말로 무서운 말인게 나쁜방향으로도 영원히...
-
대치 침수가 언제지 했더니 2 0
밥먹고 롤만하던 중학교 시절이었구나 저때정신못차려서 인생다꼬였다
-
가을 보고가셈 4 0
하 단발 미치겠다
-
아무도 내 엠비티아이 안 맞추네 10 0
맞춰줘,,,
-
내가 내년에 성인이라고? 3 0
거짓말 ㄴㄴㄴㄴ
-
머리아푸다 5 1
폰너무마니밧나바 ㅜㅜㅜㅠ
-
31일차 4 1
멘탈깨져서 공부 안 함 4교시 하고 집와서 잤음 쭈욱
-
엄소연<<난이도 어떰? 1 0
7월부터 서바들어갈라는디 빡통통이라 걱정되네 공통이랑 주간지,과제들 난이도 어떰요?
-
국어 표점 160이면 5 1
수학 2등급 의대 가능? 19수능에 국어 표점150+ 가형 특유의 낮은 표점과 높은...
-
축구에 빠진 친구랑 오늘 포르투갈 잉글랜드 경기 다 보고 자서 피곤함 10 1
학교에서 졸았음
-
공부ㅇㅈ 12 7
오늘한거 ㅈㄴ 없네 이해원 즌2 수1 day01 이동선 딥러닝 수1 06 day...
-
ㅈㄱㄴ
-
우리학교기하러0명임 6 0
-
내일 유급 탈출 결정전인데 9 3
공부를 안함 ㅅㅂ 기말고사에서 4/100점 이상을 받아야하는데 싹다 주관식임 ㅅㅂ
-
진짜내MBTI맞춰보센 20 1
천덕 기회한번
-
ㅇㅈㅁㄱㅅ 3 0
이거 뭐 같음?
-
진짜볼수록느끼지만 6 0
기하러들 커뮤에는진짜 많은데 왜주위엔아무도없을까~
-
주제 10문항 단어 100개 0 0
사탐 대충 많이 밥먹을거임
-
물투를 버렷더니 생긴 변화 2 0
성격이 착해짐 자주 씻게됨
-
나때는 2 0
지금 파이브가이즈 짓고있는곳에 노브랜드버거 있었는데
죄송합니다. 깜박하고 잡담 태그를 안 달아서 수정했습니다.
문과생이라 하나도 모르개써요!
근대 먼가멋짐 ..
저도 문과에요!
97

뭐.시.라.?.할부이요기홍삼캔디.

으이이익 나쁜 삼칠!흐잉
용서해조

귀여우니.. 용서해주지..고마오