누가 봐도 07이 확실한,
게시글 주소: https://orbi.kr/00078726798
대한민국이 공식적이며 진실되게 보증하는 응애07, Rees의 오늘자 개발일지입니다.
![]()
저번에 토큰 부족으로 생성하지 못했던 서로 다른 모델을 포함하는 하위 에이전트들의 복합적 문제 생성은 가능한 것으로 확인되었습니다. 다만, 생성하다가 말고, 다시 생성해서 그런지 문항 생성 규칙을 위배하는 오류를 발견했습니다. 분명 이중으로 1차 검수를 진행하게 되어있으나.. 뭐 암튼 결과는 그렇습니다. 추가로 antigravity의 scheduling 기능은 powershell 종료시 같이 종료되기에 모델 활성화 이후, 최소 한 번의 명령이 필요한 것을 확인하였습니다.
토큰으로 고통받았기에, 오늘은 토큰 사용량 최적화를 위해 힘썼습니다. 우선, 에이전트 자체 기능을 활용한 방안부터 보고하겠습니다. antigravity의 context caching을 활용하여 AGENTS, 수학_문제_제작_및_설계_지침, 2차_검수법 파일을 클라우드 저장하였습니다. 이를 통해, 각 파일을 다시 읽으며 발생하는 토큰 손실을 줄였습니다.
다음으로 codex에게는 처음 문항 생성시, 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할만 한 최대 7개의 문항을 추려서 작업하도록 설정하였습니다. 이를 통해 토큰 낭비를 줄이고 참고 문항에 대한 할루시네이션 현상도 줄일 수 있음을 테스트를 통해 확인하였습니다.
오늘 한 일의 가장 핵심이 되는 구조적인 개혁을 설명드리겠습니다. antigravity는 a로 codex는 c로 표기하겠습니다. 명령과 수행 순서입니다.
1. '수학1, 15번 최상 난이도, 삼각함수, 3문제.' 와 같은 형식으로(과목, 난이도, 대단원, 문항수)를 c에게 지시합니다.
2. c는 AGENTS, 수학_문제_제작_및_설계_지침를 확인하고 database 내의 모든 기출 문항 중 자체적이고 임의적인 판단을 통해 선별된 문항들을 선별.
3. c는 이를 통해 문제의 초안 겸 완성본의 구조를 지닌 문제를 제작
4. c는 자체적인 1차 검수를 수행 후 a에게 문제의 1차 및 2차 검수를 요청
5. c의 요청을 받은 a는 1차 및 2차 검수를 통해 문제별 점수를 책정 후 c에게 피드백 전달.
6. 기준 점수 미달인 문제는 c가 피드백을 바탕으로 수정 후, a에게 전달. 기준을 충족한 문제는 최종본으로 database에 분류 기록.
7. 이와 같은 2차 검수를 loop하여 마지막 문제까지 database에 분류 기록.
하지만 이 과정은 토큰 소모가 큽니다. 따라서 다음과 같이 구조를 수정하였습니다.
1. '과목, 난이도, 대단원, 문항수'를 c에게 지시합니다.
2. c는 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할 만한 문항 최대 7가지를 추려서 reference digest라는 참고사항이 포함된 문제의 LaTex형식 축약본을 작성.
3. 이 reference digest만을 이용하여, c는 문제의 1차 및 2차 검수는 가능한 초본을 작성.
4. c는 초본을 1차 검수 후, a에게 1차 및 2차 검수 요청.
5. a는 초본에 대한 1차 및 2차 검사를 수행 후, patch형식으로 수정을 요구.
6. 이를 통과한 문항은 c가 최종본으로 작성하여 database로 분류 기록. 수정요구된 문항 중 65점 미만의 문항은 폐기 후 재제작. 65점 이상 85점 미만의 문항들은 Delta recheck방식을 최우선으로 수정 및 재검수 요청.
7. 마지막 문제까지 loop과정이 완료되면 database에 분류 기록.
다음으로 직접 문제를 생성하여 효과를 테스트해보고 싶었으나.. antigravity의 주간 토큰 한도 제한으로 실패..
따라서 남은 시간에는 이러한 토큰 제약을 타파할 방법과 이론적인 개선안 구상, 프로그래밍 공부에 시간을 썼습니다.
이론적인 개선안은 클라우드가 아닌 로컬 기반 모델 Qwen과 opencode를 결합하여 ingest의 일부, 생성 과정의 일부 검수 과정, 개발일지 작성, 등을 맡기는 방안을 세웠습니다. 문제는 노트북 사양이죠. 새 노트북이 배송될 때까지는 구현 불가능입니다. 추가로 claude code까지 도입을 검토하고 있습니다.
이론적인 개선안으로는 표본 분석에 대한 최적화가 있습니다만.. 아직 구상 중이라 여기선 생략하겠습니다.
마지막으로 프로그래밍 공부는 뭐.. 그냥 공부입니다.
이상 명명백백하고 투명하고, 확실하며, 공식적이며, 보장받는, 엄연한 07 Rees의 24일자 개발일지였습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
올해 수완 0 1
난이도 어떤가유 풀 필요 있음?(국어 제외하고)
-
수학 뭘 풀어야함 1 0
한완기 한완수 이미지 김기현 중에 뭐 할지 너무 고민입니다..
-
여기 내용처럼 나도 현재 고2 내신 3.2여서 논술로 틀어서 지금부터 정시 과목들...
-
뉴런 대체 실전개념서 3 0
개발점 들었는데 뉴런에 있는 내용들이 상당수 들어있다고 들어서 컴팩트하게 실전 개념...
-
풀이량 ㄹㅈㄷ
-
그놈의 몇층 2 1
망막의 10층 표피의 5층 복벽의.. 그만하자.
-
다들 잘자 1 0
.
-
저 국어, 영어 신인데 1 0
그냥 커밍아웃해버리기! 뿌앙
-
박종민T 대기등록 완 5 0
이제 문자 오는거 기다리면 되나여?
-
인천 상륙 작전 0 1
오늘은 6.25!
-
미칠 것 같은 심심함! 18 3
뭔가.. 뭔가 대화를 좀 해주세요.. 질문이라도 좋고, 뻘소리라도 좋으니까...
-
나의지능으로는재수는기본으로깔고가야할거같음
-
영어 반수 1 0
작수 높4였는데 뭘 해야할까요..
-
2학기까지해보고 2학기도좆망하면정시해야지 ......
-
사탐 반수 8 0
사문 생윤 개념 7월 중순까지 돌리면서 마더텅 끝내고 그 후에는 뭘 해야할까요
-
내신을버림청년 0 0
2-1은존재하지않아
-
국어 데일리로 풀기좋은거 ㅊㅊ 2 0
이비에스 연계된거 매일풀기 좋은 문학 독서 교재 추천받습니다
-
국어 반수 3 0
매일 2-3지문씩 풀고 토,일 중에 하루만 실모 풀까 하는데 어떤가요 기출부터...
-
문학 갈래복합 적정시간 0 0
문학에서 수필 딸려있는 갈래복합 세트 푸는데 평균적으로 9분~10분 걸리는데 더...
-
예체능쪽 진로라서 정시준비하는 애들은 몇명 봣는데.. 근데 제가 알기로는 얘네들도내신챙ㅅ김
-
홍명보 민심 회복하는법 6 0
윤어게인 ,,,아니라 2012 어게인 2026 월드컵 4강 한일전에서 일본 2 대...
-
반수 수학 0 0
작수 확통 높3이었습니다 수학 안푼지 꽤 돼서 가물가물한데 기생집 아이디어를 할지...
-
평가원에 비해 사설모고 국어점수가 20점씩 내려가는데
-
우리 고교 전설의 정시파이터 2 0
SNUMED
-
서바 강사 추천 1 0
모의반기준 박종민 이동준 장재원 최지욱 등 엄청 많네
-
학교 역사상 정시파이터가 7 1
내가 거의 두번째 일듯 정시 준비하는 사람 중에서 내신을 안챙기는 사람이 나빼고...
-
우리도 대학생 단체디엠방 만들자 10 0
일단 대학 인증해야하니 뱃지러부터 와봐
-
다운그레이드 업그레이드 2 2
본인 삼반수 시작한 외대인데 수시로 와서 정시판 잘은 모르겠는데 경희 국캠에서 우리...
-
군대가서 할거 추천 15 1
곤뇽임
-
시간이 흐를수록 열기가 식음 1 0
수능도 00, 10 년대는 엄마들이 일찍나와서 어묵국물 나눠주고 쌍화탕도 주고 후배...
-
여름방학때부터 뉴런/스불 듣기 VS 그냥 N제풀기 1 0
꼭뉴런스불해야하나싶기도하고 그냥 N제실모 벅벅풀어야하나 싶기도 하고 흐음...
-
몽가 우울해지농 4 1
입대날짜가 나와선가 엉엉
-
국어 문만 팀 디코 개설 예정인데 희망자는 댓글로 0 1
특별한 목적은 딱히 없고 페이없이 문만 자체에 쾌감을 느끼는 분들 참여하시면...
-
내적갈등을하고잇다는거임 1 0
나는과연정시가하고싶은게맞는걸까 그냥수시가싫으ㅓ서도피하는거같아서..
-
그래서 저희 32강 감 못감? 2 0
ㅈㄱㄴ
-
애초에2학년엔거의 ㅣ있지도않고 진로 때문에 하는 애들만 몇멸 잇음ㅁ 심지어 얘네도...
-
4일뒤에정시파이터가되는사람 2 0
-
ㅅㅂ
-
틀려도 괜찮아 정말괜찮아
-
허들링 너무 어려운데.. 1 1
재능의 벽이 느껴짐..
-
와 역대급 낮잠 4 0
-
홍명보말고 벤투였으면 1 0
남아공 멕시코 이겻음?
-
노트북 바꾸니까 4 1
깔 게 너무 많아! 으아아아아악
-
흠...
-
졸전끝에 비기는 수준도 아니고 이렇게까지 못하면 되냐고
-
실모 한번 풀려면 2시간동안 집중해야함
-
그래보임
-
독일어의 잔재를 그대로 씀 사실 잔재라기에는 그게 원조인데 영미유학파의 용어쿠데타가...
-
북한 물리 교과서 ㅋㅋㅋㅋ 2 1
폰트부터 용어까지 어질어질하네...
-
디저트39에서씹덕콜라보안시켯는데 캐릭터그려준컵줌 2 1
오따끄같이생겻나봐
죄송합니다. 깜박하고 잡담 태그를 안 달아서 수정했습니다.
문과생이라 하나도 모르개써요!
근대 먼가멋짐 ..
저도 문과에요!
97

뭐.시.라.?.할부이요기홍삼캔디.

으이이익 나쁜 삼칠!흐잉
용서해조

귀여우니.. 용서해주지..고마오