누가 봐도 07이 확실한,
게시글 주소: https://orbi.kr/00078726798
대한민국이 공식적이며 진실되게 보증하는 응애07, Rees의 오늘자 개발일지입니다.
![]()
저번에 토큰 부족으로 생성하지 못했던 서로 다른 모델을 포함하는 하위 에이전트들의 복합적 문제 생성은 가능한 것으로 확인되었습니다. 다만, 생성하다가 말고, 다시 생성해서 그런지 문항 생성 규칙을 위배하는 오류를 발견했습니다. 분명 이중으로 1차 검수를 진행하게 되어있으나.. 뭐 암튼 결과는 그렇습니다. 추가로 antigravity의 scheduling 기능은 powershell 종료시 같이 종료되기에 모델 활성화 이후, 최소 한 번의 명령이 필요한 것을 확인하였습니다.
토큰으로 고통받았기에, 오늘은 토큰 사용량 최적화를 위해 힘썼습니다. 우선, 에이전트 자체 기능을 활용한 방안부터 보고하겠습니다. antigravity의 context caching을 활용하여 AGENTS, 수학_문제_제작_및_설계_지침, 2차_검수법 파일을 클라우드 저장하였습니다. 이를 통해, 각 파일을 다시 읽으며 발생하는 토큰 손실을 줄였습니다.
다음으로 codex에게는 처음 문항 생성시, 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할만 한 최대 7개의 문항을 추려서 작업하도록 설정하였습니다. 이를 통해 토큰 낭비를 줄이고 참고 문항에 대한 할루시네이션 현상도 줄일 수 있음을 테스트를 통해 확인하였습니다.
오늘 한 일의 가장 핵심이 되는 구조적인 개혁을 설명드리겠습니다. antigravity는 a로 codex는 c로 표기하겠습니다. 명령과 수행 순서입니다.
1. '수학1, 15번 최상 난이도, 삼각함수, 3문제.' 와 같은 형식으로(과목, 난이도, 대단원, 문항수)를 c에게 지시합니다.
2. c는 AGENTS, 수학_문제_제작_및_설계_지침를 확인하고 database 내의 모든 기출 문항 중 자체적이고 임의적인 판단을 통해 선별된 문항들을 선별.
3. c는 이를 통해 문제의 초안 겸 완성본의 구조를 지닌 문제를 제작
4. c는 자체적인 1차 검수를 수행 후 a에게 문제의 1차 및 2차 검수를 요청
5. c의 요청을 받은 a는 1차 및 2차 검수를 통해 문제별 점수를 책정 후 c에게 피드백 전달.
6. 기준 점수 미달인 문제는 c가 피드백을 바탕으로 수정 후, a에게 전달. 기준을 충족한 문제는 최종본으로 database에 분류 기록.
7. 이와 같은 2차 검수를 loop하여 마지막 문제까지 database에 분류 기록.
하지만 이 과정은 토큰 소모가 큽니다. 따라서 다음과 같이 구조를 수정하였습니다.
1. '과목, 난이도, 대단원, 문항수'를 c에게 지시합니다.
2. c는 개념, 전략, 목적 및 상황, 소단원명, 풀이, 논리구조 등에서 참고할 만한 문항 최대 7가지를 추려서 reference digest라는 참고사항이 포함된 문제의 LaTex형식 축약본을 작성.
3. 이 reference digest만을 이용하여, c는 문제의 1차 및 2차 검수는 가능한 초본을 작성.
4. c는 초본을 1차 검수 후, a에게 1차 및 2차 검수 요청.
5. a는 초본에 대한 1차 및 2차 검사를 수행 후, patch형식으로 수정을 요구.
6. 이를 통과한 문항은 c가 최종본으로 작성하여 database로 분류 기록. 수정요구된 문항 중 65점 미만의 문항은 폐기 후 재제작. 65점 이상 85점 미만의 문항들은 Delta recheck방식을 최우선으로 수정 및 재검수 요청.
7. 마지막 문제까지 loop과정이 완료되면 database에 분류 기록.
다음으로 직접 문제를 생성하여 효과를 테스트해보고 싶었으나.. antigravity의 주간 토큰 한도 제한으로 실패..
따라서 남은 시간에는 이러한 토큰 제약을 타파할 방법과 이론적인 개선안 구상, 프로그래밍 공부에 시간을 썼습니다.
이론적인 개선안은 클라우드가 아닌 로컬 기반 모델 Qwen과 opencode를 결합하여 ingest의 일부, 생성 과정의 일부 검수 과정, 개발일지 작성, 등을 맡기는 방안을 세웠습니다. 문제는 노트북 사양이죠. 새 노트북이 배송될 때까지는 구현 불가능입니다. 추가로 claude code까지 도입을 검토하고 있습니다.
이론적인 개선안으로는 표본 분석에 대한 최적화가 있습니다만.. 아직 구상 중이라 여기선 생략하겠습니다.
마지막으로 프로그래밍 공부는 뭐.. 그냥 공부입니다.
이상 명명백백하고 투명하고, 확실하며, 공식적이며, 보장받는, 엄연한 07 Rees의 24일자 개발일지였습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
개정 시발점으로 확통런 하려고 하는데 원순열 빠지고 모비율 들어간대서 ‘그냥 모비율...
-
나만 이런느낌이 드는건가 3 0
하루동안 한거없이 앉아이만있었다는 느낌받거나 인강이라는 무언가를 그냥 시청만...
-
내신 1.93 고대 교과 3 0
고대 기준 내신 평균 1.93인데 교과로 가능성 아예 없을까요? 영어 사문 세지...
-
국어 이제 뭐해야함 0 0
이번6모 언매96 더프 1컷~높2진동하는데 리트 사설 연계 기출 복습 각각 비중을...
-
LOVE.... CUTE....!!!! 한글로 읽으면 나의남편 !
-
탄젠트 그래프가 좋음 5 2
이유는 잘 모름 사인 코사인보다 마음에 듦
-
히카vs강X 1 0
최지욱 정규반 듣고있어서 서바시즌에 서바, 전국서바, 브릭스 나오는데 히카랑...
-
국어,수학 중 남은 기간 중 올리기 더 쉬운 과목? 7 1
작수 국어4 수학3이면 어떤게 더 쉽다고 생각하시나요? 반수생이라 최저만 맞추면...
-
전남대 국제학부 여수캠 ㅇㄸ 1 0
전남대 국제학부 영어전공 여수캠에서 1학년 2학기까지만 학점 챙기면서 스페인어...
-
"아 난 학교에서 시간도 안 주고 현역이니까 시간이 부족해서 그럼 ㅋㅋㄹㅃㅃ"...
-
하읏 9 1
하읏
-
입에 고농축 다우니 넣고 행구면 양치 안해도 됨? 13 1
ㅈㄱㄴ
-
지금 와서 생각해보니 전공 서술형에서 패리티 비트라고 써야하는 걸 헷갈려서 페라리...
-
계속 이대로면 2 0
진짜 나 실종될 거 같아
-
8만8천원 한우 샤브샤브 무한리필 11 0
.
-
잘 구운 생선구이 하나 2 1
열 돼지고기 안 부럽다
-
덕코 기부해주고 가요 3 3
9모 대회 열 돈이 없음 130에서 60만 빠지면 70만...
-
누가 봐도 07이 확실한, 12 2
대한민국이 공식적이며 진실되게 보증하는 응애07, Rees의 오늘자 개발일지입니다....
-
역시 여름 플리는 아프로 비트 0 2
재즈만큼 좋아하는 아프로뿜뿜
-
아아 하늘의 기둥들!! 0 1
쓰봉 뭐가 저리 크노 문도
-
전 mbti 뭐게요 10 1
으흐흐
-
수학 수완모 2회 1 0
공통 체급 상당하네요 시간이 없어...
-
평소에는 괜찮습니다. 혼자 풀면 정답도 꽤 맞힙니다. 틀린 문항이 나와도 해설을...
-
https://orbi.kr/00078678825
-
말 안되는 거 아는데 의대보다 하닉계약이 왜 괜찮아보이지 15 7
집안에 돈 없으면 의대 가도 개빡셀 거 같은데 물론 돈 있는 집안이면 의대가 맞긴 하겟지만..
-
짝사랑하는 오르비언 4 0
파마늘
-
나도 할까
-
저는억울합니다 4 1
-
쓔발 ㅋㅋㅋㅋ
-
D-148 끝 1 1
-
D-148 끝 2 1
-
mbti 18 1
맞춰봐
-
부엉이포스트 중요함? 1 0
시대 라이브 듣는데 즌3부터는 라이브 제공 어쩌고 하더라 근데 내가 시간이슈로...
-
오피스텔 자취방 할듯함 4 2
돈 더 쓰더라도 오피스텔이 역이랑 가깝고 괜찮네
-
라이브 듣다가 현강으로 바꾸려는데 가격이 두배차이네 ㄷㄷ... 현강은 메리트가 따로...
-
롤 한판 쎄릴테니까 맞춰놓으셈 12 0
ㅇㅇ
-
학점어떻게보는거지 1 0
나만 모르는거같은데
-
등운동 진짜 깨달았다 3 1
하지만 다음에 또 새로이 깨닫는 것이 모든 것의 순리
-
만덕으로 올려줌 2 0
ㅋㅋ
-
서울대 빨간약 0 0
https://youtu.be/tMH0lCagefI?si=PdMP_bMKJ_EbLsv...
-
사람들이 재수할때 3월을 조심하라 이러잖음 근데 난 3월에 인스타 지워서 대학간...
-
mbti 맞추면 천덕 5 0
선착 1
-
내 엠비티아이 아무도 못 맞춤 4 0
얼른 얼른 1000덕) 내 mbti도 맞춰봐요 https://orbi.kr/00078726345
-
수학2등급 6 1
받으려면 평균적으로 어디까지 맞춰야돼요? 참고로 제 선택과목 확통입니다!
-
3회 28찍틀 30풀틀 92점 모든 회차가 풀면서 11~14 중 두세개쯤 시간...
-
수학 기출 문제집 추천해주세요 2 0
일단 기출 자체는 4월에 한완기로 한바퀴 끝내고 지금 n제 풀고 있습니다. (기하는...
-
수능치는아랴양 보고서.hwpx 6 2
api + gpt 5.5+ jakal-hwpx 의 조합이 매우 강력하다
-
아니아무도못맞추네 3 0
저는 ENTP임 E 55% N 97% T 80% P 60% 이쯤이었던걸로...
-
MBTI 3 2
I 75 E 25 S 40 N 60 T 50 F 50 P30 J 70
-
놀랍게도삼칠은인팁이야ㅏ 11 1
움움
죄송합니다. 깜박하고 잡담 태그를 안 달아서 수정했습니다.
문과생이라 하나도 모르개써요!
근대 먼가멋짐 ..
저도 문과에요!
97

뭐.시.라.?.할부이요기홍삼캔디.

으이이익 나쁜 삼칠!흐잉
용서해조

귀여우니.. 용서해주지..고마오