클로드 코드 토큰 절약 2026 | 직장인이 6개월 써보고 남긴 6가지

어제 새벽 1시, 둘째 재우고 거실로 나와 자동 발행 스크립트 돌리는데 폰에 “토큰 한도 78% 사용” 알림이 떴어요. 다음 발행분이 한도 초과로 멈출지 모르는 상황. 손이 멈추더라구요. 그러다 짐코딩님 채널에서 “토큰 녹는 분들, 이 6가지만 바꿔보세요” 영상이 추천에 올라와서 바로 클릭했어요.

저는 클로드 코드로 블로그 글을 자동 발행하고 있는 정보보안 직장인이거든요. 하루 5번 글 쓰면서 6개월 운영해 보니, 영상에 나오는 6가지 패턴이 토큰 소모의 80%를 차지하더라구요. 이번 글은 그 영상에서 핵심을 정리하면서 제가 6개월 운영하면서 추가로 깨달은 부분까지 함께 풀어볼게요. 직장인이 본업 외 시간에 클로드 코드로 뭔가 만들고 있다면 도움이 될 거예요.

출처는 짐코딩 채널의 “클로드 코드 토큰 녹는 분들, 이 6가지만 바꿔보세요” 영상이고, 영상에서 본 내용 + 제 운영 경험을 합쳐서 정리한 글입니다. 영상에서 누락된 부분이나 제가 추가로 확인한 사실은 별도로 표시했어요.

한눈에 보기

플랜에 따라 Opus·Sonnet 사용 전략이 완전히 달라야 함 (프로 플랜은 Sonnet 고정 권장)
Opus는 Sonnet보다 토큰 소모 4~5배 — 디폴트 모델 한 줄 변경이 가장 큰 절감 효과
대화방에 메시지가 쌓이면 매 요청마다 전체를 다시 읽음 → /clear 습관이 핵심
확장 사고(thinking) 기본 활성, 단일 작업당 최대 30,000 토큰 출력 비용 — 끄거나 예산 낮추기
CLAUDE.md는 500줄 이하로 유지, 나머지는 Skills로 분리 (매 세션 토큰 절감)

왜 클로드 코드 토큰이 그렇게 빨리 녹는가

처음 클로드 코드를 시작하시는 분들은 “토큰이 무한이지” 같은 느낌으로 들어오시는데, 며칠 쓰면 진짜 깜짝 놀라요. 저도 처음에 그랬거든요. 6개월 자동 발행 스크립트 돌려본 입장에서 결론부터 말씀드리면, 토큰이 빨리 녹는 데는 구조적 이유가 있어요.

가장 큰 원인은 두 가지입니다. 모델 설정과 대화방 누적이에요. Opus 모델을 디폴트로 두고 작업하면 Sonnet 대비 4~5배 토큰을 더 씁니다. 거기에 한 작업이 끝났는데 /clear 안 하고 다음 작업으로 넘어가면, 클로드는 매번 이전 대화 전체를 다시 읽거든요. 이 둘이 합쳐지면 같은 작업도 비용이 몇 배로 뜁니다.

제가 운영하는 자동 발행 시스템은 하루 5번, 매번 새 글 1개씩 발행해요. 처음 한 달은 토큰이 자꾸 한계 가까이 차길래 뭐가 문제인가 들여다봤더니, 모든 발행이 디폴트 Opus로 돌고 있더라구요. 발행마다 7,000~10,000자 글 쓰고, 이미지 평가하고, WordPress API 호출하고, 사실 검증까지 하니까 한 번에 토큰을 어마어마하게 쓰고 있었어요. 디폴트를 Sonnet으로 바꾸고 명시적 코드 설계 단계에만 Opus 쓰도록 흐름 짜니까 같은 작업이 30~40% 토큰으로 끝나더라구요.

제 경험상 토큰이 녹는다고 느끼는 분들 거의 100%가 디폴트 Opus로 잡혀 있습니다. 디폴트 한 줄만 바꿔도 체감이 확 와요.

대화방을 매번 처음부터 다시 읽는 구조

이 부분이 클로드 코드를 실제로 써 보시면 가장 충격적인 사실인데요. 우리가 카톡 단톡방에서 새 메시지가 오면 보통 그 메시지만 읽잖아요. 그런데 AI는 다릅니다. 매 요청마다 그 대화방의 모든 메시지를 처음부터 다시 읽어요. 한 달 전 내용이든 1년 전 내용이든 매번 전체를 읽습니다. 이게 다 토큰이에요.

예를 들어 제가 클로드한테 10번째 프롬프트를 보낸다고 가정하면, 클로드는 이전 9개의 요청과 9개의 응답 전부를 다시 읽어요. 첫 프롬프트 보낼 때랑 10번째 보낼 때랑 같은 한 마디인데도 토큰 비용이 완전히 달라지는 거죠.

그래서 클로드 코드 같은 도구를 쓸 때는 “대화방에 무엇을 담고 있느냐”가 비용을 결정해요. 이걸 관리하는 기술을 컨텍스트 엔지니어링이라고 부르는데, 이번 글에서 다루는 6가지가 전부 이 컨텍스트 엔지니어링에 속합니다.

한 가지 더 알아두실 부분은 토큰만 문제가 아니라는 점이에요. 대화방이 가득 차면 클로드 자체가 헷갈리기 시작합니다. 이걸 “컨텍스트 롯(rot)”이라고 불러요. 컨텍스트가 썩는다는 뜻이에요. 작업 A 끝났는데 안 치우고 작업 B 시작하면 A에서 읽었던 파일이나 에러 로그가 계속 남아 있고, 그게 토큰 잡아먹으면서 동시에 클로드한테도 혼란을 줍니다. 환각(hallucination) 발생률이 올라가요.

저도 자동 발행 초기에 한 세션에서 5개 글을 연속 발행해 보다가, 4번째 글부터 카테고리를 잘못 잡거나 페르소나가 살짝 어긋나는 문제를 겪었어요. 매 글마다 /clear 넣어서 컨텍스트 비우니까 그 문제가 사라지더라구요. 토큰 절감보다 품질 안정이 더 큰 이득이었어요.

플랜별 Opus 사용 시간이 완전히 다르다

이 부분이 운영 입장에서 가장 결정적인 정보예요. Anthropic이 TechCrunch를 통해 공개한 공식 수치 기준으로 정리해 봤어요.

플랜	Sonnet 주당 사용량	Opus 주당 사용량
Pro ($20/월)	40~80시간	매우 제한적 (사실상 비추)
Max 5 ($100/월)	140~280시간	15~35시간
Max 20 ($200/월)	240~480시간	20~40시간

여기서 핵심은 Pro 플랜 사용자는 Opus를 사실상 못 쓴다는 거예요. 영상 댓글에 보면 “Pro 플랜인데 Opus로 작업하다가 이틀 만에 주간 한도 80%를 다 썼다”는 분도 계셨거든요. 당연한 결과예요. Pro 플랜은 전체 사용량 자체가 적은데 거기서 Opus를 계속 쓰면 금방 바닥납니다.

그러니 결론은 이거예요. 플랜에 따라 모델 사용 전략을 완전히 다르게 가져가야 합니다. Pro 플랜이라면 Sonnet 위주로 쓰고 Opus는 진짜 막힐 때만 잠깐. Max 5라면 Opus를 적당히 활용하면서 모니터링. Max 20이라면 좀 자유롭게 쓰셔도 됩니다.

저는 자동 발행 시스템을 처음 설계할 때 Max 5로 시작했어요. 왜냐면 Pro로는 일일 5회 발행을 안정적으로 돌릴 수 없거든요. 한 발행이 평균 12~15분 걸리니까 하루 5번이면 한 시간 정도. 일주일이면 7시간 정도 쓰는 셈이에요. Max 5의 Opus 15시간 한도면 글 작성 핵심 부분만 Opus로 해도 빠듯합니다.

디폴트 모델 한 줄 변경이 가장 큰 절감

이거 진짜 한 줄만 바꾸면 되는데 효과가 어마어마해요. 슬래시 명령어로 /model 입력하면 현재 설정된 모델이 보여요. 만약 Opus로 잡혀 있으면 바로 Sonnet으로 바꾸세요. 그리고 매번 켤 때마다 자동으로 Sonnet으로 시작하게 하려면 설정 파일에 한 줄 추가하시면 됩니다.

설정 파일(~/.claude/settings.json 또는 .claude/settings.json)에 이렇게 써 두세요.

설정값	의미	추천 대상
`"model": "sonnet"`	항상 Sonnet	Pro 플랜, 일반 코딩
`"model": "opus"`	항상 Opus	Max 20, 복잡한 설계만
`"model": "opusplan"`	계획은 Opus, 실행은 자동 Sonnet 전환	대부분 사용자에게 추천

저는 opusplan 모드를 추천드려요. 계획 모드에서는 Opus가 똑똑하게 설계하고, 계획 승인 후 실행 모드로 넘어가면 자동으로 Sonnet으로 바뀌니까 한 번 세팅하면 신경 안 써도 자동 절감이 돼요.

여담인데, 저는 자동 발행 한 달 운영 후 사용량 보고 정마 깜짝 놀랐어요. 디폴트 Opus로 5회×30일 = 150번을 그냥 다 Opus로 돌려버렸거든요. opusplan 한 줄로 바꾼 다음 달은 같은 150번이 Max 5 한도 안에서 끝났어요. 진짜 한 줄 차이입니다.

/clear /compact /resume 이 셋만 알아도 절반은 됩니다

대화방 누적이 토큰 폭주 원인이라고 했잖아요. 그래서 컨텍스트를 적극적으로 비우는 명령어를 알아두셔야 합니다. 셋만 외우시면 돼요.

/clear — 대화방 메시지를 모두 비웁니다. 한 작업이 완료되면 무조건 이걸 실행하고 다음 작업을 시작하세요. 가장 자주 쓰는 명령어예요. 저는 자동 발행 스크립트에 매 단계 끝날 때마다 /clear를 자동으로 넣어 뒀어요.

/compact — 컨텍스트 윈도우가 가득 찼는데 대화를 계속 이어가야 한다면 이걸 쓰세요. 클로드가 알아서 중요한 내용만 남기고 요약합니다. 단, 요약 내용을 직접 입력하실 수도 있는데 가급적이면 어떤 내용을 남기고 싶은지 명시해 주시는 게 좋아요. 알아서 판단하게 두면 핵심을 놓치는 경우도 있거든요.

/rename + /resume — 컨텍스트 비우기 전에 /rename으로 세션 이름을 지정해 두면, 나중에 그 대화로 돌아가고 싶을 때 /resume으로 복원할 수 있어요. 코드 리팩터링 같이 며칠에 걸쳐 이어가는 작업에 유용합니다.

제 운영 팁 하나 더. 자동 발행 스크립트에서는 매 발행이 끝나면 blog_skill_prompt.txt를 통째로 다시 로드하게 만들어 뒀어요. 즉 단계 사이에 컨텍스트가 누적되지 않게 강제로 잘라요. 이게 자동 발행 안정성의 80%를 보장해 주더라구요.

확장 사고 토큰은 보이지 않게 빠집니다

이건 진짜 모르고 지나치기 쉬운 부분이에요. 확장 사고(extended thinking) 기능은 클로드가 답변하기 전에 깊이 생각하는 기능인데, 기본적으로 활성화되어 있고 최대 30,000 토큰까지 사용해요.

여기서 핵심은 thinking 토큰이 출력 토큰으로 과금된다는 거예요. 단순한 파일 수정인데도 클로드가 30,000 토큰을 생각하는데 쓰고 있을 수 있어요. 보이진 않으니 모르고 지나치기 쉬운데, 실제 사용량 보고서 보면 thinking이 가장 큰 비중일 때도 많아요.

해당 옵션을 끄거나 예산을 낮추려면 /config 명령어 또는 환경 변수로 조절할 수 있어요. 저는 자동 발행에서는 thinking을 꺼 둡니다. 글 작성은 사고 깊이보다 일관성이 더 중요해서, thinking 켜면 오히려 매번 다르게 풀어나가서 안정성이 떨어지더라구요. 다만 새 코드를 설계하거나 어려운 디버깅을 할 때는 thinking 켜놓는 게 답입니다.

이 부분은 사실 일반 채팅에서는 thinking이 켜져 있는 게 답변 품질에 도움이 돼요. 다만 자동화 같이 같은 패턴을 반복하는 작업에서는 끄는 게 토큰·품질 모두 유리합니다.

프롬프트 구체화 한 줄 차이로 수십 배

이건 설정도 필요 없어요. 그냥 프롬프트 쓰는 습관 하나만 바꾸면 되는데 효과가 정말 큽니다.

예를 들어 “이 코드를 개선해 줘”라고 막연하게 요청하면 클로드는 프로젝트 전체를 탐색합니다. 파일을 이것저것 열어보고 분석하고 그 과정에서 토큰이 쭉쭉 올라가요. 반면 “auth/login.py의 validate_login() 함수에 입력값 검증 추가해 줘”라고 구체적으로 요청하면 그 파일 하나만 열고 바로 작업합니다.

같은 결과물인데 토큰 차이가 수십 배 날 수 있어요. 저는 이걸 깨닫고 나서 자동 발행 프롬프트를 거의 명령어 수준으로 구체화했어요. “글 작성해 줘”가 아니라 “유형 E 구조의 H2 8개, 7,000자 이상, 페르소나 메모리 참조”처럼 명세 형식으로요.

혹시 이런 경험 있으신가요? 분명 같은 일을 시켰는데 어떤 날은 1분 만에 끝나고 어떤 날은 5분 걸리는 거. 그게 거의 다 프롬프트 구체성 때문이에요. (이거 저만 몰랐던 거 아니겠죠?)

CLAUDE.md는 500줄 이하 + Skills 분리

이 부분이 6개월 운영해 본 입장에서 진짜 동의되는 부분이에요. 클로드 공식 문서가 권장하는 기준은 CLAUDE.md 500줄 이하 유지입니다. 그 이상 길어지면 매 세션 시작 토큰이 너무 많이 깎여요.

그럼 나머지 정보는 어디에? Skills로 분리하면 됩니다. 핵심 차이는 이거예요. CLAUDE.md는 매 세션이 시작될 때마다 자동 로드되지만, Skills는 필요할 때만 로드됩니다. 즉 자주 쓰는 핵심 규칙만 CLAUDE.md에 두고, 가끔 쓰는 상세 지식은 Skills로 빼면 매 세션 기본 토큰 소모가 효과적으로 줄어요.

제 경우엔 정보보안 직장인이라 회사에서 보안 정책·체크리스트를 문서화하는 습관이 있거든요. CLAUDE.md를 그 감각으로 운영해요. 핵심 규칙(짧고 자주 봐야 할 것)은 CLAUDE.md, 상세 절차(필요할 때만 보는 것)는 Skills 또는 별도 문서. 이렇게 분리하니까 길어지는 일도 잘 없어요.

참고로 제 자동 발행 시스템도 처음에는 모든 룰을 한 파일에 다 넣어서 1,200줄 정도였어요. 발행 한 번에 토큰을 너무 많이 써서 봤더니 매번 그 1,200줄을 통째로 읽고 있었더라구요. 4단계 흐름은 별도 스킬로 빼고, 페르소나·도메인 룰만 메인에 두니까 매 세션 기본 토큰이 절반으로 줄었어요.

초보가 자주 묻는 질문 (FAQ)

Q1. Pro 플랜으로도 자동 발행 같은 무거운 작업이 가능한가요?
가능은 하지만 권장 안 해요. 하루 5회 발행이면 일주일에 35회예요. Pro 플랜의 Sonnet 한도(40~80시간) 안에서 빠듯하게 돌릴 수는 있지만 안정성이 떨어집니다. 자동화 운영하시려면 Max 5(100달러) 이상 추천드려요.

Q2. opusplan 모드에서 코드 작성이 자꾸 Sonnet으로 넘어가서 답답해요.
정상 동작이에요. opusplan은 계획 단계에서만 Opus, 실행은 Sonnet으로 자동 전환됩니다. 만약 실행도 Opus로 하고 싶으면 모드를 그냥 “opus”로 두시고, 그 외엔 opusplan 또는 sonnet으로 두세요.

Q3. /compact을 자주 쓰면 정확도가 떨어지지 않나요?
요약 시 핵심을 놓칠 가능성은 있어요. 그래서 /compact 직전에 “이 부분은 반드시 남겨야 해” 같이 명시 입력하시는 걸 권장드려요. 가급적이면 /clear 후 새 세션 시작이 깔끔합니다.

Q4. thinking 토큰이 아까운데 끄면 답변 품질이 떨어지지 않을까요?
일반 대화에서는 켜두는 게 답변 품질에 도움이 됩니다. 다만 같은 패턴을 반복하는 자동화 같은 데서는 끄는 게 안정성·토큰 모두 유리해요. 작업 성격에 따라 다릅니다.

Q5. CLAUDE.md를 짧게 유지하라고 하지만 빼야 할 게 너무 많은데요?
“매 세션 항상 봐야 할 핵심”만 CLAUDE.md에 남기시고, 나머지는 Skills 또는 별도 문서로 빼세요. 판단 기준은 “이거 클로드가 매번 알고 있어야 동작이 정상이냐”예요. 가끔 쓰는 절차는 Skills가 답입니다.

Q6. 토큰 사용량을 실시간으로 보는 방법이 있나요?
/cost 명령어로 현재 세션 누적 토큰을 볼 수 있어요. 자동화에서는 정기적으로 이걸 로그에 기록하시면 어디서 토큰이 새는지 추적 가능합니다.

Q7. 영상에서 컨텍스트 엔지니어링이라는 용어가 나오던데 별도 학습이 필요한가요?
이 글에서 다룬 6가지가 컨텍스트 엔지니어링의 기본이에요. 더 깊이 들어가면 서브에이전트, 훅(hook), 플러그인 같은 영역이 있는데, 그건 자동화 본격 도입 시점에 천천히 익히셔도 늦지 않아요.

Q8. Pro 플랜인데 그래도 Opus 한 번씩 써보고 싶을 때는?
세션 중간에 /model opus 입력하면 그 세션만 Opus로 바뀝니다. 끝나면 /clear 하고 다시 sonnet으로 돌아오세요. 일시 사용용으로 적합합니다.

레추의 총평

6개월 자동 발행 운영하면서 제일 크게 느낀 건 이거예요. 토큰 절약은 코딩 기술이 아니라 운영 습관이라는 거. 영상의 6가지 팁 중에 어렵게 새로 배워야 할 것은 하나도 없어요. 다 한 줄짜리 설정 변경이거나, 명령어 3개 외우기거나, 프롬프트 쓰는 방식 바꾸기 정도니까요.

그런데 이걸 안 하시면 정마 토큰이 빨리 녹아요. 저도 한 달 헛돈 쓰고 나서야 깨달았으니까요. 만약 지금 클로드 코드 쓰고 있는데 토큰이 부족하다고 느끼시면, 이 글의 첫 번째 팁(디폴트 모델 변경)부터 해 보세요. 그것만으로도 30~40%는 줄어들 거예요.

그리고 마지막 팁 하나 더. 처음 클로드 코드 시작하시는 분들은 굳이 Max 20 같은 비싼 플랜으로 가지 마세요. Pro로 시작해서 컨텍스트 관리 습관부터 들이시고, 정말 부족할 때 Max로 올리는 게 답입니다. 비싼 플랜 써도 운영 습관 잘못되어 있으면 똑같이 녹아요.

이 글 읽고 적용해 보시다가 막히는 부분 있으면 댓글로 알려주세요. 저도 운영하면서 새로 배우는 게 매주 있어서, 같이 정보 모이는 게 도움이 돼요.

참고 출처: 짐코딩 – 클로드 코드 토큰 녹는 분들, 이 6가지만 바꿔보세요 / Anthropic 공식 문서

실천 체크리스트

현재 디폴트 모델 확인 (/model) → opusplan 또는 sonnet으로 변경
한 작업 끝나면 무조건 /clear 습관화
thinking 자주 안 필요한 자동화 작업은 thinking 끄기
프롬프트 작성 시 파일·함수명 명시 (구체화)
CLAUDE.md 500줄 이하 + 상세 지식은 Skills로 분리
/cost 정기 확인으로 새는 부분 추적

이 글은 짐코딩 채널 영상을 본 후 6개월 운영 경험을 합쳐 정리한 정보 글입니다. 영상 원본 시청을 권장드립니다.

클로드 일주일 무료 이용권은 아래의 링크에서 가져가시면 됩니다 (선착순)
https://claude.ai/referral/2UaEl8cpPA

이 글과 함께 많이 보는 상품

어썸풀 여성용 클로드 슬림 끈 나시 A25SMS031112…

14,900원

브루클린뮤지엄 남녀공용 아티팩트시리즈 임프레셔니스트 클로드 모네 면 스웻…

56,090원

허시파피 남성용 클로드 컴포트 슬립온 3MM153…

108,000원

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

레드추파가 직접 써보고 고른 상품만 모았어요

레추 추천 상품 모아보기

쿠팡에서 구경하기