토큰 절약 가이드

사전 조건: 클라이언트를 최신 버전으로 유지하세요

저희는 모든 릴리스마다 컨텍스트 관리와 API 캐싱을 지속적으로 개선하여, 모델이 바뀌어도 항상 최적의 비용 효율을 제공해 드립니다.

핵심 공식

토큰 사용량 = 입력 크기 × 호출 횟수

이 공식을 이해하면 방향은 명확합니다. 매번 입력 크기를 줄이고, 불필요한 호출을 줄이는 두 가지 축으로 풀어갑니다.

영향이 큰 항목 — 매번 적용해야 할 습관

1. 컨텍스트 창의 범위를 좁히세요

AI에게 정말 필요한 것만 보여주세요. 47장을 쓸 때 1장은 필요 없습니다. 한 줄의 대사를 다듬을 때 챕터 전체는 필요 없습니다. 실천 방법:

현재 작업과 관련된 자료만 활성화하세요. 본문 한 챕터를 쓴다면, 직접 관련된 설정·챕터 개요·제한된 컨텍스트만 읽히세요
SoloEnt.md를 만들어 AI가 이 한 파일로 빠르게 컨텍스트를 파악하게 하고, 매번 여러 문서를 읽게 하지 마세요
@로 정확히 참조하거나, shift를 누른 채 필요한 파일만 대화창에 끌어오세요. 기본으로 모두 열거나 읽지 마세요
대화를 수정할 때는 해당 단락만 선택하고, 챕터 전체를 선택하지 마세요
각 장면이 끝나면 더 이상 필요 없는 문서 참조를 닫으세요

절약 예상치: 40–60%

2. 긴 설명 대신 짧은 지시문을 사용하세요

AI에게 배경 설명은 필요 없습니다. 필요한 것은 “무엇을” “어떻게”입니다. SoloEnt는 이미 시스템 프롬프트를 제공하므로 대화에서 다시 깔아둘 필요가 없습니다. 토큰을 낭비하는 작성:

당신은 전문 소설 집필 보조입니다. 이 대사를 좀 더 긴장감 있게 다시 써 주세요.
독자가 두 인물 사이의 긴장을 느낄 수 있도록, 동시에 인물 성격의 일관성도
유지하면서…

토큰을 아끼는 작성:

대사 재작성: 갈등 긴장감 강화, 캐릭터 어조 유지

자주 쓰는 지시는 Skill로 저장해 한 번의 호출, 0의 설명 비용으로 사용하세요.

절약 예상치: 20–35%

3. 사용 중인 Rules를 점검하세요

Rules는 가장 간과되는 숨은 토큰 소비원입니다. 매 요청마다 강제로 로드되기 때문입니다. 정리 원칙:

본문 집필용 Rules는 본문을 쓸 때만 로드하세요
“당신은……” 식의 역할 도입 문구는 삭제하세요(AI는 이미 자신이 무엇인지 압니다)
단락 대신 목록으로 쓰세요. 같은 정보, 토큰은 절반
분기마다 한 번 Rules를 점검해, 이미 내재화돼 명시할 필요가 없는 내용을 정리하세요

절약 예상치: 15–30%

중간 영향 — 좋은 일상 습관 만들기

4. 가벼운 작업에는 가벼운 모델을 사용하세요

모든 작업에 가장 강력한 모델이 필요한 것은 아닙니다.

작업 유형	최적 모델 (품질이 중요할 때)	경량 모델 (품질을 낮춰도 될 때)
브레인스토밍, 개요 생성, 일관성 점검	Sonnet	Haiku, GLM
본문 집필, 대사 다듬기, 장면 확장	Gemini	Doubao, DeepSeek
복잡한 플롯 설계, 깊은 스타일 모방, 장편 논리 정리	Opus	Sonnet, GLM
초안 생성, 개요 초안	GLM, DeepSeek	오픈소스 모델

절약 예상치: 50–70% (가벼운 작업 기준)

5. 한 번에 전체를 요구하지 말고 단계별로 진행하세요

“2,000자 챕터를 한 번에 → 마음에 안 들면 다시”는 가장 낭비가 큰 패턴입니다. 권장 흐름(챕터 집필 예시):

먼저 챕터 개요

AI가 본 챕터의 구조와 비트를 내놓게 하세요

본문 전개

개요가 만족스러우면 그제서야 본문을 씁니다

어조와 스타일 미세 조정

마지막에 부분적으로 다듬기

각 단계의 토큰은 적고, 방향이 맞은 것을 확인한 뒤 다음으로 넘어갑니다. 반복적인 전체 재생성보다 총 소비가 훨씬 적습니다. Plan 모드를 활용하세요: 실행 전에 Plan 모드로 전환해 가벼운 대화 몇 번으로 방향, 구조, 핵심 디테일을 정렬한 뒤, 실행 모드로 돌아와 본문을 생성합니다. Plan 모드의 토큰 소비는 매우 적고, 한 번 정렬해 두면 이후의 잦은 재생성을 크게 줄여줍니다.

[Plan 모드]
이 챕터는 A와 B의 화해를 그리되 C에 대한 복선을 남기고 싶어. 가능한 구성은?
→ 방향과 비트 정렬

[실행 모드]
두 번째 구성으로 본문 작성

절약 예상치: 30–50% (반복 작업)

6. 새 창을 자주 열고, 오래된 대화를 이어가지 마세요

모든 대화 창은 히스토리를 누적합니다. 주고받은 양이 많아질수록 다음 입력의 토큰도 커집니다. 수십 턴이 쌓인 창은 “과거의 무게”만으로도 많은 토큰을 차지합니다. 권장 사항:

독립적인 작업 하나를 마치면, 다음은 새 창에서 시작하세요
한 창에서 대사 다듬기·개요 논의·설정 수정까지 모두 하지 마세요
한 창이 매우 길어진 상태에서 재생성이 필요하면, 새 창을 열어 필요한 컨텍스트만 가져가세요
SoloEnt.md 호출이나 @로 특정 파일을 지정해 정확한 필수 컨텍스트를 다시 활성화하세요

좋은 습관: 한 창, 한 가지 일

절약 예상치: 10–30% (장기 누적)

7. AI에게 다시 쓰지 말고 수정만 하라고 하세요

제약이 없으면 AI는 단락 전체를 다시 출력하는 경향이 있습니다. 그러므로 매번 무엇을 바꿀지 명시하세요. 전체 재작성 유발:

이 글을 개선해 줘

수정 부분만 출력:

세 번째 단락만, 문장의 호흡을 늦춰서 수정한 단락만 출력. 나머지는 필요 없음

“설명 불필요”, “요약 불필요”도 함께 — AI의 도입부와 마무리 멘트도 토큰을 소비합니다.

절약 예상치: 20–40% (다듬기 작업)

고급 기법 — 깊은 최적화

8. 자주 쓰는 흐름을 Workflow로 고정하세요

챕터를 쓰기 전마다 같은 작업을 반복한다면(이전 줄거리 확인, 캐릭터 감정 점검, 챕터 개요 읽기), 이를 Workflow로 만드세요. 매개변수는 “챕터 번호”만, 나머지는 시스템이 자동으로 조립합니다. 호출당 프롬프트 토큰이 매번 들쭉날쭉한 값이 아니라 고정된 최솟값이 됩니다. 동시에 실행의 일관성도 보장됩니다.

결과: 일관성 + 토큰 절약 동시 달성

9. 로컬 모델을 “초안 레이어”로 사용하세요

LM Studio로 오픈소스 모델을 로컬에서 실행해 초안을 만드세요(한계 비용 0). 초안이 나온 뒤에는 클라우드 모델로 마지막 다듬기 한 번만 — 토큰 소비는 적고 효과는 큽니다. 하드웨어 참고:

메모리	실행 가능한 모델	적합 용도
16 GB	7B 파라미터	초안 작성
32 GB	13B 파라미터	보다 안정적인 품질

다작 작가에게 적합하며, 클라우드 소비를 60% 이상 줄일 수 있습니다.

한 줄 요약

프롬프트를 최적화하지 말고, 컨텍스트를 통제하며 필요한 것을 정확히 전달하세요. 이것이 토큰 절약의 핵심입니다.

짧은 Rules, 정확한 참조, 용도에 맞는 모델 선택 — 이 셋을 동시에 하면 월 토큰 청구액을 절반 이상 줄일 수 있고, 집필 품질은 전혀 떨어지지 않습니다.

사전 조건: 클라이언트를 최신 버전으로 유지하세요

최신 버전 다운로드

핵심 공식

영향이 큰 항목 — 매번 적용해야 할 습관

1. 컨텍스트 창의 범위를 좁히세요

2. 긴 설명 대신 짧은 지시문을 사용하세요

3. 사용 중인 Rules를 점검하세요

중간 영향 — 좋은 일상 습관 만들기

4. 가벼운 작업에는 가벼운 모델을 사용하세요

5. 한 번에 전체를 요구하지 말고 단계별로 진행하세요

6. 새 창을 자주 열고, 오래된 대화를 이어가지 마세요

7. AI에게 다시 쓰지 말고 수정만 하라고 하세요

고급 기법 — 깊은 최적화

8. 자주 쓰는 흐름을 Workflow로 고정하세요

9. 로컬 모델을 “초안 레이어”로 사용하세요

한 줄 요약

다음 단계

플랜 선택

구독 관리

​사전 조건: 클라이언트를 최신 버전으로 유지하세요

최신 버전 다운로드

​핵심 공식

​영향이 큰 항목 — 매번 적용해야 할 습관

​1. 컨텍스트 창의 범위를 좁히세요

​2. 긴 설명 대신 짧은 지시문을 사용하세요

​3. 사용 중인 Rules를 점검하세요

​중간 영향 — 좋은 일상 습관 만들기

​4. 가벼운 작업에는 가벼운 모델을 사용하세요

​5. 한 번에 전체를 요구하지 말고 단계별로 진행하세요

​6. 새 창을 자주 열고, 오래된 대화를 이어가지 마세요

​7. AI에게 다시 쓰지 말고 수정만 하라고 하세요

​고급 기법 — 깊은 최적화

​8. 자주 쓰는 흐름을 Workflow로 고정하세요

​9. 로컬 모델을 “초안 레이어”로 사용하세요

​한 줄 요약

​다음 단계

플랜 선택

구독 관리

사전 조건: 클라이언트를 최신 버전으로 유지하세요

핵심 공식

영향이 큰 항목 — 매번 적용해야 할 습관

1. 컨텍스트 창의 범위를 좁히세요

2. 긴 설명 대신 짧은 지시문을 사용하세요

3. 사용 중인 Rules를 점검하세요

중간 영향 — 좋은 일상 습관 만들기

4. 가벼운 작업에는 가벼운 모델을 사용하세요

5. 한 번에 전체를 요구하지 말고 단계별로 진행하세요

6. 새 창을 자주 열고, 오래된 대화를 이어가지 마세요

7. AI에게 다시 쓰지 말고 수정만 하라고 하세요

고급 기법 — 깊은 최적화

8. 자주 쓰는 흐름을 Workflow로 고정하세요

9. 로컬 모델을 “초안 레이어”로 사용하세요

한 줄 요약

다음 단계