> ## Documentation Index
> Fetch the complete documentation index at: https://docs.soloent.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# 토큰 절약 가이드

> 토큰을 효율적으로 사용하고 SoloEnt 월 청구액을 줄이는 방법

## 사전 조건: 클라이언트를 최신 버전으로 유지하세요

저희는 모든 릴리스마다 컨텍스트 관리와 API 캐싱을 지속적으로 개선하여, 모델이 바뀌어도 항상 최적의 비용 효율을 제공해 드립니다.

<Card title="최신 버전 다운로드" icon="download" href="https://soloent.ai">
  공식 사이트에서 최신 SoloEnt 클라이언트를 받으세요
</Card>

## 핵심 공식

<Note>
  **토큰 사용량 = 입력 크기 × 호출 횟수**
</Note>

이 공식을 이해하면 방향은 명확합니다. 매번 입력 크기를 줄이고, 불필요한 호출을 줄이는 두 가지 축으로 풀어갑니다.

## 영향이 큰 항목 — 매번 적용해야 할 습관

### 1. 컨텍스트 창의 범위를 좁히세요

AI에게 정말 필요한 것만 보여주세요. 47장을 쓸 때 1장은 필요 없습니다. 한 줄의 대사를 다듬을 때 챕터 전체는 필요 없습니다.

**실천 방법**:

* 현재 작업과 관련된 자료만 활성화하세요. 본문 한 챕터를 쓴다면, 직접 관련된 설정·챕터 개요·제한된 컨텍스트만 읽히세요
* [`SoloEnt.md`](../tips/SoloEnt)를 만들어 AI가 이 한 파일로 빠르게 컨텍스트를 파악하게 하고, 매번 여러 문서를 읽게 하지 마세요
* `@`로 정확히 참조하거나, `shift`를 누른 채 필요한 파일만 대화창에 끌어오세요. 기본으로 모두 열거나 읽지 마세요
* 대화를 수정할 때는 해당 단락만 선택하고, 챕터 전체를 선택하지 마세요
* 각 장면이 끝나면 더 이상 필요 없는 문서 참조를 닫으세요

<Tip>
  절약 예상치: **40–60%**
</Tip>

### 2. 긴 설명 대신 짧은 지시문을 사용하세요

AI에게 배경 설명은 필요 없습니다. 필요한 것은 "무엇을" "어떻게"입니다. SoloEnt는 이미 시스템 프롬프트를 제공하므로 대화에서 다시 깔아둘 필요가 없습니다.

**토큰을 낭비하는 작성**:

```text theme={null}
당신은 전문 소설 집필 보조입니다. 이 대사를 좀 더 긴장감 있게 다시 써 주세요.
독자가 두 인물 사이의 긴장을 느낄 수 있도록, 동시에 인물 성격의 일관성도
유지하면서…
```

**토큰을 아끼는 작성**:

```text theme={null}
대사 재작성: 갈등 긴장감 강화, 캐릭터 어조 유지
```

자주 쓰는 지시는 [Skill](../tips/skills)로 저장해 한 번의 호출, 0의 설명 비용으로 사용하세요.

<Tip>
  절약 예상치: **20–35%**
</Tip>

### 3. 사용 중인 Rules를 점검하세요

[Rules](../tips/rules)는 가장 간과되는 숨은 토큰 소비원입니다. 매 요청마다 강제로 로드되기 때문입니다.

**정리 원칙**:

* 본문 집필용 Rules는 본문을 쓸 때만 로드하세요
* "당신은……" 식의 역할 도입 문구는 삭제하세요(AI는 이미 자신이 무엇인지 압니다)
* 단락 대신 목록으로 쓰세요. 같은 정보, 토큰은 절반
* 분기마다 한 번 Rules를 점검해, 이미 내재화돼 명시할 필요가 없는 내용을 정리하세요

<Tip>
  절약 예상치: **15–30%**
</Tip>

## 중간 영향 — 좋은 일상 습관 만들기

### 4. 가벼운 작업에는 가벼운 모델을 사용하세요

모든 작업에 가장 강력한 모델이 필요한 것은 아닙니다.

| 작업 유형                          | 최적 모델 (품질이 중요할 때) | 경량 모델 (품질을 낮춰도 될 때) |
| ------------------------------ | ----------------- | ------------------- |
| 브레인스토밍, 개요 생성, 일관성 점검          | Sonnet            | Haiku, GLM          |
| 본문 집필, 대사 다듬기, 장면 확장           | Gemini            | Doubao, DeepSeek    |
| 복잡한 플롯 설계, 깊은 스타일 모방, 장편 논리 정리 | Opus              | Sonnet, GLM         |
| 초안 생성, 개요 초안                   | GLM, DeepSeek     | 오픈소스 모델             |

<Tip>
  절약 예상치: **50–70%** (가벼운 작업 기준)
</Tip>

### 5. 한 번에 전체를 요구하지 말고 단계별로 진행하세요

"2,000자 챕터를 한 번에 → 마음에 안 들면 다시"는 **가장 낭비가 큰 패턴**입니다.

**권장 흐름**(챕터 집필 예시):

<Steps>
  <Step title="먼저 챕터 개요">
    AI가 본 챕터의 구조와 비트를 내놓게 하세요
  </Step>

  <Step title="본문 전개">
    개요가 만족스러우면 그제서야 본문을 씁니다
  </Step>

  <Step title="어조와 스타일 미세 조정">
    마지막에 부분적으로 다듬기
  </Step>
</Steps>

각 단계의 토큰은 적고, 방향이 맞은 것을 확인한 뒤 다음으로 넘어갑니다. 반복적인 전체 재생성보다 총 소비가 훨씬 적습니다.

**[Plan 모드](../tips/plan-mode)를 활용하세요**: 실행 전에 Plan 모드로 전환해 가벼운 대화 몇 번으로 방향, 구조, 핵심 디테일을 정렬한 뒤, 실행 모드로 돌아와 본문을 생성합니다. Plan 모드의 토큰 소비는 매우 적고, 한 번 정렬해 두면 이후의 잦은 재생성을 크게 줄여줍니다.

```text theme={null}
[Plan 모드]
이 챕터는 A와 B의 화해를 그리되 C에 대한 복선을 남기고 싶어. 가능한 구성은?
→ 방향과 비트 정렬

[실행 모드]
두 번째 구성으로 본문 작성
```

<Tip>
  절약 예상치: **30–50%** (반복 작업)
</Tip>

### 6. 새 창을 자주 열고, 오래된 대화를 이어가지 마세요

모든 대화 창은 히스토리를 누적합니다. 주고받은 양이 많아질수록 다음 입력의 토큰도 커집니다. 수십 턴이 쌓인 창은 "과거의 무게"만으로도 많은 토큰을 차지합니다.

**권장 사항**:

* 독립적인 작업 하나를 마치면, 다음은 새 창에서 시작하세요
* 한 창에서 대사 다듬기·개요 논의·설정 수정까지 모두 하지 마세요
* 한 창이 매우 길어진 상태에서 재생성이 필요하면, 새 창을 열어 필요한 컨텍스트만 가져가세요
* [`SoloEnt.md`](../tips/SoloEnt) 호출이나 `@`로 특정 파일을 지정해 정확한 필수 컨텍스트를 다시 활성화하세요

<Note>
  좋은 습관: **한 창, 한 가지 일**
</Note>

<Tip>
  절약 예상치: **10–30%** (장기 누적)
</Tip>

### 7. AI에게 다시 쓰지 말고 수정만 하라고 하세요

제약이 없으면 AI는 단락 전체를 다시 출력하는 경향이 있습니다. 그러므로 **매번 무엇을 바꿀지 명시**하세요.

**전체 재작성 유발**:

```text theme={null}
이 글을 개선해 줘
```

**수정 부분만 출력**:

```text theme={null}
세 번째 단락만, 문장의 호흡을 늦춰서 수정한 단락만 출력. 나머지는 필요 없음
```

"설명 불필요", "요약 불필요"도 함께 — AI의 도입부와 마무리 멘트도 토큰을 소비합니다.

<Tip>
  절약 예상치: **20–40%** (다듬기 작업)
</Tip>

## 고급 기법 — 깊은 최적화

### 8. 자주 쓰는 흐름을 Workflow로 고정하세요

챕터를 쓰기 전마다 같은 작업을 반복한다면(이전 줄거리 확인, 캐릭터 감정 점검, 챕터 개요 읽기), 이를 [Workflow](../tips/workflows)로 만드세요. 매개변수는 "챕터 번호"만, 나머지는 시스템이 자동으로 조립합니다.

호출당 프롬프트 토큰이 매번 들쭉날쭉한 값이 아니라 고정된 최솟값이 됩니다. 동시에 실행의 일관성도 보장됩니다.

<Note>
  결과: **일관성 + 토큰 절약 동시 달성**
</Note>

### 9. 로컬 모델을 "초안 레이어"로 사용하세요

[LM Studio](../resources/local-llms)로 오픈소스 모델을 로컬에서 실행해 초안을 만드세요(한계 비용 0). 초안이 나온 뒤에는 클라우드 모델로 마지막 다듬기 한 번만 — 토큰 소비는 적고 효과는 큽니다.

**하드웨어 참고**:

| 메모리   | 실행 가능한 모델 | 적합 용도      |
| ----- | --------- | ---------- |
| 16 GB | 7B 파라미터   | 초안 작성      |
| 32 GB | 13B 파라미터  | 보다 안정적인 품질 |

다작 작가에게 적합하며, 클라우드 소비를 **60% 이상** 줄일 수 있습니다.

## 한 줄 요약

<Note>
  프롬프트를 최적화하지 말고, 컨텍스트를 통제하며 필요한 것을 정확히 전달하세요. 이것이 토큰 절약의 핵심입니다.
</Note>

짧은 Rules, 정확한 참조, 용도에 맞는 모델 선택 — 이 셋을 동시에 하면 월 토큰 청구액을 절반 이상 줄일 수 있고, 집필 품질은 전혀 떨어지지 않습니다.

## 다음 단계

<CardGroup cols={2}>
  <Card title="플랜 선택" icon="credit-card" href="./choose-your-plan">
    플랜과 가격 비교
  </Card>

  <Card title="구독 관리" icon="gear" href="./manage-subscription">
    잔액, 인보이스, 해지
  </Card>
</CardGroup>