Gemma 4 가이드
GLM 5.2 가격 완벽 정리: API 비용, 구독 플랜, 무료 사용법 (2026)

GLM 5.2 가격 완벽 정리: API 비용, 구독 플랜, 무료 사용법 (2026)
GLM 5.2는 Z.ai(구 Zhipu AI)가 2026년 6월 16일 출시한 7,440억 파라미터 혼합 전문가(MoE) 모델입니다. 100만 토큰 컨텍스트 창을 지원하며 MIT 라이선스로 공개됐습니다. 가격은 GPT-5.5의 약 6분의 1 수준으로, 현재 시장에서 가장 비용 효율적인 프런티어 모델 중 하나입니다.
이 가이드는 2026년 6월 22일 기준 GLM 5.2의 모든 가격 옵션을 다룹니다 — API 토큰 요금, GLM Coding Plan 구독, OpenRouter 가격, 무료 접근 방법.
가격은 언제든지 변경될 수 있습니다. 최신 요금은 z.ai/subscribe와 bigmodel.cn/pricing에서 확인하세요.
빠른 요약: GLM 5.2 가격 한눈에 보기
| 접근 방식 | 가격 |
|---|---|
| API — 입력 | 백만 토큰당 $1.40 |
| API — 캐시 입력 | 백만 토큰당 $0.26 |
| API — 출력 | 백만 토큰당 $4.40 |
| OpenRouter — 입력 | 백만 토큰당 $1.00 |
| OpenRouter — 출력 | 백만 토큰당 $4.00 |
| GLM Coding Lite | 월 약 $10–$18 |
| GLM Coding Pro | 월 약 $30–$50 |
| GLM Coding Max | 월 약 $80–$112 |
| 자체 호스팅 (MIT 가중치) | 무료 (하드웨어 비용만) |
| 신규 사용자 무료 토큰 | 2,000만 토큰 (bigmodel.cn) |
GLM 5.2 무료 사용 방법
1. 신규 사용자 무료 토큰 (bigmodel.cn)
bigmodel.cn에 신규 가입하면 2,000만 토큰 무료 패키지와 이미지·영상 생성 120회 크레딧이 자동으로 지급됩니다.
2. Z.ai 개발자 CLI 무료 토큰 프로그램
Z.ai는 자사 코딩 CLI를 사용하는 개발자에게 대규모 무료 토큰을 제공하고 있습니다(커뮤니티 보고에 따르면 약 3억 토큰). 자격 조건과 할당량은 변경될 수 있으니 z.ai에서 최신 정보를 확인하세요.
3. 자체 호스팅 (MIT 라이선스)
GLM 5.2는 MIT 라이선스로 출시되어 Hugging Face(zai-org/GLM-5.2)에서 무료로 가중치를 다운로드해 직접 실행할 수 있습니다. 단, 744B MoE 모델을 BF16으로 실행하려면 1TB 이상의 GPU VRAM이 필요합니다.
4. ZCode 3.0 일일 무료 할당량
Zhipu의 ZCode 3.0은 자격을 갖춘 사용자에게 하루 300만 GLM 5.2 토큰을 무료로 제공합니다. 자세한 내용은 open.bigmodel.cn/glm-coding에서 확인하세요.
GLM 5.2 API 가격
GLM 5.2 독립형 API는 2026년 6월 16일 Z.ai 개발자 플랫폼을 통해 정식 출시됐습니다.
토큰 요금 (2026년 6월 기준)
| 토큰 유형 | 백만 토큰당 가격 |
|---|---|
| 입력 토큰 | $1.40 |
| 캐시 입력 토큰 | $0.26 |
| 출력 토큰 | $4.40 |
캐시 입력 가격($0.26/MTok)은 동일한 대규모 코드베이스 컨텍스트를 반복 참조하는 에이전트 워크플로에서 특히 유리합니다. 캐싱 시 입력 비용을 80% 이상 절감할 수 있습니다.
실제 비용 예시
에이전트 워크플로: 하루 10,000회 호출 (입력 2,000 + 출력 500 토큰)
| 모델 | 일일 API 비용 |
|---|---|
| GLM 5.2 | 약 $23/일 |
| GPT-5.5 | 약 $95/일 |
| Claude Opus 4.8 | 약 $375/일 |
월간 배치 처리: 1,000만 토큰 (입력/출력 50/50)
| 모델 | 월 비용 |
|---|---|
| GLM 5.2 | 약 $29/월 |
| GPT-5.5 | 약 $175/월 |
| Claude Opus 4.8 | 약 $150/월 |
GLM 5.2 구독 플랜 (GLM Coding Plan)
토큰 과금 API 외에도 Z.ai는 GLM Coding Plan을 제공합니다 — 코딩 도구(Claude Code, VS Code, Cursor 등) 내에서 사용하기 위한 월정액 구독 서비스입니다.
GLM Coding Plan 등급
| 플랜 | 월 가격 (약) | 사용 한도 | 적합한 대상 |
|---|---|---|---|
| Lite | 월 약 $10–$18 | 주 약 400회 프롬프트 | 소규모 저장소 경량 반복 작업 |
| Pro | 월 약 $30–$50 | 주 약 2,000회 (Lite의 5배) | 중형 저장소 일상 개발 |
| Max | 월 약 $80–$112 | 주 약 8,000회 (Lite의 20배) | 고강도 워크로드, 피크 시간 전용 리소스 |
| Team | 시트 기반 가격 | 맞춤형 | 팀 단위 청구가 필요한 조직 |
참고: 연간 결제 시 약 10–15% 할인이 적용됩니다. 현재 정확한 가격은 z.ai/subscribe에서 확인하세요.
OpenRouter에서의 GLM 5.2 가격
GLM 5.2는 OpenRouter에서도 사용할 수 있으며, Z.ai 직접 API보다 약간 저렴합니다.
| 토큰 유형 | OpenRouter 백만 토큰당 가격 |
|---|---|
| 입력 | $1.00 |
| 캐시 입력 | $0.26 |
| 출력 | $4.00 |
이미 OpenRouter를 멀티 프로바이더 라우팅에 사용 중이라면, OpenRouter를 통해 GLM 5.2에 접근하면 단일 API 엔드포인트로 관리할 수 있습니다.
GLM 5.2 vs Claude vs GPT-5.5 가격 비교
2026년 6월 기준 주요 프런티어 모델 전체 비교:
| 모델 | 입력 ($/MTok) | 출력 ($/MTok) | 컨텍스트 창 |
|---|---|---|---|
| GLM 5.2 | $1.40 | $4.40 | 100만 토큰 |
| GPT-5.5 | $5.00 | $30.00 | 12.8만 토큰 |
| Claude Opus 4.8 | $5.00 | $25.00 | 20만 토큰 |
| Gemini 3.1 Pro | ~$3.50 | ~$10.50 | 200만 토큰 |
핵심 결론:
- GLM 5.2 입력 토큰은 Claude Opus 4.8과 GPT-5.5보다 3.6배 저렴합니다.
- GLM 5.2 출력 토큰은 Claude Opus 4.8보다 5.7배, GPT-5.5보다 약 7배 저렴합니다.
- 여러 코딩 벤치마크(SWE-bench Verified 등)에서 GLM 5.2는 GPT-5.5를 앞서는 성능을 보여줍니다.
GLM 5.2 API 키 발급 방법
Z.ai를 통해 (글로벌)
- docs.z.ai에서 계정을 만드세요.
- GLM Coding Plan으로 이동해 구독 등급을 선택하거나 토큰 과금 API를 선택하세요.
- 구독 후 Individual Coding Plan > Plan Overview에서 API 키를 생성하세요.
- Team 플랜 사용자: Team Coding Plan > My Plan에서 API 키를 확인하세요.
- Base URL을
https://api.z.ai/api/coding/paas/v4로 설정하세요.
Claude Code 빠른 설정
# 자동화 헬퍼
npx @z_ai/coding-helper
# 또는 수동: ~/.claude/settings.json 편집
# ANTHROPIC_BASE_URL을 https://api.z.ai/api/anthropic으로 설정
# ANTHROPIC_AUTH_TOKEN을 Z.ai API 키로 설정
GLM 5.2는 가격 대비 가치가 있을까?
코딩 및 에이전트 작업에는 확실히 그렇습니다. GLM 5.2는 장기 소프트웨어 엔지니어링 작업을 위해 특별히 설계됐으며, GPT-5.5 대비 약 6분의 1의 비용으로 여러 코딩 벤치마크에서 동등하거나 더 나은 성능을 보입니다.
GLM 5.2가 적합한 경우:
- 대규모 코딩 에이전트 (SWE-bench 스타일 워크플로)
- 100만 토큰 컨텍스트가 필요한 전체 코드베이스 분석
- AI 인프라 비용을 절감해야 하는 팀
- 컴플라이언스 또는 자체 호스팅을 위해 오픈 가중치가 필요한 조직
Claude 또는 GPT-5.5를 선택해야 할 경우:
- 비코딩 추론, 창작, 일반 지식 위주의 작업
- Claude 또는 OpenAI 생태계에 이미 깊이 통합된 팀
자주 묻는 질문
GLM 5.2는 얼마인가요?
2026년 6월 기준 GLM 5.2 API 가격: Z.ai 직접 API 기준 입력 $1.40/MTok, 출력 $4.40/MTok, 캐시 입력 $0.26/MTok. OpenRouter: 입력 $1.00/MTok, 출력 $4.00/MTok. 구독 플랜(GLM Coding Plan)은 Lite 등급 기준 월 약 $10–$18부터 시작합니다.
GLM 5.2 무료 플랜이 있나요?
있습니다. bigmodel.cn 신규 가입자는 2,000만 토큰을 무료로 받습니다. Z.ai 코딩 CLI도 대규모 무료 토큰 프로그램(약 3억 토큰 보고됨)을 운영합니다. 전체 모델 가중치는 MIT 라이선스로 Hugging Face에서 무료 다운로드 가능합니다.
GLM 5.2 API는 토큰당 얼마인가요?
Z.ai 직접 API: 입력 토큰당 약 $0.0000014, 출력 토큰당 약 $0.0000044. OpenRouter: 입력 토큰당 약 $0.000001, 출력 토큰당 약 $0.000004.
GLM 5.2가 Claude보다 저렴한가요?
예, 훨씬 저렴합니다. Claude Opus 4.8($5/MTok 입력, $25/MTok 출력)과 비교하면 GLM 5.2는 입력에서 3.6배, 출력에서 5.7배 저렴합니다.
GLM 5.2 API 키는 어디서 발급받나요?
글로벌: z.ai 가입 또는 docs.z.ai 빠른 시작 가이드를 따르세요. 서드파티 플랫폼 OpenRouter와 Together AI를 통해서도 접근 가능합니다.
GLM 5.2 무료 API가 있나요?
있습니다 — bigmodel.cn 신규 계정에는 2,000만 토큰 무료 할당량이 제공됩니다. Z.ai도 코딩 CLI 사용자에게 프로모션 무료 토큰을 제공합니다. 모델 가중치는 Hugging Face에서 무료로 다운로드할 수 있습니다.
관련 가이드
마지막 업데이트: 2026년 6월 22일. 가격 정보는 Z.ai 공식 문서, OpenRouter 및 서드파티 벤치마크 보고서를 기반으로 합니다. 구매 결정 전 z.ai/subscribe와 bigmodel.cn/pricing에서 최신 가격을 반드시 확인하세요.
관련 가이드
지금 고민 중인 결정과 가장 잘 맞는 다음 가이드를 따라 Gemma 4 클러스터를 계속 탐색해 보세요.

GLM 5.2 리뷰: 벤치마크, 코딩 성능, 그리고 사용할 가치가 있는가?
GLM 5.2는 2026년 6월 13일 출시된 Zhipu AI의 오픈 웨이트 플래그십 모델로, 744B MoE 파라미터, 100만 토큰 컨텍스트 창, MIT 라이선스를 갖추고 GPT-5.5의 약 6분의 1 비용으로 클로즈드 소스 프론티어 모델에 필적하는 성능을 보여줍니다.

GLM 5.2는 무료인가요? 2026년 모든 무료 사용 방법 총정리
GLM 5.2는 MIT 라이선스로 무료 다운로드 및 자체 호스팅이 가능합니다. Cloudflare Workers AI와 z.ai 웹 채팅을 통한 무료 체험도 가능합니다. 이 가이드는 모든 무료 옵션과 유료 전환 시점을 설명합니다.

Ollama에서 GLM-5.2 실행하기: Cloud 태그, 로컬 설정 및 API 가이드
GLM-5.2는 glm-5.2:cloud 태그를 통해 Ollama에서 사용 가능합니다. 명령 하나로 976K 컨텍스트 코딩 모델을 사용할 수 있으며, 744B 파라미터를 직접 다운로드할 필요가 없습니다.
다음에 무엇을 읽을지 아직 고민 중인가요?
가이드 허브로 돌아가 모델 비교, 설정 워크스루, 하드웨어 계획 페이지를 둘러보세요.
