Unsloth에서 GLM 5.2 양자화 모델을 공개했습니다. 개인 기기는 2-bit 모델(82% 정확도)이 최대일 것 같고, 가성비로는 4-bit 모델(98% 정확도)일 것 같습니다.

Unsloth, GLM 5.2 실행 가이드

Unsloth에서 GLM 5.2를 Local 에서 실행할 수 있는 양자화 모델을 공개했습니다. GLM 5.2 모델은 1.51TB의 디스크 공간을 필요로 하는 반면, Unsloth Dynamic 2-bit GGUF는 중요한 레이어를 8비트 또는 16비트로 업캐스팅하여 이를 239GB(-84% 크기)로 줄입니다. Dynamic 1-bit는 217GB(-86%)로 더 줄입니다. 원 모델 대비해서 Dynamic 2-bit 모델 정확도는 82%, 4-bit 모델의 정확도는 98%에 이를 정도라고 합니다. 

AD

GLM 5.2의 2-bit, 4bit 모델을 Local 에서 실행하기 위한 하드웨어 사양은 다음과 같습니다.  개인은 Nvidia DGX Spark 통합 메모리 256GB 모델에서 2-bit 정도만 사용 가능해 보입니다.

 


 

※ 출처: r/LocalLLM, r/openclaw, r/unsloth, r/opencode, r/claude

AD

LEAVE A REPLY

Please enter your comment!
Please enter your name here