Claude Fable 5에 필적한다는 오픈 모델인 GLM 5.2 발표 소식으로 X가 뜨겁습니다. 753B 파라메터를 가진 1M context지원하고, 오픈 모델 중, 코딩 성능은 #1이라고 합니다. ollama cloud로 바로 사용해 보실 수 있습니다.

GLM 5.2 발표 – Open Weight 모델 coding 성능 #1, Opus 4.8 근접

간밤에 가장 큰 뉴스가 Z.Ai의 GLM 5.2 발표입니다. 753B 크기 파라메터를 가졌는 GLM 5.2(Max)는 Open Weight 모델 중에서 코딩 성능은 #1를 차지했고, 상용/무료 전체에서는 Claude Fable 5 에 이은 #2. 전반적인 성능은 Opus 4.8과 비슷하다고 합니다. 미국 정부가 Fable 사용을 금지시키자마자 중국 모델이 바로 나와주네요. 국가간 경쟁이 심화되는 것 같습니다. 우리도 소버린AI 시대 준비해야겠습니다.

AD

  • 100만 토큰 컨텍스트
  • 강화된 코딩: 성능과 지연 시간 균형을 맞추기 위한 다양한 사고(efforts) 수준 제공
  • 아키텍처 개선: IndexShare 구조로 1M context에서 토큰당 FLOPs를 2.9배 감소. 투기적 디코딩(Speculative Decoding)을 위한 MTP계층 개선하여 수용 길이를 최대 20% 증가시킴.

이미 Ollama cloud 모델로 사용이 가능합니다.

※ https://ollama.com/library/glm-5.2

 


 

※ 출처: r/LocalLLM, r/openclaw, r/unsloth, r/opencode, r/claude

AD

LEAVE A REPLY

Please enter your comment!
Please enter your name here