Home SE Note

AI_knoweledge

오픈 소스 AI모델 명칭 붙는 접미사의 종류와 의미

2026-04-13

31

Huggingface, ollama 등 오픈 소스 AI 모델 배포처에 보면 다양한 형식의 AI 모델이 있습니다. 동일한 모델인데도 다양한 변종 모델이 존재하는데 모델 이름에 가장 많이 붙어 있는 접미사(?) 의미는 아래와 같습니다.

1. ‑instruct (Instruction‑tuned)

의미	Instruction‑tuned
핵심	모델이 “프롬프트를 명령어 형태로 입력하면 바로 원하는 동작을 수행하도록 미세조정(미세튜닝)된 형태.
왜 쓰나요?	– 일반 “대화형” 모델은 자유롭게 문장을 만들지만, 정해진 API 혹은 자동화 파이프라인에 끼워 넣을 때 오류가 생기기 쉽다. – 인스트럭션 튜닝을 하면 “당신은 X 작업을 수행하는 AI다” 같은 메타‑프롬프트를 넣었을 때 출력 포맷이 일관되게 된다.
대표 모델	– `OpenChat-3.5‑Instruct` (Meta) – `Mistral‑Instruct‑7B` (Mistral AI) – `Llama‑2‑7B‑Chat` (Meta): “Chat” 라벨이 붙어 있지만, 가중치는 Instruction‑tuned 버전이다.
구분 포인트	프롬프트 앞에 “ … ” 같은 마크나 “You are a helpful assistant.” 같은 메타‑프롬프트를 넣으면 바로 동작.

2. ‑think (Chain‑of‑Thought aware / Reasoning‑oriented)

의미	Think
핵심	모델이 계산 과정을 내부에 포함해 스스로 “생각(Think)”하도록 설계된 경우가 많다. 실제 파라미터는 일반 LLM과 동일하지만, 프롬프트 템플릿이나 후보 생성 전략에 “Think step‑by‑step” 를 자동 삽입해준다.
왜 쓰나요?	– 복합 수학·논리·코딩 문제에 대해 “점점 더 정확한 답”을 얻고 싶을 때. – “자동 CoT” 를 제공해 사용자가 별도 프롬프트를 고민할 필요가 없도록 만든다.
대표 모델	– `GPT‑NeoX‑Chat‑Think` (EleutherAI 커스텀) – `Phi‑2‑Think` (Microsoft) – `Llama‑3‑Think‑8B` (Meta, 실험적)
구분 포인트	프롬프트에 “Think step‑by‑step” 혹은 “Let’s think out loud.” 라는 라벨이 붙은 경우, 모델은 내부적으로 여러 토큰을 할당해 사고 과정을 만든다. 일반 모델은 이런 라벨이 없으면 바로 답을 출력한다.

3. ‑hf (Hugging Face)

의미	HF
핵심	`transformers` 라이브러리와 바로 호환되는 Hugging Face 포맷(config.json, pytorch_model.bin, tokenizer.json 등) 으로 저장된 모델. 보통 `_hf` 라벨은 “이 모델을 `from_pretrained('username/model_name')` 로 바로 불러올 수 있다*” 라는 의미를 담는다.
왜 쓰나요?	– `transformers` 에서는 `model = AutoModelForCausalLM.from_pretrained('username/model_name')` 한 줄로 로드 가능. – 메타데이터(`model_card`)에 사용 License, inference API, quant‑type 등이 자동 기록된다.
대표 모델	– `microsoft/phi-2-hf` – `stabilityai/stable-diffusion2-1-blog‑hf` (텍스트‑투‑이미지) – `google/gemma-2b‑hf`
구분 포인트	GitHub에 `model_repo` 라는 폴더가 있고, 그 안에 `README.md`, `config.json`, `pytorch_model.bin` 등 HF 표준 파일이 존재한다. “‑hf” 라벨이 있으면 “HF‑friendly”라는 뜻으로,다른 프레임워크(예: TensorFlow, ONNX)용 변환 스크립트를 별도로 제공할 수도 있다.

4. 기타 흔히 보는 접미어 (보충)

접미어	의미	예시
‑v (version)	특정 버전을 나타냄 (예: `Llama‑2‑13B‑v1`)
‑quant	양자화(INT8, FP4 등) 적용 버전 (예: `BLOOM‑7B‑quant`)
‑sft	Supervised Fine‑Tuning (지도 미세조정)
‑rlhf	Reinforcement Learning from Human Feedback (인간 피드백 RL)
‑code	코드 생성에 특화 (예: `CodeLlama‑7B‑code`)
‑chat	대화형 UI를 기본으로 튜닝 (보통 인스트럭션 튜닝과 동일)
‑lora	LoRA 어댑터를 전체 모델에 병합했는지 여부 (예: `StableLM‑Alpha‑7B‑LoRA‑merged`)
‑ggml	C/C++ · GGML 형식(예: `llama.cpp`용)

AD

팁:

접미어가 의미를 정확히 보장하지는 않는다. 실제 문서는 “Instruction‑tuned”를 명시했지만, 레포에 model_card에 적힌 설명을 꼭 확인하라.
다중 접미어가 겹치는 경우가 많다. 예를 들어 Gemma-2B-it-hf-quant → instruction‑tuned(‘it’ = Italian), Hugging‑Face format, 4‑bitquantized. 이때는 세 단계를 차례로 이해한다.

5. 한 눈에 보기 – 정리 표

접미어	핵심 의미	적용 대상	실제 활용 예시
‑instruct	Instruction‑tuned (명령형)	일반 LLM, Chat 모델	`Mistral‑Instruct‑7B`, `Llama‑2‑7B‑Chat`
‑think	Chain‑of‑Thought(생각) 지원	추론 강화, 수학·코딩	`Phi‑2‑Think`, `Llama‑3‑Think‑8B`
‑hf	Hugging‑Face 포맷	모든 `transformers` 모델	`google/gemma-2b-hf`
‑quant	양자화(저정밀) 적용	메모리·속도 최적화	`BLOOM‑7B‑int8`
‑sft	Supervised Fine‑Tuning	도메인 맞춤	`Alpaca‑7B-sft`
‑rlhf	RLHF 적용 (인간 피드백)	안전·정렬	`OpenAssistant‑RLHF‑7B`
‑code	코드 생성 최적화	코딩 보조	`CodeLlama‑13B‑code`
‑chat	대화형 프로필	인터랙티브 UI	`GPT‑NeoX‑Chat‑6B`

📌 핵심 요약

‑instruct → “명령형 프롬프트에 최적화” → 대화형이 아니라 정형 API에 가깝다.
‑think → “사고 과정을 내포” → 자동 Chain‑of‑Thought가 필요할 때.
‑hf → “한 번에 로드 가능한 HF 형식” → transformers와 바로 호환.
이 접미어들은 단독으로 쓰이기도 하고, 복합해서 (예: gpt4‑all‑v2‑instruct‑hf‑quant) 여러 특성을 한 번에 선언한다.

AD

MORE STORIES