Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

공개 언어 모델

상용 거대 언어 모델(Closed-source Proprietary LLM) 시장을 OpenAI의 GPT 시리즈가 개척하고 선도해 왔다면, 다른 한편에서는 기술의 독점을 방지하고 누구나 자신만의 도메인에 맞춰 LLM을 직접 미세조정(SFT) 및 최적화할 수 있도록 지원하는 소스 공개(Open-Source) 및 가중치 공개(Open-Weight) 대형 언어 모델 생태계가 눈부시게 발전해 왔습니다.

본 장에서는 매년 전 세계 AI 연구 지표와 흐름을 진단하는 스탠포드 AI 인덱스 보고서(Stanford AI Index Report)의 분석 프레임을 바탕으로, 소스 공개(Open-Source) 및 가중치 공개(Open-Weight) LLM 생태계의 패러다임 변화와 이를 이끄는 세계 대표 5대 핵심 가중치 공개 모델들의 기술적 특징을 입체적으로 분석합니다.

1AI 인덱스로 본 가중치 공개 모델 동향

글로벌 AI 연구 동향의 가장 권위 있는 이정표인 스탠포드 AI 인덱스 보고서는 가중치 공개(Open-Weight) 모델 생태계의 몇 가지 파괴적인 메가 트렌드를 짚어내고 있습니다.

1.1'소스 공개(Open-Source)'와 '가중치 공개(Open-Weight)'의 정의적 구분

인덱스 보고서는 학습 데이터셋, 전처리 스크립트, 소스 코드까지 100% 투명하게 투사하는 '진정한 소스 공개(Open-Source) 모델’과 가중치 바이너리만 배포하는 '가중치 공개 모델(Open-Weight Model)'의 개념을 명확히 구분합니다. 최근 공개 생태계를 주도하는 모델들은 대부분 보안과 상업적 경쟁력을 이유로 학습 데이터 명세를 비공개로 유지한 채 가중치만 제공하는 가중치 공개(Open-Weight) 흐름으로 완전히 재편되었습니다.

1.2미국과 중국의 기술 격차 해소 (US-China Gap Closure)

최신 인덱스 보고서가 꼽은 가장 두드러진 지정학적 성과는 미국과 중국 기업 간의 AI 모델 기술 격차가 사실상 소멸(Closed)했다는 점입니다. 미국 실리콘밸리 진영의 모델들과 중국 테크 진영의 가중치 공개(Open-Weight) 모델들이 글로벌 성능 벤치마크(MMLU, HumanEval, MATH 등)에서 대등한 호각세를 보이고 있습니다.

1.3가중치 공개 모델의 질적 성장과 시장 장악

2소스 공개 및 가중치 공개 생태계를 이끄는 대표 브랜드와 시리즈

현재 전 세계 가중치 공개 LLM 생태계는 각각 독창적인 철학과 기술 혁신을 앞세운 다섯 가지 모델 패밀리가 지배하고 있습니다.

대표 가중치 공개(Open-Weight) 모델 계열

대표 가중치 공개(Open-Weight) 모델 계열

2.1Meta Llama 시리즈

2.2Alibaba Qwen 시리즈

2.3DeepSeek 시리즈

2.4Google Gemma 시리즈

2.5OpenAI GPT-OSS 시리즈

3대표 가중치 공개 모델 비교 요약

비교 항목Meta Llama 시리즈Alibaba Qwen 시리즈DeepSeek 시리즈Google Gemma 시리즈OpenAI GPT-OSS 시리즈
개발사Meta (미국)Alibaba (중국)DeepSeek (중국)Google (미국)OpenAI (미국)
모델 분류가중치 공개 (Open-Weight)가중치 공개 (Open-Weight)가중치 공개 (Open-Weight)가중치 공개 (Open-Weight)가중치 공개 (Open-Weight)
주요 아키텍처Dense (기본 트랜스포머)Dense (GQA 표준 규격)MoE (Mixture of Experts) & MLADense & MultimodalMoE (혼합 전문가 최적화)
한국어 표현력보통 (영어 위주 토크나이저)매우 우수 (다국어 최적화)우수 (중/영/한 균형 표상)우수 (구글 다국어 토크나이징)보통 (글로벌 표준 데이터셋)
주요 강점 영역전 세계 인프라 에코시스템 표준로컬 SFT 코딩 및 서비스 개발 호환초저비용 고성능 및 사슬 추론소형/경량 고성능 온디바이스 표준고난도 추론 및 완전 개방 Apache 2.0
라이선스 정책Llama License (상업 허용)Apache 2.0 (완전 개방 상업 허용)MIT License (제약 없는 소스 개방)Gemma Terms (상업 허용)Apache 2.0 (완전 개방 상업 허용)

가중치 공개 모델들의 질적 대도약은 더 이상 딥러닝 연구가 특정 실리콘밸리 빅테크 기업의 API 독점 전유물이 아님을 온천하에 선언했습니다. 다음 장부터는 이들 가중치 공개 모델들의 가중치를 직접 다운로드하고, 우리의 제한된 자원(로컬 GPU) 환경에서 사용자의 명령을 올바르게 이행하는 비서로 길들이는 사후 훈련(Post-training, 정렬)의 구체적인 실전 엔지니어링 과정을 한 단계씩 마스터해 나가겠습니다.