Mellum2 소개: JetBrains의 12B 혼합 전문가 모델
- Mellum2는 자연어와 코드에 대해 처음부터 학습된 12B-파라미터 혼합 전문가 모델입니다.
- 모델은 토큰당 2.5B 파라미터만 활성화하여 높은 처리량과 낮은 지연 시간 추론에 효율적입니다. Mellum2는 라우팅, RAG, 요약, 서브 에이전트, 높은 처리량 코딩 기능 및 개인 배포에 사용할 수 있습니다.
- Apache 2.0 라이센스로 출시되었습니다.
- 비슷한 크기의 모델들과 비교할 때, Mellum2는 경쟁력 있는 벤치마크 성능을 제공하면서 2배 이상 빠른 추론을 달성합니다.
- Hugging Face에서 모델 다운로드: https://huggingface.co/collections/JetBrains/mellum-2
- 아키텍처 세부 사항, 학습 설정, 벤치마크 및 평가 방법론을 확인하려면 전체 기술 보고서를 읽으세요: https://arxiv.org/pdf/2605.31268
오늘 우리는 낮은 지연 시간의 텍스트 및 코드 워크로드에 최적화된 오픈 혼합 전문가 모델인 Mellum2를 출시하고 있습니다. Mellum은 원래 코드 완성 모델로 시작했습니다. Mellum2를 통해 우리는 그 기초를 더 광범위한 자연어 및 소프트웨어 엔지니어링 작업으로 확장하면서 모델을 효율적인 추론과 배포 가능성에 집중하고 있습니다. 현대 AI 시스템은 점점 더 여러 모델 호출에 의존합니다: 라우팅, 검색, 요약, 계획, 검증 및 도구 사용. 이러한 작업 중 많은 작업들은 지연 시간에 민감하며 가장 큰 사용 가능한 모델이 필요하지 않습니다. Mellum2는 이러한 워크로드를 목표로 합니다.
벤치마크 하이라이트
우리의 기술 보고서에서 우리는 코드 생성, 추론, 과학 및 수학 벤치마크에서 Mellum2를 평가합니다. Mellum2는 비슷한 크기의 오픈 모델들과 경쟁력이 있으면서 2배 이상 빠른 추론을 제공하여 높은 처리량의 프로덕션 워크로드에 적합합니다. 모델 아키텍처 Mellum2는 혼합 전문가 모델입니다:
| 모델 | 전체 파라미터 | 토큰당 활성 파라미터 | 양식 | 라이센스 |
|---|---|---|---|---|
| Mellum2 | 12B | 2.5B | 텍스트 및 코드 | Apache 2.0 |
MoE 아키텍처는 전체 모델 용량을 높게 유지하면서 각 토큰에 대해 파라미터의 부분집합만 활성화합니다. 이는 추론을 더 효율적으로 만들고 실시간 워크로드의 서빙 비용을 줄이는 데 도움이 됩니다. Mellum2는 의도적으로 멀티모달 작업보다 텍스트와 코드에 집중합니다. 이러한 전문화는 소프트웨어 엔지니어링 워크로드를 위해 모델을 컴팩트하고 효율적으로 유지합니다.
주요 사용 사례
라우팅 및 오케스트레이션
Mellum2는 프롬프트 분류, 도구 선택 및 중간 제어 흐름 단계를 포함한 멀티 모델 시스템에서 경량 라우팅 및 오케스트레이션 모델로 잘 작동합니다.
RAG 파이프라인
모델은 컨텍스트 압축, 요약 및 검색 후처리를 포함한 지연 시간에 민감한 검색 파이프라인에 잘 적합합니다.
서브 에이전트
Mellum2는 계획, 검증, 변환 및 컨텍스트 준비와 같은 에이전트 부작업에 사용될 수 있으며, 중간 작업을 위해 더 큰 모델을 호출해야 하는 필요성을 줄입니다.
개인 배포
Mellum2는 오픈이고 효율적으로 서빙되기 때문에 독점 코드 또는 내부 데이터가 포함된 자체 호스팅 환경에 배포할 수 있습니다.
좋은 범위의 모델이 중요한 이유
AI 시스템이 성숙함에 따라 가장 효과적인 아키텍처는 점점 덜 단일형이 되고 있습니다. 단일 최첨단 모델은 강력할 수 있지만, 프로덕션 시스템은 종종 함께 작동하는 여러 전문화된 구성 요소가 필요합니다: 검색기, 라우터, 코드 인식 모델, 검증기, 도구 호출자 및 더 큰 추론 모델. 우리는 Mellum2를 "초점" 모델로 생각합니다: 더 큰 AI 시스템 내의 높은 빈도 작업에 최적화된 빠르고 좋은 범위의 모델. 목표는 스택의 모든 모델을 대체하는 것이 아닙니다. 목표는 스택을 더 빠르고, 저렴하고, 제어하기 쉽게 만드는 것입니다.
Mellum2 시작하기
IDE 내부, RAG 파이프라인에서, 에이전트 워크플로우의 일부로 또는 개인 인프라에서 소프트웨어 엔지니어링용 AI 시스템을 구축하고 있다면, Mellum2는 시도할 준비가 완료되었습니다.
