QwQ-32B 추론 모델

Qwen 시리즈의 강력한 추론 모델로, 사고와 추론 능력이 크게 향상되어 다운스트림 작업, 특히 어려운 문제에서 뛰어난 성능을 보입니다. QwQ-32B는 최첨단 추론 모델과 경쟁력 있는 성능을 달성했습니다.

주요 특징:

  • RoPE, SwiGLU, RMSNorm을 적용한 고급 아키텍처
  • 325억 매개변수 (310억 비임베딩 매개변수)
  • 131,072 토큰의 긴 컨텍스트 길이
  • 최첨단 추론 능력
QwQ-32B Benchmark

QwQ-32B 체험하기

HuggingFace Spaces나 QwenChat을 통해 설치 없이 모델을 시도해보세요.

특징

QwQ-32B의 특별한 점

QwQ-32B는 강력한 사고 능력과 최첨단 성능을 결합한 중형 추론 모델입니다.

고급 아키텍처

RoPE, SwiGLU, RMSNorm 및 Attention QKV 바이어스를 갖춘 트랜스포머 기반

정교한 구조

Q에 40개, KV에 8개의 어텐션 헤드를 가진 64개 레이어 (GQA)

확장된 컨텍스트 길이

포괄적인 분석을 위한 131,072 토큰의 전체 컨텍스트 길이 지원

대규모 매개변수

깊은 추론을 위한 325억 총 매개변수 (310억 비임베딩 매개변수)

향상된 추론

다운스트림 작업과 어려운 문제에서 크게 향상된 성능

쉬운 배포

최적의 성능을 위한 vLLM을 포함한 다양한 배포 옵션 지원

사용자 후기

QwQ-32B에 대한 커뮤니티 피드백

자주 묻는 질문

자주 받는 질문들

더 궁금한 점이 있으신가요? 이메일을 보내주세요: support@qwqai.org

QwQ-32B를 시도해보시겠습니까?

고급 AI 추론의 힘을 경험해보세요.