QwQ-32B 추론 모델
Qwen 시리즈의 강력한 추론 모델로, 사고와 추론 능력이 크게 향상되어 다운스트림 작업, 특히 어려운 문제에서 뛰어난 성능을 보입니다. QwQ-32B는 최첨단 추론 모델과 경쟁력 있는 성능을 달성했습니다.
주요 특징:
- RoPE, SwiGLU, RMSNorm을 적용한 고급 아키텍처
- 325억 매개변수 (310억 비임베딩 매개변수)
- 131,072 토큰의 긴 컨텍스트 길이
- 최첨단 추론 능력

QwQ-32B 체험하기
HuggingFace Spaces나 QwenChat을 통해 설치 없이 모델을 시도해보세요.
특징
QwQ-32B의 특별한 점
QwQ-32B는 강력한 사고 능력과 최첨단 성능을 결합한 중형 추론 모델입니다.
고급 아키텍처
RoPE, SwiGLU, RMSNorm 및 Attention QKV 바이어스를 갖춘 트랜스포머 기반
정교한 구조
Q에 40개, KV에 8개의 어텐션 헤드를 가진 64개 레이어 (GQA)
확장된 컨텍스트 길이
포괄적인 분석을 위한 131,072 토큰의 전체 컨텍스트 길이 지원
대규모 매개변수
깊은 추론을 위한 325억 총 매개변수 (310억 비임베딩 매개변수)
향상된 추론
다운스트림 작업과 어려운 문제에서 크게 향상된 성능
쉬운 배포
최적의 성능을 위한 vLLM을 포함한 다양한 배포 옵션 지원
사용자 후기
QwQ-32B에 대한 커뮤니티 피드백
Today, we release QwQ-32B, our new reasoning model with only 32 billion parameters that rivals cutting-edge reasoning model, e.g., DeepSeek-R1.
— Qwen (@Alibaba_Qwen) March 5, 2025
Blog: https://t.co/zCgACNdodj
HF: https://t.co/pfjZygOiyQ
ModelScope: https://t.co/hcfOD8wSLa
Demo: https://t.co/DxWPzAg6g8
Qwen Chat:… pic.twitter.com/kfvbNgNucW
The new QwQ-32B by Alibaba scores 59% on GPQA Diamond for scientific reasoning and 86% on AIME 2024 for math. It excels in math but lags in scientific reasoning compared to top models. pic.twitter.com/MLcKsumk4n
— xNomad (@xNomadAI) March 7, 2025
the new QwQ 32B model is insanely fast…
— David Ondrej (@DavidOndrej1) March 6, 2025
imagine once this is added to Infinite Thinking 😮💨 pic.twitter.com/z0kftcV8zW
الصين 🇨🇳 ما زالت تتحدى
— سعيد الكلباني (@smalkalbani) March 5, 2025
أطلقت Alibaba نموذج صغير QwQ-32B ولكنه يتفوق على DeepSeek الذي يفوقه في الحجم بحوالي 20 مرة.
QwQ-32B يتفوق على جميع النماذج مفتوحة المصدر ولكنه يتخلف بفارق بسيط عن o1
بالامكان استخدامه من هنا https://t.co/ySOcPP3uFb pic.twitter.com/Y3M5kjjr4v
QwQ-32B changed local AI coding forever 🤯
— Victor M (@victormustar) March 7, 2025
We now have SOTA performance at home. Sharing my stack + tips ⬇️ pic.twitter.com/dL3pkCfdm5
QwQ-32B 的 KCORES 大模型竞技场测试结果发布!
— karminski-牙医 (@karminski3) March 6, 2025
Qwen-QwQ-32B-BF16 目前测试得分为 278.9 分(图1),在榜单中超过了 DeepSeek-V3, 距离DeepSeek-R1 还比较远。
但是!距离线上的 Qwen-2.5-Max-Thinking-QwQ-Preview 仅差 0.2 分!这意味着千问这次开源的的确就是线上水平的版本!(性能类似… pic.twitter.com/ifNGKt312a
今週のAI界隈、激動すぎる...
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) March 10, 2025
・Windsurf Previewsでアプリ開発が進化
・ChatGPTがIDEコード編集に対応
・Sesameが超リアルなAI音声を実現
・Alibaba QwQ-32Bが小型で高性能な推論
・Mistral OCRがドキュメント理解API発表
・Deepseekの再来・AIエージェントmanus
詳細スレッドで解説します👇🧵
【DeepSeek超え】中国からまた半端ないAIモデルが登場
— チャエン | デジライズ CEO《重要AIニュースを毎日最速で発信⚡️》 (@masahirochaen) March 6, 2025
アリババのAIモデル「QwQ-32B」が公開。
なんとパラメーター32BでDeepSeek R1 671Bを超えの精度。実はQWENのチャットは無料で深い思考、ウェブ検索、Artifacts、動画・画像生成が可能で実は最強。こんな高機能で無料は唯一無二。⇩リンク pic.twitter.com/kbDCbQgzlT