QwQ-32B 推論モデル

Qwenシリーズの強力な推論モデルで、思考と推論能力が大幅に向上し、特に難しい問題を含むダウンストリームタスクで優れた性能を発揮します。QwQ-32Bは最先端の推論モデルと競争力のある性能を達成しています。

主な特徴:

  • RoPE、SwiGLU、RMSNormを採用した先進的なアーキテクチャ
  • 325億パラメータ(310億非埋め込みパラメータ)
  • 131,072トークンの長文脈長
  • 最先端の推論能力
QwQ-32B Benchmark

QwQ-32Bを体験

HuggingFace SpacesまたはQwenChatで、インストール不要でモデルを試せます。

特徴

QwQ-32Bの特別な点

QwQ-32Bは、強力な思考能力と最先端の性能を組み合わせた中規模の推論モデルです。

先進的なアーキテクチャ

RoPE、SwiGLU、RMSNorm、Attention QKVバイアスを備えたトランスフォーマーを採用

洗練された構造

QとKVで異なる64層のアテンションヘッド(Qで40、KVで8のGQA)

拡張コンテキスト長

包括的な分析のための131,072トークンの完全なコンテキスト長をサポート

大規模パラメータ

深い推論のための325億の総パラメータ(310億の非埋め込みパラメータ)

強化された推論

ダウンストリームタスクと難問での性能が大幅に向上

容易な展開

最適なパフォーマンスのためのvLLMを含む様々な展開オプションをサポート

ユーザーの声

QwQ-32Bに関するコミュニティからのフィードバック

よくある質問

頻繁に寄せられる質問

さらに質問がありますか?メールをお送りください: support@qwqai.org

QwQ-32Bを試してみませんか?

先進的なAI推論の力を体験してください。