Perbandingan Model

Meta-Llama-3.1-8B-Instruct

vs

QwQ-32B

28 Feb 2026

Harga

Input

$

0.06

/ M Tokens

$

0.15

/ M Tokens

Output

$

0.06

/ M Tokens

$

0.58

/ M Tokens

Metadata

Buat di

5 Mar 2025

Lisensi

LLAMA 3.1 COMMUNITY

APACHE-2.0

Penyedia

Meta Llama

Qwen

Spesifikasi

Negara

Deprecated

Available

Arsitektur

Transformer Decoder

Causal Decoder Transformer

Terkalibrasi

Ya

Tidak

Campuran Ahli

Tidak

Tidak

Total Parameter

8B

32B

Parameter yang Diaktifkan

8B

32.5B

Penalaran

Tidak

Tidak

Precision

FP8

FP8

Text panjang konteks

33K

131K

Max Tokens

4K

131K

Didukung Keberfungsian

Serverless

didukung

didukung

Serverless LoRA

Tidak didukung

Tidak didukung

Fine-tuning

Tidak didukung

Tidak didukung

Embeddings

Tidak didukung

Tidak didukung

Rerankers

Tidak didukung

Tidak didukung

Dukung Image Input

Tidak didukung

Tidak didukung

JSON Mode

didukung

Tidak didukung

Output Terstruktur

Tidak didukung

Tidak didukung

Alat

Tidak didukung

didukung

Fim Completion

Tidak didukung

Tidak didukung

Chat Prefix Completion

didukung

Tidak didukung

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?