
模型比較
DeepSeek-R1-Distill-Qwen-7B
對比
Qwen3-VL-8B-Instruct
2026年2月10日

定價
輸入
$
0.05
/ M Tokens
$
0.18
/ M Tokens
輸出
$
0.05
/ M Tokens
$
0.68
/ M Tokens
元數據
創建於
2025年1月20日
2025年10月11日
許可證
MIT LICENSE
APACHE-2.0
供應商
DeepSeek
Qwen
規格
州
Deprecated
Available
架構
Qwen2.5
Dense
經過校準的
不
不
專家混合
不
不
總參數
7B
8B
啟用的參數
7B
8B
推理
不
不
精確
FP8
FP8
上下文長度
33K
262K
最大輸出長度
16K
262K
支援的功能
無伺服器
支持
支持
無伺服器的 LoRA
不支持
不支持
微調
不支持
不支持
嵌入
不支持
不支持
重新排名者
不支持
不支持
支援圖片輸入
不支持
不支持
JSON 模式
支持
支持
結構化輸出
不支持
不支持
工具
支持
支持
完成最後一步
支持
不支持
聊天前綴完成
不支持
支持
DeepSeek-R1-Distill-Qwen-7B在比較中
看看如何 DeepSeek-R1-Distill-Qwen-7B與其他熱門型號在關鍵層面上進行比較。
對戰

Qwen3-VL-32B-Instruct
對戰

Qwen3-VL-32B-Thinking
對戰

Qwen3-VL-8B-Instruct
對戰

Qwen3-VL-8B-Thinking
對戰

Qwen3-VL-30B-A3B-Instruct
對戰

Qwen3-VL-30B-A3B-Thinking
對戰

Qwen3-Omni-30B-A3B-Instruct
對戰

Qwen3-Omni-30B-A3B-Captioner
對戰

Qwen3-Omni-30B-A3B-Thinking
對戰

Ling-mini-2.0
對戰

Hunyuan-MT-7B
對戰
gpt-oss-20b
對戰

Qwen3-Coder-30B-A3B-Instruct
對戰

Qwen3-30B-A3B-Thinking-2507
對戰

Qwen3-30B-A3B-Instruct-2507
對戰

GLM-4.1V-9B-Thinking
對戰

Qwen3-14B
對戰

Qwen3-30B-A3B
對戰

Qwen3-32B
對戰

Qwen3-8B
