Perbandingan Model

DeepSeek-R1-Distill-Qwen-7B

vs

Qwen2.5-VL-7B-Instruct

10 Feb 2026

Harga

Input

$

0.05

/ M Tokens

$

0.05

/ M Tokens

Output

$

0.05

/ M Tokens

$

0.05

/ M Tokens

Metadata

Buat di

20 Jan 2025

26 Jan 2025

Lisensi

MIT LICENSE

APACHE-2.0

Penyedia

DeepSeek

Qwen

Spesifikasi

Negara

Deprecated

Available

Arsitektur

Qwen2.5

Vision-Language Model (VLM) combining a Vision Transformer (ViT) with window attention, SwiGLU, and RMSNorm, aligned with the Qwen2.5 LLM structure. It utilizes mRoPE for temporal understanding and YaRN for long text context handling.

Terkalibrasi

Tidak

Tidak

Campuran Ahli

Tidak

Tidak

Total Parameter

7B

7B

Parameter yang Diaktifkan

7B

7B

Penalaran

Tidak

Tidak

Precision

FP8

FP8

Text panjang konteks

33K

33K

Max Tokens

16K

4K

Didukung Keberfungsian

Serverless

didukung

didukung

Serverless LoRA

Tidak didukung

Tidak didukung

Fine-tuning

Tidak didukung

Tidak didukung

Embeddings

Tidak didukung

Tidak didukung

Rerankers

Tidak didukung

Tidak didukung

Dukung Image Input

Tidak didukung

Tidak didukung

JSON Mode

didukung

Tidak didukung

Output Terstruktur

Tidak didukung

Tidak didukung

Alat

didukung

Tidak didukung

Fim Completion

didukung

Tidak didukung

Chat Prefix Completion

Tidak didukung

didukung

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Siap untuk mempercepat pengembangan AI Anda?

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow

Indonesian (Indonesia)

© 2025 SiliconFlow