模型

產品

定價

文檔

部落格

關於

聯繫

🎉 Kimi-K3可在 SiliconFlow 上使用。現在就試試看。

模型

Qwen2.5-72B-Instruct

Qwen2.5-72B-Instruct

Qwen/Qwen2.5-72B-Instruct

API 參考

關於Qwen2.5-72B-Instruct

Qwen2.5-72B-Instruct 是阿里雲最新發布的大型語言模型系列之一。72B 模型在編碼和數學等方面顯示了顯著的改進。此模型還提供多語言支持，涵蓋超過 29 種語言，包括中文和英文。它在遵循指令、理解結構化數據以及生成結構化輸出（特別是 JSON 格式）方面顯示了顯著增強。

可用的無伺服器

立即運行查詢，僅按使用量付費

每百萬 Tokens（輸入/輸出）

0.59

/ M Tokens

每百萬 Tokens（輸入/輸出）

0.59

/ M Tokens

體驗中心

API 使用

基準

用例

元數據

創建於

2024年9月18日

許可證

供應商

Qwen

HuggingFace

Qwen2.5-72B-Instruct

規格

狀態

Available

架構

Causal Transformer

經過校準的

否

專家並行

是

總參數

72B

啟用的參數

72.7B

推理

否

精度

FP8

上下文長度

33K

最大輸出長度

支援的功能

無伺服器

支持

無伺服器的 LoRA

不支持

微調

不支持

向量嵌入

不支持

重排序

不支持

支援圖片輸入

不支持

JSON 模式

支持

結構化輸出

不支持

工具

支持

中間填充補全

不支持

聊天前綴補全

支持

與其他模型比較

看看這個模型與其他模型的對比如何。

Qwen

chat

Qwen3-VL-32B-Instruct

發行日期：2025年10月21日

總上下文：

262K

最大輸出：

262K

輸入：

0.2

/ M Tokens

輸出：

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

發行日期：2025年10月21日

總上下文：

262K

最大輸出：

262K

輸入：

0.2

/ M Tokens

輸出：

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

發行日期：2025年10月15日

總上下文：

262K

最大輸出：

262K

輸入：

0.18

/ M Tokens

輸出：

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

發行日期：2025年10月15日

總上下文：

262K

最大輸出：

262K

輸入：

0.18

/ M Tokens

輸出：

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

發行日期：2025年10月4日

總上下文：

262K

最大輸出：

262K

輸入：

0.3

/ M Tokens

輸出：

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

發行日期：2025年10月4日

總上下文：

262K

最大輸出：

262K

輸入：

0.45

/ M Tokens

輸出：

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

發行日期：2025年10月5日

總上下文：

262K

最大輸出：

262K

輸入：

0.29

/ M Tokens

輸出：

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

發行日期：2025年10月11日

總上下文：

262K

最大輸出：

262K

輸入：

0.29

/ M Tokens

輸出：

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

發行日期：2025年8月13日

0.29

/ Video

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

準備好加速您的人工智能開發了嗎？

頁面

模型

產品

頁面

模型

產品

頁面

模型

產品