Qwen3-8B

Qwen3-8B

Qwen/Qwen3-8B

关于Qwen3-8B

Qwen3-8B是Qwen系列中最新的大型语言模型,具有8.2B参数。该模型独特地支持在思维模式(用于复杂的逻辑推理、数学和编码)和非思维模式(用于高效、通用的对话)之间无缝切换。它在推理能力上显著增强,超越了之前的QwQ和Qwen2.5指令模型,在数学、代码生成和常识逻辑推理方面表现出色。该模型在人类偏好对齐方面表现优异,适用于创意写作、角色扮演和多轮对话。此外,它支持100多种语言和方言,具有强大的多语言指令跟随和翻译能力。

可用的 Serverless

立即运行查询,仅按使用量付费

$

0.06

/

$

0.06

每 100 万 token(Input/Output)

元数据

创建

2025年4月30日

许可证

APACHE-2.0

提供者

Qwen

HuggingFace

规格

Available

建筑

校准的

专家混合

总参数

8B

激活的参数

推理

精度

FP8

上下文长度

131K

最大输出长度

131K

支持功能

Serverless

支持

Serverless LoRA

不支持

微调

不支持

Embeddings

不支持

Rerankers

不支持

支持 Image Input

不支持

JSON Mode

支持

结构化Outputs

不支持

工具

支持

FIM 补全

不支持

对话前缀补全

不支持

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?