Qwen2.5-VL-72B-Instruct

Qwen2.5-VL-72B-Instruct

Qwen/Qwen2.5-VL-72B-Instruct

关于Qwen2.5-VL-72B-Instruct

Qwen2.5-VL 是 Qwen2.5 系列中的一种 Vision-语言模型,在多个方面显示出显著增强:它具有强大的视觉理解能力,能够识别常见对象,同时分析 Image 中的文本、图表和布局;它作为一个能够推理和动态指引工具的视觉代理;它能够理解超过1小时长的视频并捕捉关键事件;它通过生成边界框或点准确定位 Image 中的物体;并支持扫描数据(如发票和表单)的结构化 Output。该模型在包括 Image、Video 和代理任务的各个基准测试中表现出色。

可用的 Serverless

立即运行查询,仅按使用量付费

$

0.59

/

$

0.59

每 100 万 token(Input/Output)

元数据

创建

2025年1月28日

许可证

-

提供者

Qwen

规格

Available

建筑

校准的

专家混合

总参数

72B

激活的参数

72B

推理

精度

FP8

上下文长度

131K

最大输出长度

4K

支持功能

Serverless

支持

Serverless LoRA

不支持

微调

不支持

Embeddings

不支持

Rerankers

不支持

支持 Image Input

支持

JSON Mode

不支持

结构化Outputs

不支持

工具

不支持

FIM 补全

不支持

对话前缀补全

支持

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?