模型

产品

定价

文档

博客

关于

联系

🎉 LongCat-2.0 可以在 SiliconFlow 上使用。现在就尝试吧。

🎉 LongCat-2.0 可以在 SiliconFlow 上使用。现在就尝试吧。

模型

Qwen2.5-VL-7B-Instruct

Qwen2.5-VL-7B-Instruct

API 参考

关于Qwen2.5-VL-7B-Instruct

Qwen2.5-VL 是 Qwen 系列的新成员，配备了强大的视觉理解能力。它可以分析 Image 中的 Text、图表和布局，理解长时间的 Video，并捕捉事件。它能够进行推理、操作工具、支持多格式对象定位，并生成结构化的 Output。该模型已针对 Video 理解中的动态分辨率和帧率训练进行了优化，并提高了视觉编码器的效率。

用例

探索如何将Qwen2.5-VL-7B-Instruct强大的视觉理解和代理能力应用于多个领域解决复杂的现实世界问题。

自动化文档智能

从各种视觉文档（如发票、表格和报告）中提取结构化数据，包括文本、表格和布局，具有高度准确性和多格式Output。

使用案例示例：

"处理了10,000份扫描发票，将供应商、项目和总金额提取为JSON格式，减少了金融公司90%的人工数据输入。"

智能视频事件检测

分析长时间视频内容（超过1小时），以识别、定位和时间标记特定事件、对象或动作，从而实现高效的内容审核、监控或体育分析。

使用案例示例：

"监控了2小时的安全录像，定位所有未经授权的访问尝试，并为安全系统生成精确时间标记的入侵者边界框。"

AI驱动的UI自动化

作为视觉代理，与应用程序（网页、移动端、桌面端）进行交互和测试，通过理解UI元素、导航工作流程和识别视觉异常或功能错误。

使用案例示例：

"自动化复杂电子商务网页应用的端到端测试，视觉验证按钮功能、表单提交和在各种屏幕尺寸上的布局一致性，识别关键UI漏洞。"

上下文视觉助手

通过视觉解释用户屏幕、图表或图形提供实时协助，并通过与软件工具或网络界面进行互动执行复杂的多步骤任务。

使用案例示例：

"在基于Python的数据科学环境中指导用户完成复杂的数据分析工作流，视觉解释其当前数据，建议下一步，执行特定的Pandas操作和Matplotlib图表生成。"

精度Image标注

通过生成精确的边界框、点和结构化属性输出，准确识别和定位Image（例如，卫星影像、医学扫描）中的对象，适用于大型数据集。

使用案例示例：

"标注了成千上万的无人机航拍Image用于城市规划，精确描绘建筑物轮廓、道路网络和绿色空间，辅以边界框和置信度分数，加快基础设施评估。"

元数据

创建

2025年1月28日

许可证

APACHE-2.0

提供者

Qwen

HuggingFace

Qwen2.5-VL-7B-Instruct

规格

州

Deprecated

建筑

Vision-Language Transformer

校准的

不

专家混合

不

总参数

7B

激活的参数

7B

推理

不

精度

FP8

上下文长度

33K

最大输出长度

4K

与其他模型进行比较

看看这个模型与其他模型相比表现如何。

Qwen

chat

Qwen3-VL-32B-Instruct

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

发行日期：2025年10月21日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

发行日期：2025年10月15日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

发行日期：2025年10月4日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

发行日期：2025年10月5日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

发行日期：2025年10月11日

上下文长度：

262K

最大输出长度：

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

发行日期：2025年8月13日

$

0.29

/ Video

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

准备好加速您的人工智能开发吗？

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·

页面

模型S

产品

© 2025 SiliconFlow

·