Qwen2.5-VL-72B-Instruct

Qwen2.5-VL-72B-Instruct

Qwen/Qwen2.5-VL-72B-Instruct

정보에 대해서Qwen2.5-VL-72B-Instruct

Qwen2.5-VL은 Qwen2.5 시리즈의 Vision-language Model로 여러 측면에서 상당한 향상을 보여줍니다: 강력한 비주얼 이해력을 갖추고 공통 사물을 인식하면서 이미지 내의 텍스트, 차트, 레이아웃을 분석할 수 있으며, 논리적 사고와 도구를 동적으로 지시할 수 있는 비주얼 에이전트로 기능합니다. 그것은 1시간 이상 길이의 Video를 이해하고 주요 이벤트를 포착할 수 있으며, 이미지 내 사물을 정확히 찾아 경계 상자 또는 포인트를 생성할 수 있습니다. 또한 송장 및 양식과 같은 스캔된 데이터에 대한 구조적 결과물을 지원합니다. 이 Model은 Image, Video, 에이전트 작업을 포함한 다양한 벤치마크에서 우수한 성능을 보여줍니다.

사용 가능한 Serverless

쿼리를 즉시 실행하고 사용한 만큼만 지불하세요.

$

0.59

/

$

0.59

1M 토큰당 (Input/Output)

메타데이터

생성하다

2025. 1. 28.

라이센스

-

공급자

Qwen

사양

Available

건축

교정된

아니요

전문가의 혼합

아니요

총 매개변수

72B

활성화된 매개변수

72B

추론

아니요

Precision

FP8

콘텍스트 길이

131K

Max Tokens

4K

지원됨 기능

Serverless

지원됨

Serverless LoRA

지원하지 않음

Fine-tuning

지원하지 않음

Embedding

지원하지 않음

Rerankers

지원하지 않음

지원 Image Input

지원됨

JSON Mode

지원하지 않음

구조화된 Outputs

지원하지 않음

도구

지원하지 않음

Fim Completion

지원하지 않음

Chat Prefix Completion

지원됨

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow