Qwen3-VL-32B Теперь на SiliconFlow: Интеллект флагманского уровня с эффективностью Dense-Model

28 окт. 2025 г.

Содержание

Краткий обзор: Qwen3-VL-32B — последняя добавка к семейству Qwen3-VL — теперь доступна на SiliconFlow. Всего с 32B плотными параметрами он достигает флагманского уровня в многомодальном рассуждении и понимании, превосходя GPT-5 mini и Claude 4 Sonnet, предоставляя более быстрый ответ, низкую стоимость и отличный баланс между эффективностью и производительностью. Начните строительство сегодня через SiliconFlow's OpenAI**/Anthropic-совместимый API**, и разблокируйте производительность плотного уровня с флагманским интеллектом.

Основываясь на успехе Qwen3-VL-235B и Qwen3-VL-8B, доступных на SiliconFlow, Qwen3-VL-32B дополнительно обогащает семейство Qwen3-VL, завершив полный охват сценариев понимания видение-язык — от легких до флагманских моделей. Несмотря на использование только 32B параметров, он достигает производительности, сопоставимой с моделями размером до 235B, и даже превосходит их в таких тестах, как OSWorld, демонстрируя замечательную эффективность и силу в рассуждении.

С помощью API Qwen3-VL-32B от SiliconFlow вы можете рассчитывать на:

Экономически эффективное ценообразование:
- Qwen3-VL-32B-Instruct: $0,2/М tokens (ввод) и $0,6/М tokens (вывод)
- Qwen3-VL-32B-Thinking: $0,2/М tokens (ввод) и $1,5/М tokens (вывод)
Два варианта модели:
- Instruct: обеспечивает более быстрый отклик и более стабильное выполнение, идеальный для задач диалога и вызова инструментов.
- Thinking: улучшает длинные цепочки рассуждений и сложное визуальное понимание, способное "видеть и мыслить" через сложные многомодальные проблемы.
262K Контекстное окно: обеспечивает беспрепятственную обработку длинных документов и многократных разговоров.

Будь то изучение визуального рассуждения, анализ документов или разработка многомодальных агентов, API Qwen3-VL-32B от SiliconFlow позволяет легко ввести флагманский уровень многомодального интеллекта в реальные приложения.

Ключевые особенности и производительность в тестах

Серия Qwen3-VL расширяет возможности многомодального интеллекта по задачам — от визуального понимания, создания контента до рассуждения и творческого создания, делая видение и понимание мира легче, быстрее и умнее.

Основываясь на этом фундаменте, серия Qwen3-VL-32B достигает новых высот как в многомодальных, так и в чисто текстовых тестах, сочетая эффективность плотного уровня с флагманским уровнем производительности:

Производительность многомодальных задач: Qwen3-VL-32B превосходит в STEM рассуждения, VQA, OCR, видео понимание и агентские задачи, постоянно превосходя GPT-5 mini и Claude 4 Sonnet в ключевых категориях.
Занимает 1 место на OSWorld: подчеркивает его способность "видеть, рассуждать и действовать" в сложных задачах визуальных агентов.
Текстовая и рассудочная производительность: Qwen3-VL-32B также демонстрирует выдающиеся чисто текстовые рассуждения, показывая надежную производительность в понимании языка и логическом выводе.

На сегодняшний день SiliconFlow предлагает полную линейку моделей Qwen3-VL, включая:

Плотные модели: Qwen3-VL-8B и Qwen3-VL-32B
MoE модели: Qwen3-VL-30B-A3B и Qwen3-VL-235B-A22B

Каждая модель доступна в вариантах Instruct и Thinking, что позволяет разработчикам гибко получить доступ к соответствующим услугам API и выбрать соответствующий баланс между производительностью, эффективностью и глубиной рассуждений.

Сценарии реального применения

Созданный как для разработчиков, так и для исследователей, Qwen3-VL-32B открывает новые возможности в многомодальных AI приложениях:

Понимание и анализ видео: идентифицировать действия, резюмировать сцены и отслеживать временные динамики в длинных видео для автоматизации или медиа-интеллекта.
Визуальное рассуждение и задачи STEM: интерпретировать диаграммы, научные графики и сложные математические задачи с контекстным рассуждением, идеальный для образования, исследований и технической документации.

Многомодальные агенты: соединить восприятие и рассуждение для создания интеллектуальных помощников, способных понимать изображения, анализировать данные и выполнять контекстуальные действия.
Понимание документов и OCR: извлекать и резюмировать ключевую информацию из отсканированных документов, квитанций или рукописных заметок с высокой точностью.

Начните немедленно

Изучите: Попробуйте Qwen3-VL-32B в песочнице SiliconFlow.
Интегрируйте: Используйте наш совместимый с OpenAI API. Изучите полные спецификации API в документации API SiliconFlow.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen3-VL-32B-Thinking",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": "https://sf-maas.s3.us-east-1.amazonaws.com/images/recufyDh5zjKVl.png"}
                },
                {
                    "type": "text",
                    "text": "what's this?"
                }
            ]
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)