Seed-OSS-36B-Instruct теперь доступен на SiliconFlow: Смarter ИИ, который думает по запросу

5 сент. 2025 г.

Содержание

Seed-OSS-36B-Instruct теперь доступен на SiliconFlow

Короче: Попробуйте ByteDance Seed-OSS-36B-Instruct на SiliconFlow сегодня - получите более умные доводы через управляемые бюджеты мышления, высококачественные результаты по доступной цене и готовый к производству API для бесшовного развертывания и масштабирования.

SiliconFlow рад представить Seed-OSS-36B-Instruct в наш каталог моделей - революционную открытоисходную модель ByteDance, которая позволяет вам контролировать рассуждения AI. С ее Гибким Бюджетом Мышления пользователи могут точно настраивать глубину рассуждений для каждой задачи, в то время как улучшенные способности рассуждений и агентный интеллект обеспечивают исключительную производительность в решении проблем.

С API SiliconFlow Seed-OSS-36B-Instruct вы можете ожидать:

Конкурентное Ценообразование: Seed-OSS-36B-Instruct $0.21/М токенов (вход) и $0.57/М токенов (выход).
Поддержка 262k Окна Контекста: Позволяет пользователям решать сложные задачи плавно.

Почему Seed-OSS Важен

Большинство моделей с открытым исходным кодом часто кажутся черным ящиком: вы не можете контролировать, сколько AI думает, длинные документы быстро достигают пределов контекста, а затраты непредсказуемо масштабируются с сложностью задачи. Seed-OSS-36B-Instruct меняет это:

Гибкий Контроль Бюджета Мышления: Пользователи могут гибко настраивать длину рассуждений для соответствия сложности задачи, балансируя точность, эффективность и стоимость. Устанавливайте бюджеты в кратных 512 токенах (с кодом 0 для мгновенного прямого ответа), давая разработчикам контроль над производительностью в различных сценариях развертывания - особенно идеально для приложений, таких как обслуживание клиентов или автономные агенты.
Нативный Длинный Контекст: Не доработан, как другие модели, Seed-OSS обучен с длинным контекстом до 512K нативно. Другими словами, он обеспечивает более стабильную и последовательную производительность даже с массивным входом.
Продвинутые Рассуждения и Агентный Интеллект: Специально оптимизирован для сложных задач рассуждений, поддерживая сбалансированные общие способности, с исключительной производительностью в агентных рабочих потоках, таких как использование инструментов, многократное решение проблем, и разрешение вопросов.

Более того, Seed-OSS-36B-Instruct сопоставляется или превосходит производительность моделей с открытым исходным кодом высшего уровня в своем классе, включая Qwen3-30B-A3B-Thinking-2507, Qwen3-32B, и OAI-OSS-20B, в областях математики, кодирования, рассуждений, агентных задач и задачи обработки длинного контекста.

Контрольный показатель	Seed-OSS-36B-Instruct	Qwen3-30B-A3B-Thinking-2507	Qwen3-32B	OAI-OSS-20B	Gemma3-27B
Знание
MMLU-Pro	🥇82.7	81.9	81.8	76.2	67.5
MMLU	🥇87.4	86.9	86.2	81.7	76.9
GPQA-D	71.4	71.4	66.7	72.2	42.4
Математика
AIME24	91.7	87.7	82.7	92.7
AIME25	84.7	81.3	73.3	90.3
Рассуждения
HLE	10.1	8.7	6.9	12.7
Кодирование
LiveCodeBench v6	🥇67.4	60.3	53.4	63.8
Агент
TAU1-Retail	🥇70.4	58.7	40.9	54.8
SWE-Bench Verified	🥇47	39.7	23.4	60.7
Длинный Контекст
RULER (128K)	🥇94.6	94.5	77.5	78.7

Сценарии Применения в Реальном Мире

Как работает Бюджет Мышления на практике? Когда вы устанавливаете бюджет мышления, модель работает с полной прозрачностью. Вот пример, когда бюджет мышления установлен на 512: во время процесса рассуждений модель периодически запускает саморефлексию для оценки потребленного и оставшегося бюджета и предоставляет окончательный ответ, когда бюджет исчерпан или рассуждение заканчивается.

<seed:think>
Got it, let's try to solve this problem step by step. The problem says ... ...
<seed:cot_budget_reflect>I have used 129 tokens, and there are 383 tokens remaining for use.</seed:cot_budget_reflect>
Using the power rule, ... ...
<seed:cot_budget_reflect>I have used 258 tokens, and there are 254 tokens remaining for use.</seed:cot_budget_reflect>
Alternatively, remember that ... ...
<seed:cot_budget_reflect>I have used 393 tokens, and there are 119 tokens remaining for use.</seed:cot_budget_reflect>
Because if ... ...
<seed:cot_budget_reflect>I have exhausted my token budget, and now I will start answering the question.</seed:cot_budget_reflect>
</seed:think>
To solve the problem, we start by using the properties of logarithms to simplify the given equations: (full answer omitted)

<seed:think>
Got it, let's try to solve this problem step by step. The problem says ... ...
<seed:cot_budget_reflect>I have used 129 tokens, and there are 383 tokens remaining for use.</seed:cot_budget_reflect>
Using the power rule, ... ...
<seed:cot_budget_reflect>I have used 258 tokens, and there are 254 tokens remaining for use.</seed:cot_budget_reflect>
Alternatively, remember that ... ...
<seed:cot_budget_reflect>I have used 393 tokens, and there are 119 tokens remaining for use.</seed:cot_budget_reflect>
Because if ... ...
<seed:cot_budget_reflect>I have exhausted my token budget, and now I will start answering the question.</seed:cot_budget_reflect>
</seed:think>
To solve the problem, we start by using the properties of logarithms to simplify the given equations: (full answer omitted)

<seed:think>
Got it, let's try to solve this problem step by step. The problem says ... ...
<seed:cot_budget_reflect>I have used 129 tokens, and there are 383 tokens remaining for use.</seed:cot_budget_reflect>
Using the power rule, ... ...
<seed:cot_budget_reflect>I have used 258 tokens, and there are 254 tokens remaining for use.</seed:cot_budget_reflect>
Alternatively, remember that ... ...
<seed:cot_budget_reflect>I have used 393 tokens, and there are 119 tokens remaining for use.</seed:cot_budget_reflect>
Because if ... ...
<seed:cot_budget_reflect>I have exhausted my token budget, and now I will start answering the question.</seed:cot_budget_reflect>
</seed:think>
To solve the problem, we start by using the properties of logarithms to simplify the given equations: (full answer omitted)

Эти контролируемые рассуждения в сочетании с продвинутыми агентными возможностями открывают мощные случаи использования:

Адаптивная поддержка клиентов:
Масштабируйте рассуждения AI в зависимости от сложности запроса: мгновенные ответы на часто задаваемые вопросы, глубокий анализ технических проблем. Контролируйте затраты, сохраняя качество услуг в простых и сложных взаимодействиях с клиентами.
Интеллект документооборота для предприятий:
Поддержка извлечения и анализа информации из длинных документов, таких как руководства по соблюдению стандартов, пакеты контрактов или нормативные базы. Работайте с несколькими связанными документами, сохраняя связность контекста.
Умные рабочие потоки разработки:
Быстрая проверка синтаксиса с нулевым бюджетом на размышления, всесторонний обзор архитектуры с полной мощью рассуждений. Обрабатывайте целую базу кода за одну сессию, вместо изолированных фрагментов кода.
Глобальные операции:
Развертывайте поддерживающую AI помощь в международных рынках с нативными многоязычными возможностями. Поддержка исследований между юрисдикциями, культурной адаптации и анализа региональных рынков в рамках объединенных рабочих потоков.

Вне зависимости от того, оптимизируете вы эффективность поддержки клиентов, обрабатываете массивные библиотеки документов, упрощаете рабочие процессы разработки, или масштабируете глобальные операции, эта модель адаптируется к вашим специфическим потребностям, сохраняя прозрачность и предсказуемость затрат.

Начните Немедленно

Изучите: Попробуйте Seed-OSS-36B-Instruct в SiliconFlow playground.
Интегрируйте: Используйте наш API, совместимый с OpenAI. Ознакомьтесь с полными спецификациями API в документации SiliconFlow API.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "ByteDance-Seed/Seed-OSS-36B-Instruct",
    "messages": [
        {
            "role": "user",
            "content": "tell me a story"
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "ByteDance-Seed/Seed-OSS-36B-Instruct",
    "messages": [
        {
            "role": "user",
            "content": "tell me a story"
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "ByteDance-Seed/Seed-OSS-36B-Instruct",
    "messages": [
        {
            "role": "user",
            "content": "tell me a story"
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)