Seed-OSS-36B-Instruct теперь доступен на SiliconFlow: Смarter ИИ, который думает по запросу

5 сент. 2025 г.

Содержание

Seed-OSS-36B-Instruct теперь доступен на SiliconFlow
Seed-OSS-36B-Instruct теперь доступен на SiliconFlow

Короче: Попробуйте ByteDance Seed-OSS-36B-Instruct на SiliconFlow сегодня - получите более умные доводы через управляемые бюджеты мышления, высококачественные результаты по доступной цене и готовый к производству API для бесшовного развертывания и масштабирования.

SiliconFlow рад представить Seed-OSS-36B-Instruct в наш каталог моделей - революционную открытоисходную модель ByteDance, которая позволяет вам контролировать рассуждения AI. С ее Гибким Бюджетом Мышления пользователи могут точно настраивать глубину рассуждений для каждой задачи, в то время как улучшенные способности рассуждений и агентный интеллект обеспечивают исключительную производительность в решении проблем.

С API SiliconFlow Seed-OSS-36B-Instruct вы можете ожидать:

  • Конкурентное Ценообразование: Seed-OSS-36B-Instruct $0.21/М токенов (вход) и $0.57/М токенов (выход).

  • Поддержка 262k Окна Контекста: Позволяет пользователям решать сложные задачи плавно.


Почему Seed-OSS Важен

Большинство моделей с открытым исходным кодом часто кажутся черным ящиком: вы не можете контролировать, сколько AI думает, длинные документы быстро достигают пределов контекста, а затраты непредсказуемо масштабируются с сложностью задачи. Seed-OSS-36B-Instruct меняет это:

  • Гибкий Контроль Бюджета Мышления: Пользователи могут гибко настраивать длину рассуждений для соответствия сложности задачи, балансируя точность, эффективность и стоимость. Устанавливайте бюджеты в кратных 512 токенах (с кодом 0 для мгновенного прямого ответа), давая разработчикам контроль над производительностью в различных сценариях развертывания - особенно идеально для приложений, таких как обслуживание клиентов или автономные агенты.

  • Нативный Длинный Контекст: Не доработан, как другие модели, Seed-OSS обучен с длинным контекстом до 512K нативно. Другими словами, он обеспечивает более стабильную и последовательную производительность даже с массивным входом.

  • Продвинутые Рассуждения и Агентный Интеллект: Специально оптимизирован для сложных задач рассуждений, поддерживая сбалансированные общие способности, с исключительной производительностью в агентных рабочих потоках, таких как использование инструментов, многократное решение проблем, и разрешение вопросов.


Более того, Seed-OSS-36B-Instruct сопоставляется или превосходит производительность моделей с открытым исходным кодом высшего уровня в своем классе, включая Qwen3-30B-A3B-Thinking-2507, Qwen3-32B, и OAI-OSS-20B, в областях математики, кодирования, рассуждений, агентных задач и задачи обработки длинного контекста.


Контрольный показатель

Seed-OSS-36B-Instruct

Qwen3-30B-A3B-Thinking-2507

Qwen3-32B

OAI-OSS-20B

Gemma3-27B

Знание

MMLU-Pro

🥇82.7

81.9

81.8

76.2

67.5

MMLU

🥇87.4

86.9

86.2

81.7

76.9

GPQA-D

71.4

71.4

66.7

72.2

42.4

Математика

AIME24

91.7

87.7

82.7

92.7


AIME25

84.7

81.3

73.3

90.3


Рассуждения

HLE

10.1

8.7

6.9

12.7


Кодирование

LiveCodeBench v6

🥇67.4

60.3

53.4

63.8


Агент

TAU1-Retail

🥇70.4

58.7

40.9

54.8


SWE-Bench Verified

🥇47

39.7

23.4

60.7


Длинный Контекст

RULER (128K)

🥇94.6

94.5

77.5

78.7




Сценарии Применения в Реальном Мире

Как работает Бюджет Мышления на практике? Когда вы устанавливаете бюджет мышления, модель работает с полной прозрачностью. Вот пример, когда бюджет мышления установлен на 512: во время процесса рассуждений модель периодически запускает саморефлексию для оценки потребленного и оставшегося бюджета и предоставляет окончательный ответ, когда бюджет исчерпан или рассуждение заканчивается.

<seed:think>
Got it, let's try to solve this problem step by step. The problem says ... ...
<seed:cot_budget_reflect>I have used 129 tokens, and there are 383 tokens remaining for use.</seed:cot_budget_reflect>
Using the power rule, ... ...
<seed:cot_budget_reflect>I have used 258 tokens, and there are 254 tokens remaining for use.</seed:cot_budget_reflect>
Alternatively, remember that ... ...
<seed:cot_budget_reflect>I have used 393 tokens, and there are 119 tokens remaining for use.</seed:cot_budget_reflect>
Because if ... ...
<seed:cot_budget_reflect>I have exhausted my token budget, and now I will start answering the question.</seed:cot_budget_reflect>
</seed:think>
To solve the problem, we start by using the properties of logarithms to simplify the given equations: (full answer omitted)


Эти контролируемые рассуждения в сочетании с продвинутыми агентными возможностями открывают мощные случаи использования:

  • Адаптивная поддержка клиентов:

    Масштабируйте рассуждения AI в зависимости от сложности запроса: мгновенные ответы на часто задаваемые вопросы, глубокий анализ технических проблем. Контролируйте затраты, сохраняя качество услуг в простых и сложных взаимодействиях с клиентами.


  • Интеллект документооборота для предприятий:

    Поддержка извлечения и анализа информации из длинных документов, таких как руководства по соблюдению стандартов, пакеты контрактов или нормативные базы. Работайте с несколькими связанными документами, сохраняя связность контекста.


  • Умные рабочие потоки разработки:

    Быстрая проверка синтаксиса с нулевым бюджетом на размышления, всесторонний обзор архитектуры с полной мощью рассуждений. Обрабатывайте целую базу кода за одну сессию, вместо изолированных фрагментов кода.


  • Глобальные операции:

    Развертывайте поддерживающую AI помощь в международных рынках с нативными многоязычными возможностями. Поддержка исследований между юрисдикциями, культурной адаптации и анализа региональных рынков в рамках объединенных рабочих потоков.


Вне зависимости от того, оптимизируете вы эффективность поддержки клиентов, обрабатываете массивные библиотеки документов, упрощаете рабочие процессы разработки, или масштабируете глобальные операции, эта модель адаптируется к вашим специфическим потребностям, сохраняя прозрачность и предсказуемость затрат.


Начните Немедленно

  1. Изучите: Попробуйте Seed-OSS-36B-Instruct в SiliconFlow playground.

  2. Интегрируйте: Используйте наш API, совместимый с OpenAI. Ознакомьтесь с полными спецификациями API в документации SiliconFlow API.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "ByteDance-Seed/Seed-OSS-36B-Instruct",
    "messages": [
        {
            "role": "user",
            "content": "tell me a story"
        }
    ]
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

Начните создавать с Seed-OSS-36B-Instruct на SiliconFlow сегодня - получите точный контроль AI и оптимизируйте расходы разумно!

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Готовы ускорить ваше развитие ИИ?

Russian (Russia)
Russian (Russia)
Russian (Russia)