Команда Baidu ERNIE объявила о выпуске ERNIE-4.5-300B-A47B, мощной модели языка с открытым исходным кодом, теперь доступной на платформе SiliconFlow.
Основанная на архитектуре Mixture-of-Experts (MoE), модель имеет 300B общих параметров с 47B активированных параметров на token. Она обеспечивает сильную производительность в различных областях, включая математическое умозаключение, точные вычисления и генерацию кода, что делает ее особенно подходящей для приложений в математических вычислениях и задачах, связанных с программированием.
SiliconFlow предлагает:
Ускорение Inference: Оптимизировано для более низкой задержки и высокой пропускной способности.
Расширенный Контекст: Окно контекста на 128K token.
Ценовая Оптимизация: $0.29/M token (вход) и $1.15/M token (выход).
Технические Особенности
Сильные возможности ERNIE-4.5-300B-A47B в следовании инструкциям и использовании знаний в одноразовых, многоразовых и многоязычных сценариях могут быть объяснены единой системой поощрений, которая включает тщательно разработанные механизмы вознаграждений, направляющие модель в лучшей интерпретации и соблюдении разных пользовательских инструкций и внутренних знаний.
Быстрый Старт
Попробуйте модель ERNIE-4.5-300B-A47B прямо на SiliconFlow Playground.
Быстрый Доступ к API
Следующий пример на Python демонстрирует, как вызвать модель ERNIE-4.5-300B-A47B с использованием API-эндпоинта SiliconFlow. Для получения дополнительных характеристик, пожалуйста, обратитесь к dokumentatsii API SiliconFlow.
from openai import OpenAI
url = 'https://api.siliconflow.com/v1/'
api_key = 'your_api_key'
client = OpenAI(
base_url=url,
api_key=api_key
)
content = ""
reasoning_content = ""
messages = [
{"role": "user", "content": "Explain the concept of gravitational waves in Chinese?"}
]
response = client.chat.completions.create(
model="baidu/ERNIE-4.5-300B-A47B",
messages=messages,
stream=True,
max_tokens=4096,
extra_body={
"thinking_budget": 1024
}
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
if chunk.choices[0].delta.reasoning_content:
reasoning_content += chunk.choices[0].delta.reasoning_content
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
model="baidu/ERNIE-4.5-300B-A47B",
messages=messages,
stream=True
)from openai import OpenAI
url = 'https://api.siliconflow.com/v1/'
api_key = 'your_api_key'
client = OpenAI(
base_url=url,
api_key=api_key
)
content = ""
reasoning_content = ""
messages = [
{"role": "user", "content": "Explain the concept of gravitational waves in Chinese?"}
]
response = client.chat.completions.create(
model="baidu/ERNIE-4.5-300B-A47B",
messages=messages,
stream=True,
max_tokens=4096,
extra_body={
"thinking_budget": 1024
}
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
if chunk.choices[0].delta.reasoning_content:
reasoning_content += chunk.choices[0].delta.reasoning_content
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
model="baidu/ERNIE-4.5-300B-A47B",
messages=messages,
stream=True
)from openai import OpenAI
url = 'https://api.siliconflow.com/v1/'
api_key = 'your_api_key'
client = OpenAI(
base_url=url,
api_key=api_key
)
content = ""
reasoning_content = ""
messages = [
{"role": "user", "content": "Explain the concept of gravitational waves in Chinese?"}
]
response = client.chat.completions.create(
model="baidu/ERNIE-4.5-300B-A47B",
messages=messages,
stream=True,
max_tokens=4096,
extra_body={
"thinking_budget": 1024
}
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
if chunk.choices[0].delta.reasoning_content:
reasoning_content += chunk.choices[0].delta.reasoning_content
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
model="baidu/ERNIE-4.5-300B-A47B",
messages=messages,
stream=True
)ERNIE-4.5-300B-A47B является оптимальным выбором для разработчиков и исследователей, стремящихся к передовым возможностям понимания и генерации естественного языка. Благодаря своей высокой производительности в обобщении, логике и задачах кодирования, модель отлично подходит для создания интеллектуальных приложений и исследования инновационных вариантов использования. Она позволяет командам быстро развертывать готовые к производству решения с передовыми языковыми возможностями.
Начните создавать с ERNIE-4.5-300B-A47B сегодня на SiliconFlow!