MiniMax-M1-80k(456B), первый в мире гибридный open-source attention model в масштабе, теперь доступен на SiliconFlow.
Поддержка 128K контекста
Конкурентоспособная цена: $0.58/M tokens (Input), $2.29/M tokens (Output)
Создан с использованием новейшей архитектуры Mixture-of-Experts (MoE) и Lightning Attention, MiniMax-M1-80k достигает передовых результатов в области долгосрочного логического мышления, задач программирования и многоступенчатого использования инструментов.
Гибридный Attention + MoE Архитектура M1 интегрирует эффективность маршрутизации Mixture-of-Experts с глубиной Lightning Attention, позволяя ему масштабироваться, сохраняя качество рассуждений о длинных последовательностях.
Оптимизировано для агентов и инструментов С поддержкой расширенного контекста и сильными логическими рассуждениями, M1 идеально подходит для приложений, таких как автономные агенты, анализ документов и разработка программного обеспечения в песочнице.
Математика, кодирование и логические рассуждения Бенчмарки показывают, что M1 конкурентоспособен с моделями высшего уровня в задачах, требующих символического мышления, структурированного Output и сложной следования инструкциям.
Быстрый старт
Попробуйте модель MiniMax-M1-80k на Playground SiliconFlow.
Быстрый доступ к API
Следующий пример на Python демонстрирует, как вызвать модель MiniMax-M1-80k через API-эндпоинт SiliconFlow. Более подробная спецификация API для разработчиков.
from openai import OpenAI
url = 'https://api.siliconflow.com/v1/'
api_key = 'your api_key'
client = OpenAI(
base_url=url,
api_key=api_key
)
content = ""
reasoning_content = ""
messages = [
{"role": "user", "content": "Who are the legendary athletes of the Olympics?"}
]
response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M1-80k",
messages=messages,
stream=True,
max_tokens=4096,
extra_body={
"thinking_budget": 1024
}
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
if chunk.choices[0].delta.reasoning_content:
reasoning_content += chunk.choices[0].delta.reasoning_content
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M1-80k",
messages=messages,
stream=True
)from openai import OpenAI
url = 'https://api.siliconflow.com/v1/'
api_key = 'your api_key'
client = OpenAI(
base_url=url,
api_key=api_key
)
content = ""
reasoning_content = ""
messages = [
{"role": "user", "content": "Who are the legendary athletes of the Olympics?"}
]
response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M1-80k",
messages=messages,
stream=True,
max_tokens=4096,
extra_body={
"thinking_budget": 1024
}
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
if chunk.choices[0].delta.reasoning_content:
reasoning_content += chunk.choices[0].delta.reasoning_content
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M1-80k",
messages=messages,
stream=True
)from openai import OpenAI
url = 'https://api.siliconflow.com/v1/'
api_key = 'your api_key'
client = OpenAI(
base_url=url,
api_key=api_key
)
content = ""
reasoning_content = ""
messages = [
{"role": "user", "content": "Who are the legendary athletes of the Olympics?"}
]
response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M1-80k",
messages=messages,
stream=True,
max_tokens=4096,
extra_body={
"thinking_budget": 1024
}
)
for chunk in response:
if chunk.choices[0].delta.content:
content += chunk.choices[0].delta.content
if chunk.choices[0].delta.reasoning_content:
reasoning_content += chunk.choices[0].delta.reasoning_content
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
model="MiniMaxAI/MiniMax-M1-80k",
messages=messages,
stream=True
)MiniMax-M1-80k предлагает уникальный баланс масштаба, эффективности и силы рассуждений, созданный для разработчиков, преодолевающих границы генеративного AI. Создаете ли вы долгосрочные помощники, интеллектуальных агентов или передовых кодер-копилотов — M1 готов.
Теперь идите и строите что-то необычное с MiniMax-M1-80k на SiliconFlow.