SiliconFlow의 API로 ERNIE-4.5-300B-A47B를 실행하세요

2025. 7. 3.

목차

Baidu ERNIE 팀은 강력한 오픈 소스 대형 언어 모델인 ERNIE-4.5-300B-A47B의 출시를 SiliconFlow 플랫폼에서 발표했습니다.

Mixture-of-Experts (MoE) 아키텍처를 기반으로 구축된 모델은 토큰당 47B 활성화 매개변수를 포함하여 총 300B 매개변수를 특징으로 합니다. 이는 수학적 추론, 정확한 계산 및 코드 생성 등 여러 도메인에서 강력한 성능을 발휘하여 특히 수치 연산 및 프로그래밍 관련 작업에 적합합니다.

SiliconFlow가 제공합니다:

  • Inference 가속화: 더 낮은 지연 시간 및 더 높은 처리량에 최적화되었습니다.

  • 확장된 컨텍스트: 128K token 컨텍스트 창.

  • 비용 최적화 가격: $0.29/M tokens(Input) 및 $1.15/M tokens (Output).

기술적 하이라이트

ERNIE-4.5-300B-A47B의 강력한 명령어 따라가기 및 단일 턴, 다중 턴, 다국어 시나리오에서 지식을 활용하는 능력은 모델이 다양한 사용자 명령과 내부 지식을 더 잘 해석하고 따르도록 유도하는 정교하게 설계된 보상 메커니즘이 통합된 통합 보상 시스템에 기인할 수 있습니다.

빠른 시작

ERNIE-4.5-300B-A47B 모델을 SiliconFlow Playground에서 직접 사용해 보십시오.

API에 빠르게 접근하기

다음 Python 예제는 SiliconFlow의 API 엔드포인트를 사용하여 ERNIE-4.5-300B-A47B 모델을 호출하는 방법을 보여줍니다. 더 많은 사양은 SiliconFlow API 문서를 참조하십시오.

from openai import OpenAI

url = 'https://api.siliconflow.com/v1/'
api_key = 'your_api_key'

client = OpenAI(
    base_url=url,
    api_key=api_key
)

# Send a request with streaming output
content = ""
reasoning_content = ""
messages = [
    {"role": "user", "content": "Explain the concept of gravitational waves in Chinese?"}
]
response = client.chat.completions.create(
    model="baidu/ERNIE-4.5-300B-A47B",
    messages=messages,
    stream=True,  # Enable streaming output
    max_tokens=4096,
    extra_body={
        "thinking_budget": 1024
    }
)
# Gradually receive and process the response
for chunk in response:
    if chunk.choices[0].delta.content:
        content += chunk.choices[0].delta.content
    if chunk.choices[0].delta.reasoning_content:
        reasoning_content += chunk.choices[0].delta.reasoning_content

# Round 2
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "Continue"})
response = client.chat.completions.create(
    model="baidu/ERNIE-4.5-300B-A47B",
    messages=messages,
    stream=True
)

ERNIE-4.5-300B-A47B는 고급 자연언어 이해 및 생성 능력을 추구하는 개발자와 연구자에게 최적의 선택입니다. 이 모델은 일반화, 추론 및 코딩 작업에서 뛰어난 성능을 제공하여 지능형 애플리케이션을 구축하고 혁신적인 사용 사례를 탐색하는 데 적합합니다. 이는 팀이 최첨단 언어 기능을 갖춘 생산 준비 솔루션을 신속하게 배포할 수 있도록 지원합니다.

지금 SiliconFlow에서 ERNIE-4.5-300B-A47B로 빌드를 시작하세요!

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow