최신식

AI 모델 라이브러리

하나의 API로 200개 이상의 최첨단 AI Models에서 Inference를 실행하고 몇 초 만에 배포할 수 있습니다

최신식

AI 모델 라이브러리

하나의 API로 200개 이상의 최첨단 AI Models에서 Inference를 실행하고 몇 초 만에 배포할 수 있습니다

최신식

AI 모델 라이브러리

하나의 API로 200개 이상의 최첨단 AI Models에서 Inference를 실행하고 몇 초 만에 배포할 수 있습니다

Tencent

Text Generation

Hunyuan-MT-7B

출시일: 2025. 9. 18.

훈위안 번역 모델은 번역 Model인 Hunyuan-MT-7B와 앙상블 Model인 Hunyuan-MT-Chimera로 구성됩니다. Hunyuan-MT-7B는 70억 개의 파라미터를 가진 경량 번역 Model로, 소스 Text를 목표 언어로 번역하는 데 사용됩니다. 이 Model은 중국의 5개 소수 민족 언어를 포함한 33개 언어 간의 상호 번역을 지원합니다. WMT25 기계 번역 대회에서는 31개 언어 범주 중 30개에서 1위를 차지하여 뛰어난 번역 역량을 입증했습니다. 번역 작업을 위해 텐센트 훈위안은 사전 학습, 감독된 Fine-tuning, 번역 강화, 앙상블 정제를 포괄하는 종합 교육 프레임워크를 제안하여 유사한 규모의 모델 중 최첨단 성능을 달성했습니다. 이 Model은 계산 효율이 높고 배포가 쉬워 다양한 응용 시나리오에 적합합니다....

Total Context:

33K

Max output:

33K

Input:

$

0.0

/ M Tokens

Output:

$

0.0

/ M Tokens

Tencent

Text Generation

Hunyuan-A13B-Instruct

출시일: 2025. 6. 30.

Hunyuan-A13B-Instruct는 80B 매개변수 중 단 13B만 활성화하면서도 주류 벤치마크에서 더 큰 LLM과 맞먹습니다. 이는 하이브리드 추론을 제공합니다: 저지연 “빠른” 모드 또는 고정밀 “느린” 모드, 호출당 전환 가능합니다. 네이티브 256 K-token 컨텍스트는 책 길이의 문서를 열화 없이 소화할 수 있게 해줍니다. 에이전트 기술은 BFCL-v3, τ-Bench 및 C3-Bench 리더십에 맞춰 조정되어 있으며, 이를 훌륭한 자율형 어시스턴트 백본으로 만듭니다. 그룹화된 쿼리 주의력 및 다형식 양자화는 메모리 부담이 적고 GPU 효율적인 Inference를 위해 실사용 배포 시 지원하며, 내장된 다국어 지원과 견고한 안전 정렬로 기업급 애플리케이션에 적합합니다....

Total Context:

131K

Max output:

131K

Input:

$

0.14

/ M Tokens

Output:

$

0.57

/ M Tokens

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow