Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507

Qwen/Qwen3-235B-A22B-Thinking-2507

정보에 대해서Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507은 Alibaba의 Qwen 팀이 개발한 Qwen3 대형 언어 모델 시리즈의 일원으로, 고도로 복잡한 추론 작업에 특화되어 있습니다. 이 Model은 혼합 전문가(MoE) 아키텍처에 기반하여 총 2350억 개의 매개변수와 토큰당 약 220억 개의 활성화된 매개변수를 가지고 있으며, 계산 효율성을 향상시키면서 강력한 성능을 유지합니다. 전용 'thinking' Model로서 논리적 추론, 수학, 과학, 코딩 및 학술 기준과 같은 인간 전문 지식이 요구되는 작업에서 크게 향상된 성능을 입증하여 오픈 소스 thinking Model 중 최첨단 결과를 달성합니다. 게다가, 이 Model은 지침 준수, 도구 사용 및 Text 생성과 같은 향상된 일반 기능을 제공하며, 256K의 긴 컨텍스트 이해 기능을 본래 지원하여 깊은 추론과 긴 문서 처리가 필요한 시나리오에 이상적입니다.

사용 가능한 Serverless

쿼리를 즉시 실행하고 사용한 만큼만 지불하세요.

$

0.13

/

$

0.6

1M 토큰당 (Input/Output)

메타데이터

생성하다

2025. 7. 28.

라이센스

APACHE-2.0

공급자

Qwen

사양

Available

건축

교정된

전문가의 혼합

총 매개변수

235B

활성화된 매개변수

22B

추론

아니요

Precision

FP8

콘텍스트 길이

262K

Max Tokens

262K

지원됨 기능

Serverless

지원됨

Serverless LoRA

지원하지 않음

Fine-tuning

지원하지 않음

Embedding

지원하지 않음

Rerankers

지원하지 않음

지원 Image Input

지원하지 않음

JSON Mode

지원됨

구조화된 Outputs

지원하지 않음

도구

지원됨

Fim Completion

지원하지 않음

Chat Prefix Completion

지원됨

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow

Korean

© 2025 SiliconFlow