모델

제품

가격

문서

블로그

에 대하여

연락하다

🎉 LongCat-2.0 는 SiliconFlow에서 가능합니다. 지금 시도해 보세요.

🎉 LongCat-2.0 는 SiliconFlow에서 가능합니다. 지금 시도해 보세요.

모델

Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct

API 참조

정보에 대해서Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct는 Alibaba의 Qwen 팀이 출시한 차세대 기초 Model입니다. 이는 궁극의 훈련 및 Inference 효율성을 위해 설계된 새로운 Qwen3-Next 아키텍처를 기반으로 구축되었습니다. 이 Model은 하이브리드 어텐션 메커니즘(게이트 델타넷과 게이트 어텐션), 고희소 혼합 전문가(MoE) 구조 및 다양한 안정성 최적화와 같은 혁신적인 기능을 통합하고 있습니다. 800억 개의 매개변수를 가진 희소 Model로서, Inference 과정에서 token당 약 30억 개의 매개변수만 활성화되어 계산 비용을 크게 절감하고 32K tokens를 초과하는 장문 작업에서 Qwen3-32B Model보다 10배 이상의 처리량을 제공합니다. 이는 범용 작업에 최적화된 인스트럭션 튜닝 버전이며 '사고' 모드를 지원하지 않습니다. 성능 측면에서 일부 벤치마크에서 Qwen의 플래그십 Model인 Qwen3-235B와 비교할 수 있으며, 초장문 시나리오에서 상당한 장점을 보여줍니다.

사용 사례

Qwen3-Next-80B-A3B-Instruct의 초장문맥 및 효율적인 추론이 복잡하고 대규모의 문제를 해결하는 방법을 탐구하십시오.

초장문서 합성

법률 서류, 연구 논문, 역사적 기록물 등과 같은 방대한 문서에서 1M token 문맥을 활용하여 통찰력을 처리하고 합성합니다.

사용 사례 예시:

"법률 팀이 사용하여 5000페이지의 디스커버리 문서를 분석하고 핵심 주장을 추출하며 관련 판례를 몇 분 만에 식별합니다."

대규모 코드베이스 분석

수백만 라인의 코드에서 아키텍처 패턴, 종속성 및 리팩토링 기회를 식별하여 방대한 코드베이스를 이해하고 최적화합니다.

사용 사례 예시:

"엔지니어링 회사가 레거시 Python 애플리케이션을 리팩토링하기 위해 고용하여 모듈 상호작용을 매핑하고 중요 데이터 파이프라인의 성능 향상을 제안합니다."

고급 금융 시장 정보

실시간 및 역사적 금융 데이터, 뉴스 및 경제 보고서를 광범위하게 분석하여 시장 동향을 예측하고 복잡한 거래 전략을 수립합니다.

사용 사례 예시:

"금융 분석가는 글로벌 시장 데이터 및 뉴스 기사를 10년간 처리하여 새로운 알고리즘 거래 전략을 위한 미세한 상관관계를 식별합니다."

포괄적인 규제 준수

운영 데이터에 대한 복잡한 규제 프레임워크 및 내부 정책의 감사를 자동화하여 준수를 보장하고 위험을 식별합니다.

사용 사례 예시:

"의료 제공자가 HIPAA 규정과 환자 데이터 처리를 교차 참조하여 잠재적인 개인정보 침해를 표시하고 정책 업데이트를 제안합니다."

과학적 발견 가속화

방대한 과학 문헌 및 실험 데이터를 분석하여 가설을 생성하고, 실험을 설계하고, 결과를 검증하여 연구를 가속화합니다.

사용 사례 예시:

"재료 과학 연구자가 수천 건의 저널 기사와 실험 결과를 조사하여 원하는 특성을 가진 새로운 합금 조성을 제안합니다."

메타데이터

생성하다

2025. 9. 18.

라이센스

APACHE-2.0

공급자

Qwen

허깅페이스

Qwen3-Next-80B-A3B-Instruct

사양

주

Deprecated

건축

Hybrid Attention MoE

교정된

아니요

전문가의 혼합

네

총 매개변수

80B

활성화된 매개변수

3B

추론

아니요

Precision

FP8

콘텍스트 길이

262K

Max Tokens

262K

다른 모델과 비교

이 Model이 다른 것들과 어떻게 비교되는지 보세요.

Qwen

chat

Qwen3-VL-32B-Instruct

출시일: 2025. 10. 21.

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

0.6

/ M Tokens

Qwen

chat

Qwen3-VL-32B-Thinking

출시일: 2025. 10. 21.

Total Context:

262K

Max output:

262K

Input:

$

0.2

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Instruct

출시일: 2025. 10. 15.

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

0.68

/ M Tokens

Qwen

chat

Qwen3-VL-8B-Thinking

출시일: 2025. 10. 15.

Total Context:

262K

Max output:

262K

Input:

$

0.18

/ M Tokens

Output:

$

2.0

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Instruct

출시일: 2025. 10. 4.

Total Context:

262K

Max output:

262K

Input:

$

0.3

/ M Tokens

Output:

$

1.5

/ M Tokens

Qwen

chat

Qwen3-VL-235B-A22B-Thinking

출시일: 2025. 10. 4.

Total Context:

262K

Max output:

262K

Input:

$

0.45

/ M Tokens

Output:

$

3.5

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Instruct

출시일: 2025. 10. 5.

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

chat

Qwen3-VL-30B-A3B-Thinking

출시일: 2025. 10. 11.

Total Context:

262K

Max output:

262K

Input:

$

0.29

/ M Tokens

Output:

$

1.0

/ M Tokens

Qwen

image-to-video

Wan2.2-I2V-A14B

출시일: 2025. 8. 13.

$

0.29

/ Video

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

AI 개발을 가속화할 준비가 되셨나요?

페이지

모델

제품

© 2025 SiliconFlow

·

개인정보 보호

페이지

모델

제품

© 2025 SiliconFlow

·

개인정보 보호

페이지

모델

제품

© 2025 SiliconFlow

·

개인정보 보호