Kimi K2.5 이제 SiliconFlow에서: 시각적 에이전트 지능의 SOTA

2026. 2. 4.

요약: Kimi K2.5이 이제 SiliconFlow에서 사용할 수 있습니다. 현재까지 가장 강력한 오픈 소스 Model로서, 최첨단 코딩 및 Vision 기능을 자율 Agent Swarm 아키텍처와 결합하여 최대 100개의 하위 Agent와 1,500번의 도구 호출을 조정할 수 있습니다. 이는 단일 에이전트 실행에 비해 최대 4.5배 속도 향상이라는 결과를 가져옵니다. K2.5는 여러 기능을 통해 비전과 코딩을 결합하여 실질적인 사무 생산성 시나리오에서 강력한 성능을 제공합니다. SiliconFlow의 API로 시작하여 최첨단 시각적 에이전트 지능을 프로덕션에 도입하세요.

저희는 전 세계 개발자들에게 시각적 에이전트 지능의 새로운 시대를 열게 되어 Kimi K2.5를 SiliconFlow에 도입하게 되어 매우 기쁩니다. 약 15T의 혼합 시각 및 Text tokens를 통해 지속적인 사전 훈련을 통해 구축된 Kimi K2.5는 고유의 Multimodal Model로 최첨단 코딩 및 Vision 기능을 제공 합니다. K2.5는 또한 미리 정의된 역할이나 직접 설계된 워크플로 없이 최대 100개의 전문 하위 Agent가 병렬 워크플로를 1,500단계까지 조정할 수 있는 자율 에이전트 스웜 패러다임을 도입합니다.

이제 SiliconFlow의 Kimi K2.5 API를 통해 다음을 기대할 수 있습니다:

경쟁력 있는 가격: Kimi K2.5: 100만 tokens당 수입 0.55$ 및 100만 tokens당 출력 3.0$
262K 컨텍스트 윈도우: 긴 문서, 복잡한 대화 및 시각적 Input이 풍부한 확장된 멀티 에이전트 워크플로를 처리합니다.
원활한 통합: SiliconFlow의 OpenAI 호환 API를 통해 즉시 배포하거나 Claude Code, Kilo Code, Roo Code, OpenClaw 등과 원활하게 통합하세요.

시각적 프롬프트에서 상호작용하는 프론트 엔드를 구축하든, 병렬 Agent 실행을 통해 복잡한 연구를 수행하든, 전문 수준의 문서 및 프리젠테이션을 생성하기 위해 사무 워크플로를 자동화하든, SiliconFlow의 Kimi K2.5 API는 필요한 성능을 제공합니다.

이후 섹션에서는 K2.5의 주요 기능을 분류하고, SiliconFlow의 API를 통해 실세계 작업에서의 성능을 보여주고, 워크플로의 성능을 극대화하기 위한 구성 팁을 제공합니다.

K2.5의 새로운 점

단일 스크린샷에서 웹 사이트를 재구성하고, 자연 대화를 통해 코드를 개선하며, 디자인 목업을 애니메이션이 적용된 프로덕션 준비 상태의 React 컴포넌트로 전환하는 방법을 보여줍니다. 시장 분석을 수행할 때는 1,500단계로 조정된 단계를 실행하는 100명의 전문 연구원을 조정할 수 있습니다.

이번에는 K2.5가 세 가지 기본 기능을 제공합니다:

원주형 Multimodality

K2.5는 시각적 지식, 교차 모달 추론 및 시각적 Input에 기반한 에이전트 도구 사용에 탁월합니다. 이는 훈련에서의 기본 통찰력에 기인한 것입니다: 확장 시, Vision과 Text는 경쟁하지 않고 서로를 강화합니다. 15T의 시각 언어 tokens로 처음부터 사전 훈련하여 K2.5는 하나의 통합된 기술로 보는 것과 코딩을 배우게 됩니다.

Vision과 함께 코딩하기

Image를 단순히 "보는" 것이 아니라, 시각적 Input을 통해 논리적인 취지 하에 프로덕션 준비 상태의 코드로 직접 변환합니다. 지금까지의 가장 강력한 오픈 소스 Model로서, K2.5는 특히 프론트 엔드 개발에서 탁월합니다. UI 스크린샷을 보여주면 레이아웃 문제를 디버깅하거나 디자인 목업을 업로드하여 애니메이션과 반응형 레이아웃을 갖춘 상호작용하는 React 컴포넌트를 생성합니다. 이는 개발자가 상상의 의도를 표현하는 방식을 근본적으로 변화시키며, 그렇게 하기 위한 장벽을 낮춥니다: 세부 사양을 작성하는 대신, 시각적으로 K2.5에 원하는 것을 보여줄 수 있습니다.

프롬프트: 안녕, Zara 웹사이트의 전체적인 분위기가 정말 마음에 들어(첨부된 스크린샷) - 깨끗하고 미니멀한 모습과 멋진 타이포그래피 그리고 부드러운 애니메이션. 한편으로는, 내 디자인 작품을 위한 포트폴리오 웹사이트를 만들고 싶어. 유사한 스타일로 무언가를 만들 수 있을지 도와줄 수 있어? 또한, 정말 중요한 건 레이아웃이 겹치지 않고 모든 요소가 깔끔하게 보일 때 완전 기능해야 한다는 것. 사이트를 열었을 때 깨끗하게 보였으면 좋겠어.

에이전트 스웜

K2.5는 단일 에이전트 확장에서 자율 조정 에이전트 스웜으로 전환하여 복잡한 작업을 병렬 하위 작업으로 분해하여 전문 에이전트가 실행합니다.

작동 방식은 다음과 같습니다: K2.5에게 100개의 전문 분야를 아우르는 상위 세 명의 YouTuber를 식별하도록 요청합니다. 오케스트레이터는 먼저 이러한 다양한 도메인을 연구하고 정의합니다. 여기에는 계산 언어학에서 양자 화학에 이르기까지 모든 것이 포함됩니다. 그런 다음 특정 분야를 연구하는 작업을 맡은 100명의 전문 하위 에이전트가 생성됩니다. 이 Agent들은 병렬로 작동하여 데이터를 독립적으로 수집하고 콘텐츠 제작자를 분석합니다. 그 결과는 무엇일까요? 단일 Agent가 걸렸을 시간의 극히 일부만에 300개의 포괄적인 유튜버 프로필과 통합 보고서를 제공합니다.

Moonshot AI의 내부 평가에 따르면, K2.5 에이전트 스웜은 엔드 투 엔드 런타임을 80% 줄이면서 더 복잡하고 긴 전망의 워크로드를 가능하게 합니다. 아래에 표시된 바와 같이.

벤치마크 성능

Kimi K2.5는 #1 에이전트 벤치마크에 이름을 올렸으며 다른 주요 카테고리에서 최첨단 수준의 성능을 달성하여 GPT-5.2, Claude 4.5 Opus, 및 Gemini 3.0 Pro와 같은 등급에 위치합니다. 이러한 포괄적인 기능은 다양한 워크플로를 위한 프로덕션 배포 준비를 갖추도록 합니다:

카테고리	벤치마크	Kimi K2.5	GPT-5.2 (xhigh)	Claude 4.5 Opus (extended thinking)	Gemini 3 pro (고수준 사고)
Agent	HLE-전체	🥇50.2	45.5	43.2	45.8
	BrowseComp	🥇74.9	65.8	57.8	59.2
	DeepSearchQA	🥇77.1	71.3	76.1	63.2
코딩	SWE-Bench Verified	76.8	80	80.9	76.2
	SWE-Bench 다국어	73	72	77.5	65
Image	MMMU Pro	78.5	79.5	74	81
	MathVision	84.2	83	77.1	86.1
	OmniDocBench 1.5	🥇88.8	85.7	87.7	88.5
Video	VideoMMMU	86.6	85.9	84.4	87.6
	LongVideoBench	🥇79.8	76.5	67.2	77.7

출시 이후, Kimi K2.5는 다른 평가 영역에서도 주목을 받았습니다:

OSWorld (에이전트 실행): 63.3%의 성공률로 #1에 랭크되었으며, Claude Sonnet 4.5 (62.9%) 및 Seed-1.8 (61.9%)를 초과하여 실제 컴퓨터 환경 작업을 수행합니다.
DesignArena (UI 생성): 모든 Model 중 최고인 1349점을 기록했으며, Gemini 3 Pro, Claude Opus 4.5, 및 GLM-4.7을 초과합니다. K2.5는 3D 디자인, 웹 사이트 생성, 및 SVG 생성 작업에서 특히 뛰어납니다.
Vision Arena (Multimodal): 오픈 소스 Model 중 #1에 랭크되며 전체적으로는 1249점을 기록하여 GPT-5.1 (1238)을 초과하여 시각적 Input을 이해하고 처리하는데 앞서갑니다.

K2.5를 즐겨 쓰는 도구에 활용하기

Kimi K2.5는 이제 SiliconFlow에서 사용할 수 있습니다. 다음과 같은 애플리케이션을 통해 개발 워크플로에 통합하세요:

Kilo Code/Claude Code/Cline/Roo Code/ OpenClaw/SillyTavern/Kimi Code/Trae 등

API 액세스 받기 →

문서 보기 →

K2.5 구성 팁

SiliconFlow에서 Kimi K2.5의 최고 성능을 발휘하기 위한 권장 설정은 다음과 같습니다:

매개변수	권장 사항	설명
인스턴트 모드: 빠른 응답, 일상 업무
enable_thinking	FALSE	더 빠른 응답을 위한 추론 과정 비활성화
temperature	0.6	일관되고 집중된 출력을 위해 최적화됨
top_p	0.95	표준 샘플링 매개변수
사고 모드: 깊은 추론, 복잡한 문제
enable_thinking	TRUE	단계별 추론 활성화
temperature	1.0	복잡한 추론을 위한 더 높은 창의성
top_p	0.95	표준 샘플링 매개변수

참고: Video Input은 현재 실험적이며 MoonShotAI의 공식 API에서만 지원됩니다.

즉시 시작하세요

탐색: Kimi K2.5를 SiliconFlow playground에서 시도하세요.
통합: OpenAI 호환 API를 사용하세요. SiliconFlow API 문서에서 전체 API 사양을 탐색하세요.

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "moonshotai/Kimi-K2.5",
    "messages": [
        {
            "role": "user",
            "content": "Tell me a story"
        }
    ],
    "stream": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)