Ling-1T现已在SiliconFlow上推出:高效推理的万亿级飞跃

2025年10月16日

目录

Ling-1T 现已上线于 SiliconFlow

简言之:Ling-1T,Ling 2.0系列中的第一个旗舰无思考模型,现在在SiliconFlow上线。为有效的万亿规模推理而构建,具有1万亿总参数,每个token大约有500亿个活跃参数,并且Evo-CoT训练用于更深入、更快速的推理。在数学代码前端任务方面提供最先进的性能,Ling-1T重新定义了精度、速度和成本效益之间的平衡。

今天就开始使用SiliconFlow的生产就绪API进行构建,该API完全兼容OpenAI/Anthropic,并准备集成到您现有的工作流程中!


今天,我们在SiliconFlow上推出Ling-1T——Ling 2.0系列中的第一个旗舰无思考模型。通过1万亿参数构建,每个token约有500亿个活跃参数,它经过优化以在复杂任务中实现高效推理。它还擅长将复杂的自然语言描述转换为可执行代码,解决比赛级别的数学问题,并生成平衡美观和功能的前端界面。更重要的是,它通过更短的推理链实现了更高的精度,这意味着更快的响应、更低的成本和更可靠的输出


利用SiliconFlow的Ling-1T API,您可以期待:


  • 有竞争力的定价:Ling-1T $0.57/M tokens(Input)和$2.28/M tokens(Output)。

  • 扩展的上下文窗口:131K上下文窗口允许您处理更长的文档并在复杂任务中保持上下文。

  • 高效的MoE架构:1万亿总参数,每个token约500亿个活跃参数,提供强大的推理能力而无需全面密集模型的计算负担。

  • Evo-CoT优化:在20万亿以上高质量、推理密集的tokens上进行预训练,通过进化链思维过程(Evo-CoT)增强多步问题解决能力。


关键特性和基准性能


推理是智能的基石。Ling-1T通过将高效推理与创造性生成相结合进一步推进,擅长于两个关键维度:


  • 审美理解和前端生成

    • 将想法转化为优雅的前端代码:Ling-1T翻译UI意图并将自然语言转换为简洁、功能性界面。

    • 代码看起来和运行效果一样好:其混合语法–功能–美学奖励系统确保每行代码平衡正确性、可用性和视觉吸引力。

    • ArtifactsBench中排名第一:Ling-1T在前端生成方面表现出色。向下滚动查看通过SiliconFlow API创建的演示。


Image


  • 万亿规模的新兴智能

    • 随智能扩展:在万亿规模中揭示出新兴的推理和迁移能力,在BFCL V3上实现约70%的工具调用准确率,调整最少。

    • 理解您的意图:精确解释复杂的自然语言指令,将意图与推理对齐,生成可靠的、目标导向的响应。

    • 连接逻辑和设计:将抽象想法或推理步骤转化为功能性视觉组件,帮助您更快地用更简洁的逻辑进行原型设计。

    • 跨平台构建:生成响应性、跨平台的前端代码,可以通过最少的调整准备部署。

    • 以风格和上下文写作:生成符合您的语调、受众和品牌标识的营销文案和多语言Text。


Image


为了确保公平和全面的评估,Ling-1T也与开源和闭源的旗舰模型进行了基准测试——包括DeepSeek-V3.1-TerminusKimi-K2-Instruct-0905GPT-5-main,和Gemini-2.5-Pro


代码生成软件开发竞赛级别数学专业数学逻辑推理方面,Ling-1T始终展现出卓越的复杂推理性能,并相较于这些领先模型表现出明显的整体优势


Image


在AIME 25基准测试中,Ling-1T扩展了推理精度与推理长度的帕累托前沿,以更少的推理步骤实现更高的精度。

对于从事复杂推理、数学分析或多步问题的开发人员而言,这意味着更快的结果和更高的精度。


Image


模型架构与训练


关键架构创新:


基于Ling 2.0架构构建并由Ling缩放定律指导,Ling-1T从头设计以实现万亿规模的效率,确保在任何规模下稳定的推理性能:


  • 1T总数/50B活跃参数,具有1/32 MoE激活比率

  • MTP层用于增强的组合推理

  • 无辅助损失Sigmoid评分专家路由零均值更新

  • QK规范化用于完全稳定的收敛


Image


训练效率:


Ling-1T利用FP8混合精度训练,使其成为以这种方式训练的已知最大基础模型。结合异质流水线优化和WSM学习率调度器,训练在保持万亿级稳定性的同时,实现了超过40%的端到端加速。


预训练:


20万亿以上的高质量tokens上进行预训练,其中超过40%专用于推理密集数据。这个基础赋予Ling-1T在逻辑、多步问题解决和复杂分析方面的天然优势。


为了进一步增强这些能力,在中期训练期间集成了精心策划的链思维数据,提高了推理稳定性和泛化能力。


Image


后训练:


Ling-1T通过高级优化继续优化其推理能力:


  • Evo-CoT(进化链思维):逐步提高推理精度和效率,以更少的计算步骤实现更逻辑的思考。

  • LPO(语言单元策略优化):在句子级别优化学习,将奖励与自然语言意义而不是token序列对齐。



立即开始


  1. 1. 探索:Ling-1T中试用SiliconFlow 模型广场

  2. 2. 集成:使用我们的OpenAI兼容API。在SiliconFlow API 文档中探索完整的API规范。


import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "inclusionAI/Ling-1T",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": True,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": [],    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())
import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "inclusionAI/Ling-1T",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": True,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": [],    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())
import requestsurl = "https://api.siliconflow.com/v1/chat/completions"payload = {    "model": "inclusionAI/Ling-1T",    "messages": [        {            "role": "user",            "content": "Tell me a story"        }    ],    "stream": True,    "max_tokens": 4096,    "enable_thinking": False,    "thinking_budget": 4096,    "min_p": 0.05,    "stop": [],    "temperature": 0.7,    "top_p": 0.7,    "top_k": 50,    "frequency_penalty": 0.5,    "n": 1,    "response_format": { "type": "text" },    "tools": [        {            "type": "function",            "function": {                "description": "<string>",                "name": "<string>",                "parameters": {},                "strict": False            }        }    ]}headers = {    "Authorization": "Bearer <token>",    "Content-Type": "application/json"}response = requests.post(url, json=payload, headers=headers)print(response.json())


今天通过SiliconFlow的生产就绪API开始使用Ling-1T进行构建——提供万亿规模的推理,具有高效性和可靠性。


商务或销售咨询 →

立即加入我们的Discord社区 →

在X上关注我们以获取最新更新 →

探索SiliconFlow上的所有可用模型 →

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?

准备好 加速您的人工智能开发吗?