关于Ring-flash-2.0
Ring-flash-2.0 是一种高性能的思维模型,基于 Ling-flash-2.0-base 深度优化。它是一个专家混合模型 (MoE),总共有100B参数,但每次推理仅激活6.1B。该模型利用自主开发的“icepop”算法解决了强化学习 (RL) 中 MoE LLMs 的训练不稳定性挑战,能够在延长的 RL 训练周期中不断提升其复杂的推理能力。Ring-flash-2.0 在包括数学竞赛、代码生成和逻辑推理在内的挑战性基准上显示出显著的突破。其性能超越了40B参数以下的 SOTA 密集模型,并与更大的开放权重 MoE 模型和闭源高性能思维模型 API 相匹敌。更令人惊讶的是,尽管 Ring-flash-2.0 主要设计用于复杂推理,它在创意写作方面也表现出强大的能力。得益于其高效的架构,它实现了高速推理,大大降低了高并发场景中思维模型的推理成本。
Ring-flash-2.0,一个高性能 MoE 思维模型,擅长于复杂的数学、代码和逻辑推理。通过其高效的架构和“冰淇”算法,在快速且降低成本的情况下实现问题解决和创新生成的突破。
科学发现加速
通过分析复杂数据集、生成和验证证明,以及利用高级推理起草技术文件来加速研究。
用例示例:
"通过对大规模基因组和蛋白质组数据的推理,帮助生物信息团队识别出新的蛋白质药物相互作用,大大加快了药物候选筛选。"
高级代码分析
分析整个代码库以准确找到细微的逻辑错误,识别安全漏洞,并根据深厚的算法理解建议性能优化。
用例示例:
"检测出分布式 Go 微服务中的关键竞争条件,提供了一个精确的修复方案,提高了系统在高负载下的稳定性和吞吐量。"
智能财务洞察
对财务报告和市场数据进行多步骤定量分析,推断因果关系并生成详细的战略建议。
用例示例:
"通过分析市场波动、地缘政治因素和公司财务状况,对新的投资组合进行全面风险评估,为投资组合经理提供可操作的洞察。"
主动式系统审计
通过推理逻辑依赖关系对复杂系统如法规文件或工程设计进行审计,识别不一致之处并标记潜在问题。
用例示例:
"审查大量 IoT 设备固件以确保符合行业安全标准,识别出若干潜在漏洞,并在部署前建议缓解策略。"
增强的写作创意
利用先进的语言理解和想象力推理生成多样化且高质量的创意内容,从引人入胜的叙述和脚本到市场文案。
用例示例:
"创作了一个多章节的奇幻小说纲要,包含角色弧线和情节转折,展示了对叙述结构和创意写作的深刻理解。"
元数据
规格
州
Deprecated
建筑
MoE architecture
校准的
是
专家混合
是
总参数
100B
激活的参数
6.1B
推理
不
精度
FP8
上下文长度
131K
最大输出长度
131K
与其他模型进行比较
看看这个模型与其他模型相比表现如何。

inclusionAI
chat
Ling-flash-2.0
发行日期:2025年9月18日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

inclusionAI
chat
Ling-mini-2.0
发行日期:2025年9月10日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.07
/ M Tokens
Output:
$
0.28
/ M Tokens

inclusionAI
chat
Ring-flash-2.0
发行日期:2025年9月29日
上下文长度:
131K
最大输出长度:
131K
Input:
$
0.14
/ M Tokens
Output:
$
0.57
/ M Tokens

inclusionAI
chat
Ling-1T
发行日期:2025年10月11日
上下文长度:
131K
最大输出长度:
Input:
$
0.57
/ M Tokens
Output:
$
2.28
/ M Tokens

inclusionAI
chat
Ring-1T
发行日期:2025年10月14日
上下文长度:
131K
最大输出长度:
Input:
$
0.57
/ M Tokens
Output:
$
2.28
/ M Tokens
