5月29日,上海大模子独角兽企业阶跃星辰(StepFun)发布并开源了Step 3.7 Flash模子。距上一代Step 3.5 Flash发布仅三个多月,基座模子的迭代节律之快可见一斑。
在大模子行业,“Flash”时时意味着轻量、快速且低资本。阶跃星辰通顺两代基座模子均主打Flash版块,由此可见,阶跃星辰正在走一条有别于单纯追求参数限制的互异化阶梯。
据阶跃星辰研发团队先容,Step 3.7 Flash专为分娩级智能体场景打造,旨在速率、资本、可靠实践与复杂任务搞定智商之间罢了更优均衡。
记者获悉,该模子禁受寥落 MoE(夹杂群众)架构,总参数目为1960亿,其中视觉模块参数18 亿,激活参数仅110 亿,最高生成速率可达每秒400 词元,尤其相宜高频、多轮的智能体利用场景,能显耀擢升任务完生着力。
相较于千问、DeepSeek最新模子超1.6万亿参数,Step 3.7 Flash总参数目仅为格外之一。但小参数不就是智商低,Step 3.7 Flash特殊针对智能体的中枢需求,重心优化多项环节智商,比如原生多模态交融与实践、联网与视觉搜索增强、高可靠器具调用与编排,以及智能体生态兼容适配,罢了了“以小博大”的按捺。
博亚体育app中国官网入口
基准测试泄露,Step 3.7 Flash智商与旗舰模子差距并不显著。
刻下,Kaiyun中国大陆官方网站入口智能体正从演示阶段快速迈向真确的企业分娩环境,这对基础模子建议了全新条目,不单追求峰值智能,更要罢了可限制化落地的高效智能。这意味着模子不仅要回话问题,还要交融复杂输入、主动检索信息、沉稳调用器具,并在多轮长程任务中保握实践一致性。
具体而言,Step 3.7 Flash大致径直搞定用户界面、图表、文档、图片等各样利用,将复杂视觉信息飘浮为结构化按捺和可实践任务,并在信息不充分时主动发起搜索进行交叉考据。
在分娩级智能体最中枢的器具调用可靠性方面,Step 3.7 Flash进行了针对性优化,可在长程多轮责任流中沉稳调用API(第三方利用接口)、浏览器、终局、办公等器具,显耀镌汰实践偏离和任务失败的风险。
基准测试泄露,Step 3.7 Flash在多项复杂视觉任务评测中展现出忘形更大限制旗舰模子的智商水平,在多轮智能体责任流中的任务轨迹一致性进展尤为凸起。
此外,阶跃星辰还对主流Agent框架和器具调用公约进行了兼容优化,模子可沉稳接入Claude Code、OpenClaw、Hermes Agent等主流编程与智能体器具,并支握云霄与腹地部署,镌汰配置者接入及责任流编排资本。
跟着百行万企加快鞭策智能体落地,Step 3.7 Flash的贪图理念也折射出“Flash”版块模子的脚色调度,正从单纯的轻量替代品Kaiyun中国大陆官方网站入口,冉冉演进为复古分娩级智能体限制化运转的基础神气。