阶跃星辰(StepFun)称其 Step 3.7 Flash 在与 DeepSeek V4-Flash 的物理编程测试中全面胜出。测试要求在不使用库的情况下,生成一个包含高尔顿板、旋转六边形弹球和同步节拍器三个场景的自包含 HTML5 canvas 动画,并实现真实物理。Step 3.7 Flash 输出 59.6k tokens(耗时 9分57秒),DeepSeek V4-Flash 输出 52.5k tokens(耗时 6分21秒)。尽管 DeepSeek 更快,但 StepFun 模型在物理模拟、视觉效果和逻辑渲染上均占优。主推文指出 Step 3.7 Flash 专为真实世界 agentic 编码任务设计,能保持复杂输出中逻辑、视觉和执行的一致性。
Great demo by @atomic_chat_hq.
Step 3.7 Flash was designed for real-world agentic coding tasks - not just generating code fast, but keeping logic, visuals, and execution coherent across complex outputs.
Love seeing builders test it in creative ways!