2025年8月21日,中国AI公司深度求索(DeepSeek)正式推出新一代大模型DeepSeek V3.1,它以混合推理架构和强大的Agent能力,标志着人工智能正式迈入“Agent时代”的新阶段。8月21日,中国人工智能领域迎来一个重要时刻。深度求索(DeepSeek)正式发布了其新一代大模型——DeepSeek V3.1。此次发布没有盛大的发布会,而是通过官方渠道静静宣布,但它在AI社区和开发者中引发了巨大反响。作为DeepSeek V3的升级版本,V3.1引入了革命性的混合推理架构,首次在生产就绪的模型中实现了思考模式与非思考模式的无缝切换。这个拥有6850亿参数的巨型模型(685B参数)。不仅在多项基准测试中表现出色,更在代码生成、软件工程和复杂问题解决方面展现出了超越前代和竞争对手的性能。同时,它还对国产芯片进行了专门优化,为中国AI生态的发展提供了新动力。
DeepSeek V3.1最显著的创新是其混合推理架构(Hybrid Reasoning Architecture),它成功将思考模式与非思考模式整合到单一模型中。这种设计允许用户根据任务复杂度,自由切换模型的“深度思考”状态。在官方App和网页端,用户只需点击“深度思考”按钮,就能激活模型的增强推理能力。通过API调用时,开发者可以选择使用“deepseek-chat”(非思考模式)或“deepseek-reasoner”(思考模式)不同端点,满足不同场景的需求。
02 性能表现:领先行业的基准
03 效率提升:思维链压缩与成本优化
表:DeepSeek V3.1与主要竞争对手的成本效益比较
DeepSeek V3.1被其开发者称为迈向“Agent时代”的第一步,这主要体现在其增强的工具使用和智能体任务能力上。
在需要多步推理的复杂搜索测试(browsecomp)中,V3.1取得了30.0%的得分,比R1-0528的8.9%提高了237%。在多学科专家级难题测试(HLE)中,V3.1在使用Python和搜索工具的情况下达到了29.8%的准确率,比前代提高了20%。
DeepSeek V3.1的一个重要意义是其对国产芯片的专门优化。模型支持UE8M0 FP8精度格式,这是为“即将发布的下一代国产芯片”量身定制的。这种优化使得V3.1能够在国产芯片上高效运行,降低了对国外硬件的依赖。
06 开源策略与API升级:开发者生态建设
此外,DeepSeek V3.1还增加对Anthropic API格式的支持,使开发者能够轻松将V3.1的能力接入Claude Code等框架。从2025年9月6日起,DeepSeek将执行新的API定价策略。输入价格调整为0.5元/百万令牌(缓存命中)和4元/百万令牌(缓存未命中),输出价格为12元/百万令牌。同时,夜间时段优惠将被取消。
DeepSeek V3.1在多个应用场景中展现出色能力。
在流程图与复杂案例测试中,V3.1能够使用Mermaid流程图展示用户、Agent、LLM和MCP Server之间的交互,虽然细节有所欠缺,但基础作品直出且具有不错的美观度。对于复杂推理任务,V3.1的思考模式表现出了优异能力。
DeepSeek V3.1的发布不仅仅是一次模型升级,更是AI发展方向的一次重要转向。它标志着人工智能正在从单纯的对话和内容生成,向能够真正理解复杂需求、使用工具、解决实际问题的Agent时代迈进。
一句话总结
本文由人人都是产品经理作者【产品海豚湾】,微信公众号:【产品海豚湾】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。

