strictmode(DeepSeek V3.1：开启混合智能与Agent时代的新纪元)_汽车导购_汽车_资讯

2025年8月21日，中国AI公司深度求索（DeepSeek）正式推出新一代大模型DeepSeek V3.1，它以混合推理架构和强大的Agent能力，标志着人工智能正式迈入“Agent时代”的新阶段。8月21日，中国人工智能领域迎来一个重要时刻。深度求索（DeepSeek）正式发布了其新一代大模型——DeepSeek V3.1。此次发布没有盛大的发布会，而是通过官方渠道静静宣布，但它在AI社区和开发者中引发了巨大反响。作为DeepSeek V3的升级版本，V3.1引入了革命性的混合推理架构，首次在生产就绪的模型中实现了思考模式与非思考模式的无缝切换。这个拥有6850亿参数的巨型模型（685B参数）。不仅在多项基准测试中表现出色，更在代码生成、软件工程和复杂问题解决方面展现出了超越前代和竞争对手的性能。同时，它还对国产芯片进行了专门优化，为中国AI生态的发展提供了新动力。
DeepSeek V3.1最显著的创新是其混合推理架构（Hybrid Reasoning Architecture），它成功将思考模式与非思考模式整合到单一模型中。这种设计允许用户根据任务复杂度，自由切换模型的“深度思考”状态。在官方App和网页端，用户只需点击“深度思考”按钮，就能激活模型的增强推理能力。通过API调用时，开发者可以选择使用“deepseek-chat”（非思考模式）或“deepseek-reasoner”（思考模式）不同端点，满足不同场景的需求。
02 性能表现：领先行业的基准
03 效率提升：思维链压缩与成本优化
表：DeepSeek V3.1与主要竞争对手的成本效益比较
DeepSeek V3.1被其开发者称为迈向“Agent时代”的第一步，这主要体现在其增强的工具使用和智能体任务能力上。
在需要多步推理的复杂搜索测试（browsecomp）中，V3.1取得了30.0%的得分，比R1-0528的8.9%提高了237%。在多学科专家级难题测试（HLE）中，V3.1在使用Python和搜索工具的情况下达到了29.8%的准确率，比前代提高了20%。
DeepSeek V3.1的一个重要意义是其对国产芯片的专门优化。模型支持UE8M0 FP8精度格式，这是为“即将发布的下一代国产芯片”量身定制的。这种优化使得V3.1能够在国产芯片上高效运行，降低了对国外硬件的依赖。
06 开源策略与API升级：开发者生态建设
此外，DeepSeek V3.1还增加对Anthropic API格式的支持，使开发者能够轻松将V3.1的能力接入Claude Code等框架。从2025年9月6日起，DeepSeek将执行新的API定价策略。输入价格调整为0.5元/百万令牌（缓存命中）和4元/百万令牌（缓存未命中），输出价格为12元/百万令牌。同时，夜间时段优惠将被取消。
DeepSeek V3.1在多个应用场景中展现出色能力。
在流程图与复杂案例测试中，V3.1能够使用Mermaid流程图展示用户、Agent、LLM和MCP Server之间的交互，虽然细节有所欠缺，但基础作品直出且具有不错的美观度。对于复杂推理任务，V3.1的思考模式表现出了优异能力。
DeepSeek V3.1的发布不仅仅是一次模型升级，更是AI发展方向的一次重要转向。它标志着人工智能正在从单纯的对话和内容生成，向能够真正理解复杂需求、使用工具、解决实际问题的Agent时代迈进。
一句话总结
本文由人人都是产品经理作者【产品海豚湾】，微信公众号：【产品海豚湾】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。
题图来自Unsplash，基于 CC0 协议。

strictmode(DeepSeek V3.1：开启混合智能与Agent时代的新纪元)

02 性能表现：领先行业的基准

03 效率提升：思维链压缩与成本优化

06 开源策略与API升级：开发者生态建设

一句话总结

猎毒人第2集

猎毒人第1集