昨天查 API 账单的时候发现 DeepSeek 又调价了。
准确说不是”又”,是 4 月 26 号就生效了,但我现在才注意到。缓存命中的价格直接砍到了原来的 1/10,Flash 输入只要 0.02 元/百万 token——这价格比我平时用的 Qwen 都便宜了。
那么upxuu也是火速冲了5r试了试 是真的便宜啊~

而且 Pro 不是简单的打折,是永久降价——首发原价 0.1/12/24 已经划掉了,现在的 0.025/3/6 是原价的 1/4,5 月 31 号之后永久执行。
我平时主力用的是 Qwen,但这会儿写这篇文章用的就是 DeepSeek(V4 Flash),正好聊聊这波降价。
到底降了多少
直接从官方定价页面扒的数据(带划掉的是首发原价):
DeepSeek V4 系列最新价格
| 模型 | 缓存命中 | 未命中 | 输出 |
|---|---|---|---|
| deepseek-v4-flash | 0.02 元 | 1 元 | 2 元 |
| deepseek-v4-pro | 0.025 元 | 3 元 | 6 元 |
Flash 缓存命中 0.02 元什么概念?就是一百万个 token 只要两分钱,写一篇长文可能几毛钱都花不到。
Pro 直接降到首发原价的 1/4,缓存命中只要 0.025 元、输出 6 元。目前还是 2.5 折过渡期,5 月 31 号之后永久按这个价格执行。
关键时间点:
- 4 月 26 日:缓存命中价格降至首发 1/10(已生效,永久)
- 5 月 31 日:Pro 过渡期结束,2.5 折价格永久生效
和其他旗舰对比一下
光看 DeepSeek 自己的价格不够直观,拉上其他几家主流旗舰模型比比。以下价格均按输入/输出分别计,单位是人民币元/百万 token(按近期汇率约 7.2 换算)。
| 模型 | 输入 | 输出 |
|---|---|---|
| DeepSeek V4 Flash | 1 元 | 2 元 |
| DeepSeek V4 Pro | 3 元 | 6 元 |
| OpenAI GPT-5.5 | ~108 元 | ~432 元 |
| Anthropic Claude Opus 4 | ~108 元 | ~540 元 |
| Google Gemini 2.5 Pro | ~9 元 | ~36 元 |
| 通义千问 qwen3.7-max | ~18 元 | ~72 元 |
注意这里的 DeepSeek 是正常(未命中)价格。如果走缓存命中,Flash 输入只要 0.02 元,Pro 只要 0.025 元——那对比就更夸张了。
几个关注点:
- GPT-5.5 和 Claude Opus 4 都是旗舰中的旗舰,价格也是最高的,输入百元级、输出四五百元
- Gemini 2.5 Pro 性价比不错,输入不到 10 元,但国内直连体验差
- qwen3.7-max 是目前千问的旗舰,输入 18 元,输出 72 元,综合能力确实强
- DeepSeek V4 Pro(3/6)跟 Claude Sonnet 或 qwen3.6-plus 在同一档,但能力是旗舰级的
- DeepSeek V4 Flash(1/2)直接打进白菜价,对标的是别人的轻量模型
所以这波降价为什么炸? — Flash 直接打到其他家轻量模型的价位,Pro 降到 mid-tier 价位但能力是旗舰级的,缓存命中更是降维打击。
缓存命中才是王炸
很多人可能不知道缓存命中是啥意思。简单说就是——如果你问的问题跟之前有人问过的内容相似,模型可以直接复用之前计算好的结果,不用重新算一遍。
对于开发者来说,这就是白嫖福利。因为:
- 系统提示词基本不变 → 缓存命中
- 常用上下文反复出现 → 缓存命中
- 多轮对话中的历史信息 → 缓存命中
我自己的用法是后台管理系统里集成了 AI 助手,每次请求都会带上固定的系统提示词。这部分的上下文只要不变化,全都走缓存命中——Flash 输入 0.02 元,Pro 输入 0.025 元。
加上 2500 的并发限制,批量处理场景下性价比拉满。
跟 Qwen 的个人体感
我平时 Qwen 用得多,因为推理能力和中文理解确实不错。但 DeepSeek 这波降价之后,我开始在更多场景切过去了:
- 日常闲聊、文案辅助 → DeepSeek Flash(便宜,够用)
- 代码生成、复杂推理 → Qwen(逻辑更强一些)
- 写博客、写文档 → DeepSeek Flash(就现在这篇)
- 后台 AI Agent → DeepSeek Flash(固定 prompt,命中缓存很香)
纯个人体感,具体哪个适合你还得自己试试。
几个小建议
- 缓存命中是关键。API 调用有固定 prompt 的话,DeepSeek 性价比拉满
- Flash 够用别硬上 Pro。大多数人 Flash 完全够用,没必要多花钱
- 1M 上下文是真的。实测长文档塞进去没问题,输出最大 384K
说实话,这波降价力度确实可以。Flash 直接打进白菜价,Pro 永久降到原来的 1/4,加上现在又支持 Anthropic 格式的 API,生态越来越全了。
不说别的,至少写这篇文章的过程中体验还不错。
注:GPT-5.5 价格基于 OpenAI 公开定价,Claude 基于 Anthropic 公开定价,Gemini 基于 Google AI Studio 定价,qwen3.7-max 基于阿里云百炼定价。外币按 1 USD ≈ 7.2 CNY 换算,价格为近似值。

顺带一提 DeepSeek-tui也很好用
本文版权为 UpXuu 所有,保留所有权利(All Rights Reserved)。
禁止商用:严禁用于任何变现、引流、赚取平台激励等行为。
禁止改编:禁止洗稿、翻译、节选等任何形式的二次创作。
转载授权:如需转载,请发邮件至 me@upxuu.com 申请书面许可,未经授权不得转载。


