DeepSeek 降价了！还是永久降价！缓存命中 0.02 元/百万 token，这价格还有谁

1257 字

6 分钟

-

DeepSeek 降价了！还是永久降价！缓存命中 0.02 元/百万 token，这价格还有谁

2026-05-23 22:07

技术

DeepSeek

/

AI

AI概括本文内容

正在概括...

昨天查 API 账单的时候发现 DeepSeek 又调价了。

准确说不是”又”，是 4 月 26 号就生效了，但我现在才注意到。缓存命中的价格直接砍到了原来的 1/10，Flash 输入只要 0.02 元/百万 token——这价格比我平时用的 Qwen 都便宜了。

那么upxuu也是火速冲了5r试了试是真的便宜啊~

屏幕截图 2026-05-23 164026

而且 Pro 不是简单的打折，是永久降价——首发原价 0.1/12/24 已经划掉了，现在的 0.025/3/6 是原价的 1/4，5 月 31 号之后永久执行。

我平时主力用的是 Qwen，但这会儿写这篇文章用的就是 DeepSeek（V4 Flash），正好聊聊这波降价。

到底降了多少#

直接从官方定价页面扒的数据（带划掉的是首发原价）：

DeepSeek V4 系列最新价格

模型	缓存命中	未命中	输出
deepseek-v4-flash	0.02 元	1 元	2 元
deepseek-v4-pro	0.025 元	3 元	6 元
~~首发原价~~	~~0.1 元~~	~~12 元~~	~~24 元~~

Flash 缓存命中 0.02 元什么概念？就是一百万个 token 只要两分钱，写一篇长文可能几毛钱都花不到。

Pro 直接降到首发原价的 1/4，缓存命中只要 0.025 元、输出 6 元。目前还是 2.5 折过渡期，5 月 31 号之后永久按这个价格执行。

关键时间点：

4 月 26 日：缓存命中价格降至首发 1/10（已生效，永久）
5 月 31 日：Pro 过渡期结束，2.5 折价格永久生效

和其他旗舰对比一下#

光看 DeepSeek 自己的价格不够直观，拉上其他几家主流旗舰模型比比。以下价格均按输入/输出分别计，单位是人民币元/百万 token（按近期汇率约 7.2 换算）。

模型	输入	输出
DeepSeek V4 Flash	1 元	2 元
DeepSeek V4 Pro	3 元	6 元
OpenAI GPT-5.5	~108 元	~432 元
Anthropic Claude Opus 4	~108 元	~540 元
Google Gemini 2.5 Pro	~9 元	~36 元
通义千问 qwen3.7-max	~18 元	~72 元

注意这里的 DeepSeek 是正常（未命中）价格。如果走缓存命中，Flash 输入只要 0.02 元，Pro 只要 0.025 元——那对比就更夸张了。

几个关注点：

GPT-5.5 和 Claude Opus 4 都是旗舰中的旗舰，价格也是最高的，输入百元级、输出四五百元
Gemini 2.5 Pro 性价比不错，输入不到 10 元，但国内直连体验差
qwen3.7-max 是目前千问的旗舰，输入 18 元，输出 72 元，综合能力确实强
DeepSeek V4 Pro（3/6）跟 Claude Sonnet 或 qwen3.6-plus 在同一档，但能力是旗舰级的
DeepSeek V4 Flash（1/2）直接打进白菜价，对标的是别人的轻量模型

所以这波降价为什么炸？ — Flash 直接打到其他家轻量模型的价位，Pro 降到 mid-tier 价位但能力是旗舰级的，缓存命中更是降维打击。

缓存命中才是王炸#

很多人可能不知道缓存命中是啥意思。简单说就是——如果你问的问题跟之前有人问过的内容相似，模型可以直接复用之前计算好的结果，不用重新算一遍。

对于开发者来说，这就是白嫖福利。因为：

系统提示词基本不变 → 缓存命中
常用上下文反复出现 → 缓存命中
多轮对话中的历史信息 → 缓存命中

我自己的用法是后台管理系统里集成了 AI 助手，每次请求都会带上固定的系统提示词。这部分的上下文只要不变化，全都走缓存命中——Flash 输入 0.02 元，Pro 输入 0.025 元。

加上 2500 的并发限制，批量处理场景下性价比拉满。

跟 Qwen 的个人体感#

我平时 Qwen 用得多，因为推理能力和中文理解确实不错。但 DeepSeek 这波降价之后，我开始在更多场景切过去了：

日常闲聊、文案辅助 → DeepSeek Flash（便宜，够用）
代码生成、复杂推理 → Qwen（逻辑更强一些）
写博客、写文档 → DeepSeek Flash（就现在这篇）
后台 AI Agent → DeepSeek Flash（固定 prompt，命中缓存很香）

纯个人体感，具体哪个适合你还得自己试试。

几个小建议#

缓存命中是关键。API 调用有固定 prompt 的话，DeepSeek 性价比拉满
Flash 够用别硬上 Pro。大多数人 Flash 完全够用，没必要多花钱
1M 上下文是真的。实测长文档塞进去没问题，输出最大 384K

说实话，这波降价力度确实可以。Flash 直接打进白菜价，Pro 永久降到原来的 1/4，加上现在又支持 Anthropic 格式的 API，生态越来越全了。

不说别的，至少写这篇文章的过程中体验还不错。

注：GPT-5.5 价格基于 OpenAI 公开定价，Claude 基于 Anthropic 公开定价，Gemini 基于 Google AI Studio 定价，qwen3.7-max 基于阿里云百炼定价。外币按 1 USD ≈ 7.2 CNY 换算，价格为近似值。

屏幕截图 2026-05-23 164131

顺带一提 DeepSeek-tui也很好用

DeepSeek 降价了！还是永久降价！缓存命中 0.02 元/百万 token，这价格还有谁

https://upxuu.com/posts/deepseek-price-drop/

作者

UpXuu

发布于

2026-05-23

许可协议

禁止商用：严禁用于任何变现、引流、赚取平台激励等行为。

禁止改编：禁止洗稿、翻译、节选等任何形式的二次创作。

转载授权：如需转载，请发邮件至 me@upxuu.com 申请书面许可，未经授权不得转载。

NVIDIA Build：不花一分钱，免费部署DeepSeek等顶级 AI 模型|NVIDIA NIM|免费AI API

你平时经常用的workers，竟还是一个实用的的ip查询接口! Cloudflare Workers request.cf 对象完全指南

0%

XUUAI 问答

可以问文章相关的问题，XUUAI 会参考文章内容回答