模型 & 价格
下表所列模型价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。
模型细节
| 模型 | deepseek-v4-flash (1) | deepseek-v4-pro |
|---|---|---|
| BASE URL (OpenAI 格式) | https://api.deepseek.com |
|
| BASE URL (Anthropic 格式) | https://api.deepseek.com/anthropic |
|
| 模型版本 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| 思考模式 | 支持非思考与思考模式(默认) 切换方式详见 思考模式 |
|
| 上下文长度 | 1M | |
| 输出长度 | 最大 384K | |
功能支持
| 功能 | deepseek-v4-flash | deepseek-v4-pro |
|---|---|---|
| Json Output | 支持 | 支持 |
| Tool Calls | 支持 | 支持 |
| 对话前缀续写(Beta) | 支持 | 支持 |
| FIM 补全(Beta) | 仅非思考模式支持 | 仅非思考模式支持 |
价格
| 计费项 | deepseek-v4-flash | deepseek-v4-pro |
|---|---|---|
| 百万 tokens 输入(缓存命中) | 0.02 元 | 0.025 元 |
| 百万 tokens 输入(缓存未命中) | 1 元 | 3 元 |
| 百万 tokens 输出 | 2 元 | 6 元 |
并发限制 (2)
| 模型 | 并发限制 |
|---|---|
| deepseek-v4-flash | 2500 |
| deepseek-v4-pro | 500 |
(1) deepseek-chat 与 deepseek-reasoner 两个模型名将于北京时间 2026/07/24 23:59 弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。
(2) 更多并发限制细节,请参考 限速与隔离。
扣费规则
扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。当充值余额与赠送余额同时存在时,优先扣减赠送余额。
- 扣减费用 = token 消耗量 × 模型单价
- 费用直接从充值余额或赠送余额中扣减
- 充值余额与赠送余额同时存在时,优先扣减赠送余额
产品价格可能发生变动,DeepSeek 保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。