模型 & 价格

下表所列模型价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位，可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。

模型细节

模型	deepseek-v4-flash ⁽¹⁾	deepseek-v4-pro
BASE URL (OpenAI 格式)	`https://api.deepseek.com`
BASE URL (Anthropic 格式)	`https://api.deepseek.com/anthropic`
模型版本	DeepSeek-V4-Flash	DeepSeek-V4-Pro
思考模式	支持非思考与思考模式（默认）切换方式详见思考模式
上下文长度	1M
输出长度	最大 384K

模型	并发限制
deepseek-v4-flash	2500
deepseek-v4-pro	500

(1) deepseek-chat 与 deepseek-reasoner 两个模型名将于北京时间 2026/07/24 23:59 弃用。出于兼容考虑，二者分别对应 deepseek-v4-flash 的非思考与思考模式。

(2) 更多并发限制细节，请参考限速与隔离。

扣减费用 = token 消耗量 × 模型单价，对应的费用将直接从充值余额或赠送余额中进行扣减。当充值余额与赠送余额同时存在时，优先扣减赠送余额。

产品价格可能发生变动，DeepSeek 保留修改价格的权利。请您依据实际用量按需充值，定期查看此页面以获知最新价格信息。