DeepSeek 接入指南
DeepSeek 系列在 Picklyone 上是 OpenAI 兼容协议,统一通过 /v1/chat/completions 调用。你不需要单独注册 DeepSeek 官网账号——一个 Picklyone API Key 就能用。
可用模型
| 模型 | 思考模式 | 上下文 | 推荐场景 |
|---|---|---|---|
deepseek-v4-pro | 混合(默认开) | 393K | 最强推理 / 复杂代码 / 多步逻辑 |
deepseek-v4-flash | 混合(默认开) | 393K | 日常对话 / 快速场景 / 价格敏感 |
deepseek-v3.2 | 混合(默认开) | 65K | V3 升级版,平衡质量与成本 |
deepseek-r1 | 仅思考 | 65K | 数学 / 逻辑证明 / 深度推理 |
deepseek-v3 | 非思考 | 65K | 不需要推理的场景,最便宜 |
实时定价见 /pricing,全部按 token 计费,无月费。
快速开始
curl
curl https://api.picklyone.com/v1/chat/completions \
-H "Authorization: Bearer pk_live_xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-flash",
"messages": [{"role": "user", "content": "你是谁"}],
"stream": false
}'
Python(OpenAI SDK)
from openai import OpenAI
client = OpenAI(
api_key="pk_live_xxx",
base_url="https://api.picklyone.com/v1",
)
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[{"role": "user", "content": "你是谁"}],
)
print(resp.choices[0].message.content)
Node.js(OpenAI SDK)
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "pk_live_xxx",
baseURL: "https://api.picklyone.com/v1",
});
const resp = await client.chat.completions.create({
model: "deepseek-v4-flash",
messages: [{ role: "user", content: "你是谁" }],
});
console.log(resp.choices[0].message.content);
思考模式控制(DeepSeek 专属字段)
DeepSeek 提供了几个非 OpenAI 标准字段,Picklyone 的 DeepSeek 通道全部支持:
| 字段 | 类型 | 适用模型 | 说明 |
|---|---|---|---|
enable_thinking | boolean | v4-pro / v4-flash / v3.2 | 控制是否开启思考。混合思考模型默认 true |
thinking_budget | integer | v4-pro / v4-flash / v3.2 | 思考预算 token 数(默认 32768) |
reasoning_effort | "high" | "max" | v4-pro / v4-flash / r1 | 推理强度。OpenAI 标准字段,全平台通用 |
关闭思考节省 token
混合思考模型默认开思考,简单任务也会消耗几十到上百个 token 在思维链上。思维链按输出 token 计费——成本不可忽视。简单任务建议显式关闭:
Python(用 OpenAI SDK 的 extra_body 传非标字段):
resp = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[{"role": "user", "content": "1+1=?"}],
extra_body={"enable_thinking": False},
)
Node.js(直接放顶层):
const resp = await client.chat.completions.create({
model: "deepseek-v4-flash",
messages: [{ role: "user", content: "1+1=?" }],
enable_thinking: false,
});
curl(JSON 顶层字段):
-d '{"model":"deepseek-v4-flash","messages":[...],"enable_thinking":false}'
r1 / r1-0528 是仅思考模型,不能关思考——传
enable_thinking: false会被忽略或报错。
调高推理强度
reasoning_effort 让模型在 r1 / v4-pro 这类推理任务上"更努力"地思考:
resp = client.chat.completions.create(
model="deepseek-r1",
messages=[{"role": "user", "content": "证明费马小定理"}],
reasoning_effort="max", # high (默认) | max
)
max 比 high 思考更深,输出 token 也更多,单次成本会上升。
流式响应 + 思维链
混合 / 仅思考模型在流式模式下,先吐 reasoning_content(思维链),再吐 content(最终回答)。两个字段独立流式:
stream = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[{"role": "user", "content": "为什么天空是蓝色的"}],
stream=True,
stream_options={"include_usage": True},
)
for chunk in stream:
if not chunk.choices:
# 最后一个 chunk 包含 usage
print("\nusage:", chunk.usage)
continue
delta = chunk.choices[0].delta
if hasattr(delta, "reasoning_content") and delta.reasoning_content:
print(delta.reasoning_content, end="", flush=True) # 思考过程
if delta.content:
print(delta.content, end="", flush=True) # 正式回答
计费说明
- 输入 / 输出按 token 计费,价格见 /pricing
- 思维链按输出价格计费——开思考的请求成本会比纯回答高几倍
- 上下文缓存(v4 系列支持)走独立 cache_read / cache_creation 单价
- 每次调用的实付金额可在 /api-logs 看到,精确到 6 位小数美元
我们的计费跟 DeepSeek 官方定价 逐 token 1:1 镜像,无任何水分。
常见问题
Q: 能直接用 DeepSeek 官方 Python SDK 吗?
A: 能。DeepSeek 官方 SDK 就是 OpenAI 兼容包,把 base_url 改成 https://api.picklyone.com/v1、key 换成 pk_live_xxx 即可。
Q: 为什么 enable_thinking: false 后 token 还很多?
A: 该参数的实际效果因模型而异。v4-pro / v3.2 通常严格关思考;v4-flash 在某些 prompt 下仍可能产生思考 token。建议查看响应的 usage.completion_tokens_details.reasoning_tokens 字段确认实际思考 token 数。
Q: r1 调用很慢,会不会 timeout? A: r1 是纯思考模型,复杂题目可能要思考 1-2 分钟。如果你的 prompt 触发更长思考,建议把任务拆小,或换 v4-pro(混合模式默认思考更短)。
Q: DeepSeek 通道有没有限速?
A: 跟 Picklyone 全平台一致:每个用户 120 RPM。需要更高配额联系 support@picklyone.com。
Q: 我能用 Anthropic 协议(/v1/messages)调 DeepSeek 吗?
A: 不行。/v1/messages 是 Anthropic 协议适配,转发逻辑跟 DeepSeek 的 OpenAI 协议不兼容。所有 DeepSeek 调用必须走 /v1/chat/completions。