DeepSeek 接入指南

DeepSeek 系列在 Picklyone 上是 OpenAI 兼容协议，统一通过 /v1/chat/completions 调用。你不需要单独注册 DeepSeek 官网账号——一个 Picklyone API Key 就能用。

可用模型

模型	思考模式	上下文	推荐场景
`deepseek-v4-pro`	混合（默认开）	393K	最强推理 / 复杂代码 / 多步逻辑
`deepseek-v4-flash`	混合（默认开）	393K	日常对话 / 快速场景 / 价格敏感
`deepseek-v3.2`	混合（默认开）	65K	V3 升级版，平衡质量与成本
`deepseek-r1`	仅思考	65K	数学 / 逻辑证明 / 深度推理
`deepseek-v3`	非思考	65K	不需要推理的场景，最便宜

实时定价见 /pricing，全部按 token 计费，无月费。

快速开始

curl

curl https://api.picklyone.com/v1/chat/completions \
  -H "Authorization: Bearer pk_live_xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [{"role": "user", "content": "你是谁"}],
    "stream": false
  }'

Python（OpenAI SDK）

from openai import OpenAI

client = OpenAI(
    api_key="pk_live_xxx",
    base_url="https://api.picklyone.com/v1",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[{"role": "user", "content": "你是谁"}],
)
print(resp.choices[0].message.content)

Node.js（OpenAI SDK）

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "pk_live_xxx",
  baseURL: "https://api.picklyone.com/v1",
});

const resp = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [{ role: "user", content: "你是谁" }],
});
console.log(resp.choices[0].message.content);

思考模式控制（DeepSeek 专属字段）

DeepSeek 提供了几个非 OpenAI 标准字段，Picklyone 的 DeepSeek 通道全部支持：

字段	类型	适用模型	说明
`enable_thinking`	boolean	v4-pro / v4-flash / v3.2	控制是否开启思考。混合思考模型默认 `true`
`thinking_budget`	integer	v4-pro / v4-flash / v3.2	思考预算 token 数（默认 32768）
`reasoning_effort`	"high" \| "max"	v4-pro / v4-flash / r1	推理强度。OpenAI 标准字段，全平台通用

关闭思考节省 token

混合思考模型默认开思考，简单任务也会消耗几十到上百个 token 在思维链上。思维链按输出 token 计费——成本不可忽视。简单任务建议显式关闭：

Python（用 OpenAI SDK 的 extra_body 传非标字段）：

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[{"role": "user", "content": "1+1=?"}],
    extra_body={"enable_thinking": False},
)

Node.js（直接放顶层）：

const resp = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [{ role: "user", content: "1+1=?" }],
  enable_thinking: false,
});

curl（JSON 顶层字段）：

-d '{"model":"deepseek-v4-flash","messages":[...],"enable_thinking":false}'

r1 / r1-0528 是仅思考模型，不能关思考——传 enable_thinking: false 会被忽略或报错。

调高推理强度

reasoning_effort 让模型在 r1 / v4-pro 这类推理任务上"更努力"地思考：

resp = client.chat.completions.create(
    model="deepseek-r1",
    messages=[{"role": "user", "content": "证明费马小定理"}],
    reasoning_effort="max",  # high (默认) | max
)

max 比 high 思考更深，输出 token 也更多，单次成本会上升。

流式响应 + 思维链

混合 / 仅思考模型在流式模式下，先吐 reasoning_content（思维链），再吐 content（最终回答）。两个字段独立流式：

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "为什么天空是蓝色的"}],
    stream=True,
    stream_options={"include_usage": True},
)

for chunk in stream:
    if not chunk.choices:
        # 最后一个 chunk 包含 usage
        print("\nusage:", chunk.usage)
        continue

    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content:
        print(delta.reasoning_content, end="", flush=True)  # 思考过程
    if delta.content:
        print(delta.content, end="", flush=True)  # 正式回答

计费说明

输入 / 输出按 token 计费，价格见 /pricing
思维链按输出价格计费——开思考的请求成本会比纯回答高几倍
上下文缓存（v4 系列支持）走独立 cache_read / cache_creation 单价
每次调用的实付金额可在 /api-logs 看到，精确到 6 位小数美元

我们的计费跟 DeepSeek 官方定价 逐 token 1:1 镜像，无任何水分。

常见问题

Q: 能直接用 DeepSeek 官方 Python SDK 吗？ A: 能。DeepSeek 官方 SDK 就是 OpenAI 兼容包，把 base_url 改成 https://api.picklyone.com/v1、key 换成 pk_live_xxx 即可。

Q: 为什么 enable_thinking: false 后 token 还很多？ A: 该参数的实际效果因模型而异。v4-pro / v3.2 通常严格关思考；v4-flash 在某些 prompt 下仍可能产生思考 token。建议查看响应的 usage.completion_tokens_details.reasoning_tokens 字段确认实际思考 token 数。

Q: r1 调用很慢，会不会 timeout？ A: r1 是纯思考模型，复杂题目可能要思考 1-2 分钟。如果你的 prompt 触发更长思考，建议把任务拆小，或换 v4-pro（混合模式默认思考更短）。

Q: DeepSeek 通道有没有限速？ A: 跟 Picklyone 全平台一致：每个用户 120 RPM。需要更高配额联系 support@picklyone.com。

Q: 我能用 Anthropic 协议（/v1/messages）调 DeepSeek 吗？ A: 不行。/v1/messages 是 Anthropic 协议适配，转发逻辑跟 DeepSeek 的 OpenAI 协议不兼容。所有 DeepSeek 调用必须走 /v1/chat/completions。