返回首页

DeepSeek 接入指南

DeepSeek 系列在 Picklyone 上是 OpenAI 兼容协议,统一通过 /v1/chat/completions 调用。你不需要单独注册 DeepSeek 官网账号——一个 Picklyone API Key 就能用。

可用模型

模型思考模式上下文推荐场景
deepseek-v4-pro混合(默认开)393K最强推理 / 复杂代码 / 多步逻辑
deepseek-v4-flash混合(默认开)393K日常对话 / 快速场景 / 价格敏感
deepseek-v3.2混合(默认开)65KV3 升级版,平衡质量与成本
deepseek-r1仅思考65K数学 / 逻辑证明 / 深度推理
deepseek-v3非思考65K不需要推理的场景,最便宜

实时定价见 /pricing,全部按 token 计费,无月费。

快速开始

curl

curl https://api.picklyone.com/v1/chat/completions \
  -H "Authorization: Bearer pk_live_xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "messages": [{"role": "user", "content": "你是谁"}],
    "stream": false
  }'

Python(OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    api_key="pk_live_xxx",
    base_url="https://api.picklyone.com/v1",
)

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[{"role": "user", "content": "你是谁"}],
)
print(resp.choices[0].message.content)

Node.js(OpenAI SDK)

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "pk_live_xxx",
  baseURL: "https://api.picklyone.com/v1",
});

const resp = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [{ role: "user", content: "你是谁" }],
});
console.log(resp.choices[0].message.content);

思考模式控制(DeepSeek 专属字段)

DeepSeek 提供了几个非 OpenAI 标准字段,Picklyone 的 DeepSeek 通道全部支持

字段类型适用模型说明
enable_thinkingbooleanv4-pro / v4-flash / v3.2控制是否开启思考。混合思考模型默认 true
thinking_budgetintegerv4-pro / v4-flash / v3.2思考预算 token 数(默认 32768)
reasoning_effort"high" | "max"v4-pro / v4-flash / r1推理强度。OpenAI 标准字段,全平台通用

关闭思考节省 token

混合思考模型默认开思考,简单任务也会消耗几十到上百个 token 在思维链上。思维链按输出 token 计费——成本不可忽视。简单任务建议显式关闭:

Python(用 OpenAI SDK 的 extra_body 传非标字段):

resp = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[{"role": "user", "content": "1+1=?"}],
    extra_body={"enable_thinking": False},
)

Node.js(直接放顶层):

const resp = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [{ role: "user", content: "1+1=?" }],
  enable_thinking: false,
});

curl(JSON 顶层字段):

-d '{"model":"deepseek-v4-flash","messages":[...],"enable_thinking":false}'

r1 / r1-0528 是仅思考模型,不能关思考——传 enable_thinking: false 会被忽略或报错。

调高推理强度

reasoning_effort 让模型在 r1 / v4-pro 这类推理任务上"更努力"地思考:

resp = client.chat.completions.create(
    model="deepseek-r1",
    messages=[{"role": "user", "content": "证明费马小定理"}],
    reasoning_effort="max",  # high (默认) | max
)

maxhigh 思考更深,输出 token 也更多,单次成本会上升。

流式响应 + 思维链

混合 / 仅思考模型在流式模式下,先吐 reasoning_content(思维链),再吐 content(最终回答)。两个字段独立流式:

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "为什么天空是蓝色的"}],
    stream=True,
    stream_options={"include_usage": True},
)

for chunk in stream:
    if not chunk.choices:
        # 最后一个 chunk 包含 usage
        print("\nusage:", chunk.usage)
        continue

    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content:
        print(delta.reasoning_content, end="", flush=True)  # 思考过程
    if delta.content:
        print(delta.content, end="", flush=True)  # 正式回答

计费说明

  • 输入 / 输出按 token 计费,价格见 /pricing
  • 思维链按输出价格计费——开思考的请求成本会比纯回答高几倍
  • 上下文缓存(v4 系列支持)走独立 cache_read / cache_creation 单价
  • 每次调用的实付金额可在 /api-logs 看到,精确到 6 位小数美元

我们的计费跟 DeepSeek 官方定价 逐 token 1:1 镜像,无任何水分。

常见问题

Q: 能直接用 DeepSeek 官方 Python SDK 吗? A: 能。DeepSeek 官方 SDK 就是 OpenAI 兼容包,把 base_url 改成 https://api.picklyone.com/v1、key 换成 pk_live_xxx 即可。

Q: 为什么 enable_thinking: false 后 token 还很多? A: 该参数的实际效果因模型而异。v4-pro / v3.2 通常严格关思考;v4-flash 在某些 prompt 下仍可能产生思考 token。建议查看响应的 usage.completion_tokens_details.reasoning_tokens 字段确认实际思考 token 数。

Q: r1 调用很慢,会不会 timeout? A: r1 是纯思考模型,复杂题目可能要思考 1-2 分钟。如果你的 prompt 触发更长思考,建议把任务拆小,或换 v4-pro(混合模式默认思考更短)。

Q: DeepSeek 通道有没有限速? A: 跟 Picklyone 全平台一致:每个用户 120 RPM。需要更高配额联系 support@picklyone.com

Q: 我能用 Anthropic 协议(/v1/messages)调 DeepSeek 吗? A: 不行/v1/messages 是 Anthropic 协议适配,转发逻辑跟 DeepSeek 的 OpenAI 协议不兼容。所有 DeepSeek 调用必须走 /v1/chat/completions