
TL;DR
| 模型 | 厂商 | 入口 |
|---|---|---|
gpt-5.5 | OpenAI | /v1/chat/completions、/v1/responses |
claude-opus-4-7 | Anthropic | /v1/messages、/v1/chat/completions |
deepseek-v4-pro / deepseek-v4-flash | DeepSeek | /v1/chat/completions |
存量代码不需要改,只把 model 字段换成新名字就能调用。具体型号 ID、能力对比和实时价格请去 模型页面 和 定价页 查最新。
为什么这次三家一起接
这三家 4 月集中放了新版本,我们做了一波统一接入 + 验证测试,而不是分批挨个发公告。这样:
- 你看一篇文章就能知道全部三家的进度
- 三家共用 Picklyone 的同一套基础设施(鉴权、计费、日志、缓存),不会因为厂商不同导致体验割裂
- 我们的多网关路由层会按你请求的模型名自动选择对应的上游通道,你不需要关心后端怎么转发
GPT-5.5
OpenAI 的 GPT-5.5 主打更长上下文 + 更强推理,对复杂代码、多步骤工作流更友好。
调用方式跟之前完全一样:
from openai import OpenAI
client = OpenAI(
api_key="pk_live_...",
base_url="https://api.picklyone.com/v1",
)
resp = client.chat.completions.create(
model="gpt-5.5", # 改这一行
messages=[{"role": "user", "content": "解释一下分布式事务的两阶段提交"}],
)
print(resp.choices[0].message.content)
如果你之前在用 gpt-5,把 model 字段从 "gpt-5" 换成 "gpt-5.5" 就完事,没有 SDK 升级、没有 endpoint 切换。
Claude Opus 4.7
Anthropic 这次先放出旗舰 Opus 4.7,Sonnet / Haiku 4.7 上游还没上,等到了我们会同步接入。Opus 4.7 继承了 4.6 的 1M token 长上下文,在代码生成、工具调用准确度、复杂指令遵循上都比 4.6 更强。
老的 claude-sonnet-4-6 和 claude-opus-4-6 仍然在售,你想留着旧模型继续跑就不需要改任何东西。
如果你的客户端是原生 Anthropic SDK:
import anthropic
client = anthropic.Anthropic(
api_key="pk_live_...",
base_url="https://api.picklyone.com",
)
msg = client.messages.create(
model="claude-opus-4-7",
max_tokens=2048,
messages=[{"role": "user", "content": "Hello!"}],
)
如果用的是 OpenAI SDK(我们的 /v1/chat/completions 端点同时兼容 Claude):
resp = client.chat.completions.create(
model="claude-opus-4-7",
messages=[{"role": "user", "content": "Hello!"}],
)
Prompt Caching 自动生效 —— 长 system prompt 会自动命中 Anthropic 的 cache_control,首次以外的调用最高省下 90% input token 成本,无需任何配置。
DeepSeek V4
DeepSeek 最新的 V4 系列分两档:
deepseek-v4-pro—— 旗舰版,最强综合能力,适合代码、数学推理、复杂指令遵循deepseek-v4-flash—— 经济版,响应更快、单价更低,适合高并发对话和简单任务
两档都比国外旗舰便宜一个量级,具体单价见 定价页。
resp = client.chat.completions.create(
model="deepseek-v4-pro", # 旗舰
# 或 model="deepseek-v4-flash" # 高速经济版
messages=[{"role": "user", "content": "用 Python 实现快速排序"}],
)
DeepSeek 同样走我们的统一 OpenAI 兼容接口,跟调用 GPT 没有区别。
怎么验证三家都通了
最快的方式:
# 列出当前账号能用的所有模型
curl https://api.picklyone.com/v1/models \
-H "Authorization: Bearer pk_live_..."
返回的 data[].id 列表里能看到 gpt-5.5、claude-opus-4-7、deepseek-v4-pro、deepseek-v4-flash 等就是接入成功。
计费、日志、缓存——全部自动打通
- 三家都按各自实际 token 用量计价,跟你之前调用旧模型的扣费方式一致
- 每次调用在 API 日志页 可见,带 model 名、token 数、耗时、单次成本
- Anthropic 的 prompt cache、OpenAI 的 prompt cache 都会自动透传
cache_read_tokens,在日志里独立列出,你不会被双重计费 - 余额查看不变,在 仪表板 顶部
价格策略
我们继续延续 透明定价原则:
- 厂商官方价格直接在 定价页 公示
- Picklyone 的实际收费 = 官方价 × 折扣倍率,折扣倍率因模型而异
- 你看到什么价就是什么价,没有隐藏抽成、没有阶梯门槛、没有最低充值
路线图
下一批正在排期的工作:
- 视频模型(Sora / Runway 等)的可行性评估
- 多模态对话(图 + 文混合输入)的端到端打通
- 更多国产模型(智谱 GLM-5、月之暗面新版)
有具体场景需求或希望优先排期的厂商,欢迎在企业微信群或 support@picklyone.com 告诉我们。