
一句话
Picklyone 累计处理 token 数量正式突破 1000 亿。 这个数字背后,是几万次代码生成、上百万轮对话、无数个深夜的调试和上线。
这是一个属于每一位用户的数字 —— 谢谢你们一路同行。
这 1000 亿 Tokens 里有什么
- 横跨 OpenAI / Anthropic / Google / DeepSeek / Qwen / Kimi / GLM 等十余家主流厂商
- 覆盖 文本对话、代码生成、长上下文分析、图像生成、工具调用 等多种场景
- 服务从个人开发者、独立产品到团队/企业的多种使用规模
- 全程透明计费、完整日志、按实际用量收费 —— 没有任何隐藏抽成
我们一路走过的几件事
| 时间 | 事件 |
|---|---|
| 2026-04 | 平台上线、透明定价模型(官方价 × 折扣倍率)正式生效 |
| 2026-04 | 图片生成正式上线(/v1/images/generations,OpenAI 兼容) |
| 2026-04 | GPT-5.5、Claude Opus 4.7、DeepSeek V4 集中接入 |
| 2026-05 | OpenAI & Claude 双协议全量打通(任意 SDK × 任意模型) |
| 2026-05 | 累计调用突破 1000 亿 Tokens ✨ |
接下来的平台规划
里程碑只是一个标记 —— 接下来想做的事情比已经做的更多。下面按类别讲。
1. 模型层:更广 + 更新 + 更稳
- 国产新版本快速接入 —— GLM-5、Kimi K2、Qwen 新版上游一发布即跟进
- 视频生成评估 —— Sora、Runway、可灵等模型的可行性评估正在进行中,有进展会第一时间公布
- 多模态深度打通 —— 图 + 文 + 工具调用混合输入,统一计费、统一日志
- 下线策略透明化 —— 任何模型下线提前 30 天公告,绝不静默切换
2. 协议层:更准 + 更全
- 协议转换精度持续打磨 —— 超长
tool_use嵌套、特殊stop_reason、多轮工具调用的还原度继续提升 - Responses API 全量覆盖 —— 已在 sub2api 系列上游开通,正在扩展到更多上游厂商
- 流式 / 缓存 / 工具调用全协议一致 —— OpenAI 和 Anthropic 两侧体验完全对齐
3. 控制台:更细 + 更顺手
- 更细粒度的账单视图 —— 按 API Key、按模型、按项目维度的聚合,导出 CSV 直接对账
- 团队/项目协作 —— 主账号下分发子账号、独立限额、独立日志(在路上)
- 用量预警 + 自动停机 —— 设置阈值,达到自动暂停某个 key,避免意外超支
- 更友好的密钥管理 —— 命名、标签、模型白名单、IP 白名单的可视化配置
4. 基础设施:更稳 + 更快
- 多网关弹性路由继续加固 —— 单一上游故障时秒级切换、不丢请求
- TTFT / P99 延迟持续优化 —— 持续公开核心模型的真实延迟与成功率数据
- 可观测性外露 —— 模型页的成功率、TTFT 走势图(目前是 placeholder)接入真实观测数据
- 更广的地理覆盖 —— Cloudflare 边缘节点已经覆盖全球,接下来打磨国内访问体验
5. 定价:继续透明 + 继续压成本
- 透明定价不变 ——
platform_price = official_price × rate,每个模型的折扣倍率公示在 定价页 - 持续优化上游成本 —— 拿到更好的上游单价,会直接体现为更低的客户价格,不会私吞
- 缓存计费 100% 透传 ——
cache_read_tokens独立列出,绝不双重计费 - 预付费 / 后付费灵活组合 —— 个人开发者继续按量付费,企业用户支持月度结算(在路上)
6. 开发者体验:文档 + 示例 + SDK 友好
- 更多代码示例 —— Python / Node / Go / Java 完整跑通案例
- 常见工具链一键配置 —— Cherry Studio、Cursor、Claude Code、Codex CLI 等的接入文档持续维护和更新
- 故障排查工具 —— 控制台直连日志详情、错误回放、上游错误码翻译
一些数字之外的话
这 1000 亿 token 不是我们一家在跑 —— 是几千个 API Key,在你们各自的 IDE、终端、生产环境里跑出来的。
每一次报错、每一次反馈、每一次"这里能不能再优化一点",我们都收到了。下一个 1000 亿,会比这一个更快到来。
给我们写信
平台路线图永远是开放的。你想优先看到什么、想用什么模型、想要什么功能 —— 都欢迎在企业微信群、contact 页面 或者 support@picklyone.com 告诉我们。
再次感谢一路同行的每一位伙伴 🙌