AI API 排行榜与测试平台

真实数据 · 客观公正 · 持续监控

平台总数
--实时
较昨日
模型总数
--覆盖
较昨日
~
测试样本
--入库
真实测试
平均可用率
--实测
数据库
平均延迟
--P50
实测
最高 TPS
--D10
未测则为空
综合排行榜
排名 平台名称 协议 综合得分 可用率 平均延迟 RPM(D10) TPM(D10) 最近检测
正在加载排行榜数据...
查看完整排行榜 →

快速开始测试

立即测试你的 API 服务,获取详细的性能评估报告

开始模型测试
真实测试
全球分布式节点真实请求测试
客观公正
算法评分,无人工干预
持续监控
自动化监控与告警
多维度评估
延迟、可用率、吞吐量等
可视化报告
详细报告与趋势分析
已收录 -+ 中转站(全部有效) · 加载中

找到最适合你的
AI API 中转站

基于延迟、价格、稳定性、模型真实性等多维度自动测试,帮你快速筛选性价比最高的 API 中转服务

-
有效中转站
24h
测试周期
7
评测维度

🎯 找适合自己的中转站

填写您的需求,系统将智能匹配最适合的5个API中转站

本月剩余免费次数:1次

🔍 提交中转站收录

输入中转站网址,系统将自动检测其可用性并评估是否收录

💡 只需填写网址即可,系统会自动: ① 验证是否为中转站 → ② 识别名称和特点 → ③ 检测模型支持 → ④ 6维度评分 → ⑤ 提交审核
⚙️
正在检测中...
请稍候,系统正在分析该中转站
连接检测 — 测试网站可达性
API 格式验证 — 检查是否兼容 OpenAI/Claude 格式
模型可用性 — 测试模型是否正常响应
响应延迟 — 测量平均响应时间
价格合理性 — 检查定价是否在合理范围

⚠️ 已失效站点

0 个站点

以下站点无法访问或已停止服务,已从排行榜中隐藏

  • 加载中...

📊 评分维度与权重

综合评分由后端探针(Probe)体系自动采集,加权 + 上限封顶后取最低值,生成 0-100 分,前端按 ÷10 显示。

🛡️
D1 协议连通性
能否成功调用 chat/messages 接口并返回有效内容(失败带 2 次重试退避)。失败直接 0 分封顶
20%
D8 响应延迟
流式调用首字节时间(TTFB)。按模型族选目标延迟(普通 2.5s/Opus 4s/Thinking 6s)
15%
📈
D9 性能稳定性
10 次不同 prompt 调用,统计成功率 + 内容正确率 + 延迟一致性
15%
D3 身份一致性
交叉验证模型自报名 + body.model 字段 + 模型族特征问答,3 类信号至少 2 项匹配
15%
📦
D2 响应结构
返回体的 OpenAI 兼容字段完整性(id/choices/message/content/usage)
10%
🧬
D5 内容 Canary
让模型原样回显随机字符串,识别中转改写/中转 mock
10%
🔏
D17 响应签名
id/object/role/finish_reason/usage/model 6 项加权检查
10%
🧠
D18 Claude 思考签名
仅 Claude 系。校验 thinking signature 长度 ≥80 + base64 合法 + 高熵(随机度)
10%
🌊
S5 流完整性
SSE 流的 content-type / chunk / [DONE] / 文本拼接 5 项检查
5%
🔌
D10 RPM 容量(可选)
轻量模式 30 RPM × 15s 探查;非默认开启
10%
🧩
D19/D20/D21/D22 兼容性
Responses API / Function Calling / JSON Mode / Vision,展示用,不计入评分
参考
计算流程:
composite_score = min(加权平均, 各探针的 cap_value 上限)
rank_score = stability_subscore × 0.35 + composite_score × 0.65 再乘 floor_factor
provider.score = α × 本次 rank_score + (1-α) × 历史值 ,α=0.35 平滑突发抖动
online_rate 取最近 7 天历史窗口聚合,样本不足显示 "--"
⚠️ 各项分数为脚本自动采集,无主观投票。任一探针严重不通过会触发 cap 上限,直接限制综合分数。

热门中转站 · 评分排行

数据来源:后端模型测试评分 · 动态 Top 5 · 点击波浪访问站点

综合排行榜 2026年6月 📊 评分说明

最近更新:2026-06-01 00:56
正在从数据库加载真实排行榜...