《大模型服务性能评测 DeepSeek-R1 网站版》第二期

DeepSeek-R1 大模型自问世以来，凭借其卓越的逻辑推理能力、高效训练及开源特性，迅速在全球AI领域占据一席之地，被誉为新时代的“斯普特尼克时刻”。其广泛应用已在多个行业引发变革，用户数量爆发式增长，移动端日活突破4000万。然而，用户激增也给 DeepSeek 官方服务带来巨大压力，服务器资源饱和导致频繁报错。正是基于这样的市场背景，各类替代服务方案应运而生，众多云服务商、芯片厂商及国内厂商如阿里云、华为云、腾讯云等纷纷接入 DeepSeek-R1 。

作为国内领先的可观测与应用安全厂商，基调听云对多家 DeepSeek-R1 API服务商进行了全面评测，并发布了《大模型服务性能评测 DeepSeek-R1 API版》第一期。该评测通过模拟真实用户行为，从网络性能、接口响应时间、推理速度、内容生成速度等关键指标，对主流云服务厂商的API接口进行了深入测试。在第一期评测中，我们发现火山引擎在API响应性能上全面领先，各项指标均优于其他服务商，可用性高达99.83%，是API接入的首选。相比之下，DeepSeek 官方服务虽推理速度较快，但首Token延迟过长且可用性较低。其他服务商如硅基流动可用性较高，而腾讯云与阿里云百炼的速度表现不尽理想。这些数据揭示了不同服务商在性能上的显著差异。

本期测评，我们旨在进一步深入探讨 DeepSeek-R1 大模型服务的性能表现。在当前市场环境下，随着第三方服务商的增多，用户选择面临更多考量。我们希望通过持续、多维度的评测，为广大开发者和终端用户提供更全面、更具参考价值的决策依据，帮助大家找到最适合自身需求、最稳定高效的 DeepSeek-R1 服务。

TL;NR（太长不看版）：

（1）经过对多家主流云服务厂商API接口的深度评测，阿里云百练在 API 响应性能上全面领先，各项指标均显著优于其他服务商。

（2）DeepSeek 官方虽推理速度较好，但首 Token 延迟过长且可用性低，成为显著短板。

（3）联通云虽然性能较差，但是首Token时间是最快的。

（4）其他服务商表现分化：火山引擎可用性较高。

（5）天翼云，派欧云，联通云和移动云是不支持推理速度的。

（6）如果你不是开发者，只关心哪里能用 DeepSeek-R1，直接拉到文章结尾看我们的推荐网页版服务。

测评结果及解读

数据分析：

1.阿里云百炼在平均速度、推理速度上表现最优，且可用性高达 98.59%，在API接入上首选推荐。
2.派欧云平均速度较快。
3.火山引擎生成速度响应快（32.595s）且可用性稳定（99.75%），但性能耗时相对较高（18.531s）。
4.腾讯云整体性能一般，综合性能在第三左右。
5.DeepSeek 官方首 Token 最差（3.985s），DNS时间是最快的（0.06s）。
6.天翼云表现不理想，性能较差（31.626s），主要是剩余包耗时较长（30.634）。
7.联通云首Token时间是最优秀的（0.746s），但是可用性是最差的（97.84%）。
8.移动云的总体性能是最差的（31.938s），主要耗时在剩余包时间（31.146s）。
9.硅基流动平均速度是最慢的（5.137s），首包时间是最长的（1.128s）。
10.派欧云，天翼云，联通云，移动云四家：接口不支持返回推理速度指标。

总体性能影响因素分析：
1、服务端推理性能是主要影响因素

在整体测试中，推理速度和生成速度的差异在厂商间表现较为显著，尤其是阿里云百练在推理上表现优秀，而其他厂商的性能则较为逊色。服务端推理的性能显然是影响API整体性能的关键因素。

2、网络因素的影响较小

虽然网络延迟（DNS 时间、连接时间等）存在一定的差异，但从测试结果来看，除非网络层的延迟异常高，否则不会对整体的 API 性能产生根本性影响。例如，DeepSeek 官方和火山引擎的网络层延迟较低，但推理和生成速度的差异更多源自服务端的处理能力，而非网络本身。

因此，服务端推理性能是影响整体性能的主要因素，网络层的影响相对较小，基本可以忽略不计，尤其当网络延迟不超过合理范围时。

城市维度

广州市

杭州市

北京市

上海市

成都市

苏州市

武汉市

重庆市

深圳市

城市维度分析：

1.火山引擎在以上城市均保持最高性能，推理速度是最快的。
2. DeepSeek 官方在以上城市的首 Token 时间最长，都在3.8s以上，比其他厂商都高。
3.硅基流动的平均速度是最慢的。
4.其他服务商与其他指标未见明显差异，整体与前面的结论一致。

运营商维度

运营商维度分析：

1. 天翼云在中国电信的网络下剩余包时间33.603秒，性能最差。
2. 其他服务商指标对比未见明显差异，整体与前面结论一致。

主机维度

主机维度分析：

该维度从各服务商提供 API 服务的目标主机 IP 地址维度分析各家服务的分布和性能。

主机数量分析总结：

腾讯云主机数量最多，移动云，派欧云，联通云，硅基流动，阿里云百练主机数量最少。
主机城市分析总结：

腾讯云的主机城市分布最广，其次是天翼云，火山引擎，DeepSeek 官方。
主机运营商分布分析总结：

腾讯云的主机运营商分布最广。

时间维度 1h颗粒度

–

各时间段分析：
时段（2025/5/20 01:00 – 2025/5/20 17:00）
特点：联通云，阿里云百炼，天翼云可用性不高，其它服务商可用性相对优秀，稳定。
原因：可能此时用户流量较大，服务器负载也比较大，腾讯云服务商可能受到限流影响。

时段（2025/5/15 00:00 – 2025/5/15 20:00）
特点：移动云性能最高，其它服务商可用性相对优秀，稳定。
原因：可能此时移动云用户流量较大，服务器负载也比较大，移动云服务商可能受到限流影响。
时段（2025/5/17 0:00 – 2025/5/18 8:00）

特点：阿里云百炼得推理速度是最快的，均达到了40tokens/s。
原因：可能此时用户流量较少，服务器负载较低，能够为每个请求分配更多资源。

各服务商API

各服务商 API 整体性能分析：

DeepSeek 官方
可用性：可用性小幅度，从较差逐渐改善至良好。
整体性能：在可用性提升的同时，性能表现也逐渐优化，整体时间指标表现优秀。

天翼云
可用性：整体波动较小，表现稳定，大部分时间维持在95%以上。
性能：在各时间段内有波动，但整体表现向优秀靠近。

派欧云
可用性：整体波动较小，大部分时间维持在97%以上。
性能：在各时间段内有波动，由小幅度波动到大幅度波动。

火山引擎
可用性：小幅度波动，最差在96%，其余时间均在98%以上。
性能：前期比较稳定，后续有小幅度的波动。

硅基流动
可用性：整体表现良好。
性能：整体表现良好。

移动云
可用性：可用性相对较差，最低在93%左右。
性能：整体性能波动较大，最高在41s左右，最低在22s左右。

联通云
可用性：可用性是最差的，最低时在70%。
性能：相对波动较大。

腾讯云

可用性：整体表现良好，小幅度波动。

性能：前期相对稳定，后期有小幅度波动。

阿里云百炼
可用性：小幅度波动，后期比前期波动大。
性能：有小幅度波动。

本次评测的测试工具、指标采集、测试厂商、测试参数等详情如下：

测试工具及指标采集

1. 测试工具：基调听云拨测平台

2. 采集指标：
●通过API返回的数据计算出来的指标包含：平均速度(tokens/s)、首 Token 时间(s)、推理速度(tokens/s)、生成速度(tokens/s)。

●通过听云拨测客户端计算的指标包含：DNS 时间(s)、建连时间(s)、握手时间(s)、发出请求时间(s)、首包时间(s)、剩余包时间(s)、性能(s) 和可用性(%)。

3. 测试节点：北京/上海/广州/深圳/重庆/苏州/成都/杭州/武汉九地移动/电信/联通三大运营商，模拟27个终端用户。

4. 任务属性：任务绑定（相同频率，相同监测点）。

5. 大模型相关的测试指标和计算方式参考了公众号“赛博禅心”文章“务实测试：DeepSeek 各家 API 真实速度”中提到的测试脚本。

测试厂商

腾讯云、阿里云、火山引擎、DeepSeek 官方和硅基流动

测试参数

●测试频率：1小时
●测试周期：2025/05/14 00:00 – 2025/05/21 00:00
●测试 Prompt：9.9和9.11这两个数哪个更大？请在结果中只输出比较大的那个数，并放在两个”#”符号之间。
●期望响应格式：#9.9#

指标定义

（1）模型性能指标
● 首 Token 时间：从请求发起至模型返回第一个有效 Token 的时间间隔 (单位：s)。
● 推理速度：模型推理阶段的平均速度 (单位：tokens/s)。
● 生成速度：模型生成阶段的平均速度 (单位：tokens/s)。
● 平均速度：模型推理和生成两个阶段的整体平均速度 (单位：tokens/s)。
（2）网络指标
● DNS：通过域名解析服务，将指定的域名解析成 IP 地址的消耗时间。
● 建连：浏览器和 Web 服务器建立 TCP/IP 连接的消耗时间。
● SSL：浏览器和 Web 服务器建立安全套接层 (SSL) 连接的消耗时间。
● 首包：浏览器发送 HTTP 请求结束开始，到收到 Web 服务器返回的第一个数据包的消耗时间。
● 剩余包：浏览器接收 Web 服务器返回的第一个数据包到元素数据接收结束的消耗时间。
● 性能（总下载时间）：监测一个页面总的消耗时间，即从开始监测到监测结束的时间。
● 可用性：时间范围内，目标服务能够被正常访问的次数与总访问次数的比值。
（3）分析维度
● 运营商：移动/电信/联通。
● 城市：北京/上海/广州/深圳/重庆/苏州/成都/杭州/武汉。
● 目标主机（基于 API 服务的暴露的 IP 地址）。

测试工具及指标采

本次测评旨在为开发者提供深度数据支撑，助力其精准洞察各服务商 API 接口的性能表现，从而有针对性地优化产品体验。对于开发者和企业用户而言，这些数据可以作为服务商选择的决策依据，可以依托本次测评数据，更科学地甄别适配自身需求的技术方案，有效提升调用效率，大幅降低响应延迟，全方位增强整体服务质量。
对于普通用户来说，如果您只想直接使用 DeepSeek-R1 的深度思考能力，我们推荐您使用网页版的服务，为此我们整理了以下支持 DeepSeek-R1 的第三方服务及相关网站，供参考：

名称及网址

是否收费

注册方式

腾讯元宝

https://yuanbao.tencent.com

免费和付费两种模式

免费用户：可使用部分基础功能，如AI对话、搜索等，但功能和体验可能受限。

付费用户：可享受更多高级功能，如更快的响应速度、更精准的搜索结果等，具体收费标准和功能差异需参考官方信息。

微信、手机号、QQ

国家超算互联网

https://chat.scnet.cn

通常是付费的。用户根据计算资源的使用量、时长和服务类型支付费用，具体收费标准因超算中心和项目而异。

部分科研项目或教育用途可能享有优惠或免费政策

免登录免注册，直接点击“长思考R1”按钮即可使用

秘塔AI搜索

https://metaso.cn

免费用户每天可使用100次 R1

直接微信扫码或者手机验证登录

纳米搜索

https://www.n.cn

提供“R1-360高速专线”，有免费体验次数，超量部分需购买纳米

手机号码或邮件注册

AskManyAI

https://www.askmanyai.cn/login

注册后选择“DeepSeek-R1 满血版”即可使用

手机号码即可注册

百度千帆

https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list

免费和付费

● 免费额度：新用户通常可获得一定量的免费资源，用于体验和测试。

● 付费服务：超出免费额度后，按实际使用的资源（如计算、存储、API 调用等）收费，具体价格可在官网查询。

需百度账号，学生认证有优惠

火山引擎

https://console.volcengine.com/ark/region:ark+cn-beijing/experience

新用户送100次免费调用

可用手机号、邮箱、抖音、头条、飞鼠、穿山甲、巨量引擎账号登录

英伟达认证站

https://build.nvidia.com/deepseek-ai/deepseek-r1

付费

1. 认证费用：硬件和软件需通过英伟达认证，可能产生相关费用。

2. 产品购买：认证站使用的英伟达硬件（如GPU）需额外购买。

3. 服务支持：部分高级技术支持或培训可能收费。

需要英伟达账号，国内访问较慢，适合开发者

AI智慧岛

https://chat.lify.vip/chat

免费和付费

● 免费服务：用户可体验部分基础功能，如简单的 AI 工具或资源。

● 付费服务：高级功能、更多计算资源或定制服务可能需要付费，具体费用因服务类型和使用量而异。

微信扫码关注公众号即可

微信搜一搜

无网址

微信搜一搜正在灰度测试“AI搜索”功能，部分用户进入微信搜索页面后，可点击由 DeepSeek-R1 提供的“深度思考”选项。

目前测试中

Sider ai

https://sider.ai/

登录即可每天获得30个免费积分

手机号、Google账号、Apple账号

推荐阅读

api监控平台
在数字化时代,应用程序接口(API)已成为企业间和内部协同工作的核心。api不仅在连接不同系统间扮演着重要角色,同时也为企业提供丰富的数据和功能支持。然而,随着api的大量使用,如何确保其稳定性和可靠性已成为企业面临的一大挑战。这时,api监控平台便发挥至关重要的作用。

2023-09-19

继续阅读
企业如何实现高效的可视化运维管理？
可视化运维管理在企业中的应用越来越广泛，因为它可以帮助企业更加高效地管理运维工作，提高工作效率。然而，如何实现高效的可视化管理是一个复杂的问题，很多企业都只知其一，下面将介绍几种可以帮助企业实现高效运维管理的方法，让企业在市场竞争中脱颖而出。

2023-03-30

继续阅读
简易网络性能监控
随着信息技术的飞速发展，网络已经成为企业日常运营中不可或缺的一部分。为了确保网络的稳定运行和高效性能，企业需要对网络进行持续的性能监控。然而，对于许多中小企业来说，高昂的网络监控设备和维护成本是他们难以承受的负担。因此，简易网络性能监控应运而生，它以低成本、高效率的特点，为企业提供了一种经济实惠的网络性能管理解决方案。

2023-12-12

继续阅读

APM应用监控
随着数字化时代的不断发展，各类应用逐渐渗透进了大众生活的各方各面，而如何保证应用稳定运行并为用户提供良好体验便成为了企业关注的热点，因此，APM应用监控便走进了我们的视野。APM应用监控作为一种全方面监控应用性能的解决方案，正在逐渐成为企业和开发团队不能缺少的重要工具，为越来越多企业提供便利和帮助。

2023-10-10

继续阅读
系统运维监控软件
随着信息化的快速发展，企业对计算机系统的稳定运行和网络安全的需求越来越高。系统运维监控软件也在逐渐成为企业管理和维护计算机网络的重要工具，不仅可实时监控服务器、网络设备和应用程序的运行状态，还可发出预警信息。下面将讲解其作用。

2023-11-22

继续阅读

《大模型服务性能评测 DeepSeek-R1 网站版》第二期

《大模型服务性能评测 DeepSeek-R1 网站版》第二期

能力

关于

工具