你的位置：开云登录入口登录APP下载(中国)官方网站 > 新闻动态 > 开yun体育网跟着国产卡的适配跟进-开云登录入口登录APP下载(中国)官方网站

开yun体育网跟着国产卡的适配跟进-开云登录入口登录APP下载(中国)官方网站

时间：2026-04-26 00:59 点击：78 次

　　华泰证券合计，DeepSeek通过优化推理资本，有望推进LLM买卖化期骗加快。基于此，看好推理需求开释带动IaaS作事商稼动率提拔，云厂商有望受益。其次，考虑到R1带来模子才调提拔的同期又可达成低资本部署，有望带动AI期骗加快渗入。临了，尽管当今DeepEP仍需要在Hopper+CUDA+NVLink的框架下达成，但中恒久来看，跟着国产卡的适配跟进，时间有望向更多国产生态迁徙，国产AI算力板块有望迎来成长机遇。

　　全文如下

　　华泰 | 狡计机：DeepSeek - EP降本，温柔期骗与算力

　　2025年3月1日，DeepSeek发布《One More Thing, DeepSeek-V3/R1 Inference System Overview》，其中提到通过大模子跨节点巨匠并行，DeepSeek达成了$87,072/天的低资本推理，有用算力获得权臣提拔。咱们合计，跟着国产算力硬件逐步适配DeepEP体系，DeepSeek模子或通过性价比上风带动推理需求开释，国产算力有望加快成长。

　　中枢不雅点

　　中枢亮点：推理资本大幅缩短，理念念景况下15%付费率即可盈亏平衡

　　据DeepSeek，V3和R1推理作事占用节点总数，峰值占用为278个节点，平均占用226.75个节点，DeepSeek假设GPU租出资本为2好意思金/小时，总资本为$87,072/天。此外，在2025/02/27 12:00 PM至2025/02/28 12:00 PM，V3和R1模子推理蹧跶Token 776B（输入608B+输出168B），平均每百万Token惩办资本为0.11好意思元。DeepSeek假设淌若总共Tokens一起按照DeepSeekR1的订价狡计，表面上一天的总收入为$562,027，资本利润率545%。但考虑到当今DeepSeek仅通过API收费，闾阎们测算若按照R1收费订价，付费Token占总Token的15%即可达成推理历程的盈亏平衡。

　　中枢时间：通过EP达成更高的朦拢量和更低的蔓延

　　DeepSeek-V3 / R1 推理系统的优化打算是：更大的朦拢，更低的蔓延。为了达成这两个打算，DeepSeek的有打算是使用大畛域跨节点巨匠并行（Expert Parallelism/EP），并开源了DeepEP代码。具体来看，中枢才调包括：1）大畛域跨节点巨匠并行：给与了预填充-解码剖析架构，不同阶段同期进行多个巨匠并行狡计；2）狡计/通讯重迭：将GPU中的SM（流多惩办器）远隔为狡计、通讯两部分，各自同期扩充相应责任负载，减少蔓延恭候时间；3）负载平衡：通过预填充负载平衡、解码负载平衡、巨匠并行负载平衡，尽可能地为每个 GPU 分拨平衡的狡计负载、通讯负载。

　　中枢原因：推理订价/资本的互异或为外部算力供应受限的限度

　　对比来看，外洋模子如OpenAI o3-mini在推理订价方面较DeepSeek更贵，如每百万Token输入的价钱为$0.55（缓存掷中），而R1为$0.14。咱们合计，API订价的互异或有尽头一部分来自于推理资本的互异，DeepSeek或凭借EP等更极致的软硬件优化，达成推理资本的省俭。咱们合计，这一得意的背后，反应的是国表里算力供应以及产业标的的互异。国内大模子厂商在算力供给受限的配景下，通落伍间优化的款式不休压榨硬件性能，在有限的算力下达成最优的模子后果。基于此，咱们合计，国内模子有望凭借性价比上风，带动下贱买卖化期骗，达玉成国市集的份额提拔。

　　中枢受益：DeepEP开源有望开释推理需求，温柔期骗与算力

　　咱们合计，DeepSeek通过优化推理资本，有望推进LLM买卖化期骗加快。基于此，咱们看好推理需求开释带动IaaS作事商稼动率提拔，云厂商有望受益。其次，考虑到R1带来模子才调提拔的同期又可达成低资本部署，有望带动AI期骗加快渗入。临了，尽管当今DeepEP仍需要在Hopper+CUDA+NVLink的框架下达成，但中恒久来看，跟着国产卡的适配跟进，时间有望向更多国产生态迁徙，国产AI算力板块有望迎来成长机遇。

　　风险辅导：AI时间迭代不足预期；AI买卖化不足预期；本敷陈基于客不雅信息整理开yun体育网，不组成投资薄情。