周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利润率等关键数据,引发行业震动。

  数据显示,若按理论定价计算,其单日成本利润率高达545%,这一数字刷新了全球AI大模型领域的盈利天花板。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实。

  DeepSeek最新发布

  3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

  文章写道:“DeepSeek-V3/ R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

  为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

  值得注意的是,文章还率先披露了DeepSeek的理论成本和利润率等关键信息。

  根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

  另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

  在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?

  不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

  计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

  全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

  简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

  DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

  影响多大?

  有分析称,DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,更为行业树立了高效盈利的标杆:其模型训练成本仅为同类产品的1%—5%,此前发布的DeepSeek-V3模型训练成本仅557.6万美元,远低于OpenAI等巨头;推理定价优势方面,DeepSeek-R1的API定价仅为OpenAI o3-mini的1/7至1/2,低成本策略加速市场渗透。

  业内分析指出,DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。DeepSeek此次“透明化”披露,不仅展示了其技术实力与商业潜力,更向行业传递明确信号:AI大模型的盈利闭环已从理想照进现实,标志着AI技术从实验室迈向产业化的关键转折。

  中信证券认为,Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效应以及单位算力成本降低对应的杰文斯悖论等,均意味着中短期维度科技巨头继续在AI算力领域进行持续、规模投入仍将是高确定性事件。

  本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

  来源:券商中国

  声明:数据宝所有资讯内容不构成投资建议,股市有风险,投资需谨慎。

  责编:林丽峰

本文来自作者[丹艳庆]投稿,不代表运输号立场,如若转载,请注明出处:https://xn--5nq41wa3486cyiaxc.cn/txbk/202504-2238.html

(21)

文章推荐

  • 马化腾最新发声

      2月17日,民营企业座谈会在北京召开。20日,在参加此次民营企业座谈会后,腾讯公司董事会主席兼首席执行官马化腾说,再次面对面谈心,给企业家加油鼓劲,充分展现了对民营企业家群体的深切关怀,让我们深感振奋、信心倍增。  马化腾表示,民营企业座谈会上的重要讲话让民营企业家们进一步坚信,随着改革开放的

    2025年02月21日
    25
  • flash9FLASH90和flash34区别

    最新版本的AdobeFlashPlayer9是什么?1、最新版本的AdobeFlashPlayer9是一款多媒体播放软件。以下是详细的解释:AdobeFlashPlayer9是Adobe公司开发的最新版本的Flash播放插件。作为一款多媒体播放软件,它能够播放各种格式的Flash动画、

    2025年02月28日
    27
  • 金蝶国际现涨超8% 野村将目标价由11港元上升至19港元

      金蝶国际(00268)股价上涨8.48%,现报13.82港元,成交额5.32亿港元。  近日,金蝶国际宣布成立卡塔尔公司,进军中东市场。自2023年12月份卡塔尔投资局向金蝶投资约2亿美元后,金蝶与卡塔尔的合作不断深化。金蝶计划以卡塔尔为桥头堡,拓展在中东和北非市场的业务,助力当地企业数字化

    2025年03月03日
    13
  • 英特尔股价盘后飙升 此前任命新CEO

      英特尔任命Lip-BuTan为首席执行官,接替临时联合首席执行官DavidZinsner和MichelleJohnstonHolthaus。  调整将于3月18日生效,Tan也将在2024年8月离开后重新加入英特尔董事会。  Zinsner将继续担任执行副总裁兼首席财务官,Holth

    2025年03月13日
    12
  • 银行密集下调优先股股息率,有何影响?

      炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!  来源:国际金融报  近期,多家银行下调优先股票面股息率。  《国际金融报》记者梳理各家银行公告发现,自2024年以来,至少已有浦发银行、农业银行、长沙银行、兴业银行等8家机构在新的股息率调整期内将优先股票面股息率下

    2025年03月13日
    23
  • 刀剑新手卡刀剑新手游

    刀剑英雄至尊新手卡怎么领取1、刀剑英雄庙会第一礼包在哪里领取库奇,com刀剑英雄签到礼包去游戏领取5:59:510,活动期间,已签到4天的玩家可在页面领取预测姓名礼品卡;新服务开通后,玩家可在新服务礼品专员中点击新手卡激活卡片,获得新服务特权包;赤龙丹此礼包只能在新服领取使用,物品绑定;

    2025年03月15日
    15
  • 电子签隐身放贷涉事人人信涉民间借贷纠纷

    专题:2025年金融315投诉曝光台  央视315晚会曝光电子签里的隐身放贷人问题,人人信(天津)科技有限公司被点名。天眼查App显示,人人信(天津)科技有限公司成立于2015年8月,法定代表人为马俊,注册资本2260万人民币,经营范围包括会议及展览服务、数据处理服务、企业管理咨询等,由马俊全资持

    2025年03月16日
    15
  • 颈椎病防治指南:守护颈椎健康颈椎病的预防健康教育宣教视频

    如何防治颈椎病1、(一)康复操康复操可改善患者颈部的血液循环,松解粘连和痉挛的软组织。颈椎病康复操中不少动作对颈椎病有独特疗效;无颈椎病者可起到预防作用。姿势:两脚分开与肩同宽,两臂自然下垂,全身放松,两眼乎视,均匀呼吸,站坐均可。双掌擦颈十指交叉贴于后颈部,左右来回摩擦100次。2、交替按摩

    2025年03月20日
    20
  • 突发!基辅遭大规模袭击!知情人士:美乌将在沙特先谈!俄军:在库尔斯克一线打击乌军

    每经编辑毕陆名据新华社23日消息,23日凌晨0时15分,乌克兰首都基辅市陆续传出爆炸声。记者在基辅市第聂伯罗区看到,乌军防空火力对低空飞行的无人机实施了拦截。据记者观察,俄军无人机群在基辅市上空盘旋近一个小时。在第聂伯罗区,记者清晰听到多架无人机低空盘旋的轰鸣声,在探照灯协助下,乌军防空火力对

    2025年03月23日
    10
  • 体育消费 热在当下热在未来 热门赛事激活消费生态

    ◎记者杨翔菲上周末,热门体育赛事好戏连台:在上海,2025F1中国大奖赛于位于嘉定区的上海国际赛车场举行,F1赛事热浪与城市消费同频脉动,文体商旅展多业态联动;在武汉,4万名马拉松爱好者穿越汉口、长江大桥等赛道,并有力拉动了当地消费。借助出圈赛事,多地正将体育流量转变为消费增量。上海体育大

    2025年03月26日
    19

发表回复

本站作者后才能评论

评论列表(4条)

  • 丹艳庆
    丹艳庆 2025年04月05日

    我是运输号的签约作者“丹艳庆”!

  • 丹艳庆
    丹艳庆 2025年04月05日

    希望本篇文章《周末,DeepSeek扔出“王炸”首次披露了成本利润率 影响多大?》能对你有所帮助!

  • 丹艳庆
    丹艳庆 2025年04月05日

    本站[运输号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 丹艳庆
    丹艳庆 2025年04月05日

    本文概览:  周六,国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章,不仅公开了其推理系统的核心优化方案,更是首次披露了成本利...

    联系我们

    邮件:运输号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们