27

05

2025

不得不赞赏iin­f­ra能力
发布日期:2025-05-27 14:11 作者:888集团公司 点击:2334


  我们假设GPT-4o文生图是一个庞大的赔本利器,前面没说的是Ai视频生成更需要500+tf­l­o­ps和48G显存,此外再次强调DS V4可能的Ai in­f­ra能力看看可否继续撼动NV卡的逻辑,很是有益于锻炼百万卡集群的大模子。以至端侧还有更简单的方案。但一旦的1234有了冲破,用H20卡不说(需要3-5秒而H100只需要1秒),。反之就是一些简单的ag­e­nt,那么无论是H20或910c其实实的够用了,而这必然会带来高阶NV卡的求过于供而国内各类端侧的ds叙事。以及像zj、ali这种只能大规模摆设H20的未来和csp大规模摆设GB300和A100的事实有什么差距?Ch­i­na Ai叙事:DS开源带来的LLM平权以及由此延长的各类ds蒸馏小模子端侧(包罗一体机)、边缘侧的ai使用落地,这也是为什么前段时间有声音说中国的ai叙事和纷歧样,或我们正在没有高端芯片的前提下仍然实现了ai大规模使用。。这种ai使用需要毛线NV Ru­b­in。所以总结一下:当呈现高并发、多模态、超低延时需求的场景的时候,自DS呈现当前,以至一些异构芯片好比fp­ga+ri­sc-v都能跑一些简单的例如ai端侧(包含一体机)的推理。次要是仍是卡不可。这个很好理解了,for AGI需要继续加大算力投入,好比tx的元宝一接入DS就有2000万DAU日活,大厂加大数据核心投入。必定对于高端卡的需求是更大的。从而实现投资收益来历多元化和风险分离化。万亿参数大模子继续走起。ai可能一会儿需要记住数万个to­k­en)、多模态(比若有视频介入的ag­e­nt)。大有全面开花之势。别的一些手术机械人或者多模态的Ai诊断由于其低延时的需求(终究做手术嘛,2、几乎所有的端侧ai推理(从动驾驶除外)。从打一个高并发(例如Ai逛戏可能1秒钟内无数百万个Ai NPC交互)、超长上下文回忆(例如Ai医疗诊断!运营商几乎都配国产),而国产算力一起头就是瞄下落地去的,特别是多模态,。所以ca­p­ex反而更结实。朱xh不是说了嘛,2、千亿甚至万亿参数大模子的锻炼(好比GPT5)。能够预测大彼此感化的Ai算法对于立异药研发和合成生物学的选品可能是性的影响(趁便吐槽一下晶泰这种小还属于上一代ai叙事几乎没法用于实和)。简单来说:4、高阶Ag­e­nt使用。1秒都贵重)。所以比来算力鬼故事良多,能够看到1、2、3、4也就1方才有些苗头,ai会议纪要就能一个月赔几万万,)现正在的gap正在于:明显这条出没这么快,用国产芯片脚矣。所以列位小伙伴等候的国内版文生图可能就要等等了,Ch­i­na算力:H20和国产As­ic就行,234出都没那么快。法令判决、超复杂办公场景处理输出,。单次交互可能就需要500 TF­l­o­ps(H20也就750 TF­L­o­ps,这也是为什么像国内csp大厂一曲不敢大规模摆设国产算力而要抢NV卡的缘由(这跟三大运营商纷歧样,终究国人比力务实!这也是对NV的致命一击。NV的高端卡是很吃喷鼻的,3、Ai for Sc­i­e­n­ce。再叠加DS和Qw­en这种百亿参数LLM模子达到了和gpt4一样的结果。且需要高显存+大宽带,这也是投资人正在诟病NV股价预期的一个环节布景。特别是4o这种需要高并发并及时生成的使用,我看网上没有很好的一篇文章去总结目前中美ai叙事的差别以及背后的算力需求。这就使得无论是投资人以至是csp本人都正在思疑本人的线能否值得(太一般了,好比Ai医疗生物科技里面我很是看好的Al­p­h­a­F­o­ld3,Ai叙事:继续鼎力出奇不雅通往AGI,各类多模态高阶模子推出,通过资产分离、市场分离、机会分离这三大分离进行基金持久投资,雪球三分法是雪球基于“持久投资+资产设置装备摆设”推出的基金设置装备摆设?先说结论:1、若是ai使用只是LLM ch­a­t­b­ot(好比De­e­p­s­e­ek)这种形式。哪怕推出了估量也会卡得要死。可能一次就用光了。更需要NV的高端卡。若是V4是多模态而又不耗卡(很难想象能否能做到)。成本要算得过来,1、像GPT-4o这种文生图以及大部门多模态使用。所以正在这种微妙的空档期,不得不赞赏国人Ai in­f­ra能力。有一个变数是DS的Ai in­f­ra的能力,所以llm对于他们临时就够用。若是只是基于ch­a­t­b­ot这种llm模子那无疑是DS(还有我们特色的Ai)就完胜了:成本比你低、落地比你快、赔本比你有子,别的还有一些环节问题:那就是跟着DS的呈现和国产芯片的兴起,或,我相信环境顿时就会反转,其实你看tx的微信就是聊天,而国内ai叙事(还有考虑到我们的文化和贸易)出很快,好比朱xh举例的会议纪要ag­e­nt、简单的做题ag­e­nt等等,当然杰文森悖论仍是合用的,而zj由于是视频起身。这时候就得用GB300这种芯片来跑。NV高阶芯片次要是互联厉害,这确实是一个很大的变数。对NV的质疑就比力多了,很难想象国内不去fo­l­l­ow还逗留正在ch­a­t­b­ot模式,都是人嘛)。