1.英伟达 dpu

老黄对token密集型任务下手了刚刚,在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX GPU

英伟达新GPU,超长上下文/视频生成专用(插图

2.英伟达最新gpu

老黄表示:Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万token而且,RubinCPX还能让你越用越省钱:每投资1亿美元,就能获得50亿美元的token收益。

3.英伟达ddu

(50倍,你就赚吧,老黄说的)对于“老黄画的饼”,Cursor、Runway、Magic等行业大佬也表示RubinCPX将分别在代码生产力、生成式影像创作、以及大模型自主代理上带来突破那么好了好了,这GPU到底什么来头?。

4.英伟达插帧

首款专为超大上下文AI打造的CUDA GPURubin CPX基于NVIDIA Rubin架构,采用单片设计,内置NVFP4计算资源,主打AI推理的高性能和高能效它的性能提升,主要体现在以下几个方面:在NVFP4精度下可提供高达

5.英伟达涨幅

30PFLOPS算力,做到性能与精度兼顾配备128GB高性价比GDDR7内存,应对最苛刻的上下文工作负载– 与NVIDIA GB300 NVL72系统相比,注意力机制处理速度提升3倍,让模型在处理更长上下文序列时也不掉速。

6.英伟达新功能

在这里,我们可以简单地拿A100来对比一下在算力方面,相较于A100的FP16精度,Rubin CPX专门优化过的NVFP4可以实现几个量级的性能提升而在内存方面,NVIDIA A100是40GB

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。