英伟达黄仁勋:“新架构,芯片买得越多越省”

9月25日消息(茜茜)没有挤牙膏,英伟达又在游戏、汽车芯片、专业视觉领域放出“核弹群”。当地时间9月22日,英伟达2022秋季GTC大会上,英伟达发布一系列重磅新品。

具体包括GeForce RTX 40系列、用于自动驾驶、医疗仪器、机器人等领域的“雷神”Thor芯片、全新架构Ada Lovelace、提升图像质量和性能的DLSS 3技术、第二代OVX计算系统、为创作者和设计师服务的RTX 6000 GPU、针对数据中心的L40 GPU等。

此次,GeForce RTX 40基于英伟达全新架构Ada Lovelace。据英伟达CEO黄仁勋介绍,Ada Lovelace改进了所有三个RTX处理器,即神经渲染引擎。在Ada Lovelace架构下,相同功耗,Ada Lovelace比上一代架构Ampere带来两倍性能提升。

在Ada Lovelace架构支持下,GeForce RTX 40系列具有83 TFLOPS着色器能力,吞吐量超过上一代产品两倍;RT Cores有效光追踪计算能力达到191 TFLOPS,是上一代产品2.8倍;Tensor Cores具有1.32 Petaflops的FP8张量处理能力,超上一代五倍......

据了解,RTX 4090采用台积电4nm制程工艺和美光科技的G6X存储芯片,其含760亿个晶体管、16384个CUDA核心和24 GB GDDR6X显存,最大boost频率2.52GHz,官方售价12999元起。RTX 4080则拥有16GB和12GB两个版本。

其中,16GB版本在现代游戏中性能达到RTX 3080 Ti的两倍,两款售价分别为9499元起、7199元起。

另一个重磅更新来自于“雷神”Thor芯片。去年,英伟达刚刚发布完算力为1000TOPS的Atlan。今年,英伟达直接略过Atlan,取而代之发布了一款算力更高的“雷神”Thor芯片,算力达到惊人的2000TOPS。

黄仁勋表示,Thor搭载了700亿个晶体管,Thor吞吐量是Atlan两倍,交付性能也是Atlan两倍以上,Thor强悍性能基于Grace、Hopper、Ada Lovelace三种架构。“平台集Hopper的Transformer Engine,基于Grace GPU、Ada GPU于一身。”

显然,Thor定位和功能也更加综合,未来或将实现汽车主动安全、停车、驾驶员监测、摄像头后视镜、集群和车载信息娱乐等功能计算设备控制的“大一统”。

黄仁勋称,“Thor可以配置多种模式,算力可全部用于自动驾驶工作流,也可以将其配置为一部分用于驾驶舱AI和信息娱乐,一部分用于自动驾驶。”

此外,依托于Ada Lovelace架构的DLSS 3技术,具有高于传统渲染四倍的性能和响应速度,具有光学多帧生成功能,可以生成全新帧。新光流加速器可以分析两帧连续的游戏图像,并计算帧到帧中物体和远速的运动矢量数据。英伟达还宣布H100 GPU全面投产,未来几周陆续发货。

其实,可以发现,无论是GeForce RTX 40、RTX 6000 GPU,还是DLSS3技术、OVX计算系统、L40均基于英伟达的新架构Ada Lovelace。会后,中国区高级技术市场经理施澄秋对媒体详细介绍了此次发布会的技术亮点。

施澄秋介绍,英伟达全新Ada Lovelace架构无论在半导体规模、制程、设计,还是内部核心,整个架构、核心数量、算力、显存带宽、VP处理器部署规模都不一样。“许多Partition、Layout、三大功能处理器均有全新布局和变化。”

“相同面积下可以放更多晶体管,或者增大面积同时引入新半导体制程,同时功耗会大幅度降低。所以,新的架构下,用得越多,功耗反而可能会降得更低,即相同算力下性能功耗比两倍提升。”

施澄秋进一步对解释,基于Ada Lovelace架构,RTX 6000、L40性能提升,因为单体性能提升更多,更加便于数据中心集群服务器部署。同时,对算力网和云厂商而言也要确保整个场地、电力、带宽、延迟都有相应配套的提升。

随着算力和性能的提升,在企业级专业可视化运算领域,英伟达能更好地满足专业可视化用户对图像编解码性能的巨大需求。“广播、传媒、娱乐需要实时处理4K、8K视频流,而英伟达这一代产品有大规模三路Encoder和三路Decoder,3+3架构,整个视频处理核心增量可以称为‘超大杯’。”

此外,复杂的图像计算和编解码性能,离不开大规模本地显存部署。相比于消费级产品轻量化的特征,企业级市场上,英伟达依旧采用48GB GDDR6部署。施澄秋认为,企业级产品魅力在于支持ECC校验,拥有超大本地显存,无需导入超大规模3D建模、模拟、渲染AI数据资产和数据集等。

技术解析会上,施澄秋重点推介了英伟达Omniverse平台,以及Omniverse开发工具几项重大更新。在施澄秋看来,Omniverse平台承载了数字孪生、5G、6G、智能工厂、智慧城市、VR/AR、机器人、物联网等以往我们算力难以企及的应用场景。

据悉,英伟达GTC2021大会上,发布聚焦于仿真以及可视化的云原生平台Omniverse后,在功能和生态上持续更新。今年年初,英伟达刚对Omniverse平台上Create、Machinima、Showroom等应用进行更新,并宣布将推出更新版本View。

本次秋季GTC大会上,英伟达发布了针对虚拟形象的Avatar Cloud Engine技术,高清多人大容量视频会议Maxine SDK,基于云原生Omniverse一系列的开发工具、数据存储、数据调度,全新云原生Omniverse Cloud进展。目前,已经有包括WPP、Lowe、德国国家铁路等通过Omniverse构建数字孪生模型。

值得注意的是,2022秋季GTC大会上,英伟达特别提出GDN的新概念,GDN概念由CDN概念衍生而来。CDN顾名思义,Content Delivery Network,当用户打开电商、短视频等互联网平台时,服务器分布在国内各个地方,在通过用户所在网络和路由自动选择距离最近、网速最快、带宽影响最小的服务器传输内容。而GDN则是英伟达提供高品质、Premium图形运算流,能够让用户在边缘设备上获得体验。

“英伟达收购了很多有潜力的厂商,比如中国的DeepMap,导入英伟达的Drive Sim,可以在Omniverse更好地完成自驾车元宇宙数字孪生的路训、测试等。再比如,今天OVX服务器采用Omniverse的网络平台、网络技术构建元宇宙的数据传输,大规模、大带宽的数字资产调度,并利用直接接入的方式。这些厂商都在Omniverse上扮演着重要角色。满足用户的需求,更好地使用英伟达已有的资源是英伟达的收购逻辑。”施澄秋说。

 

热门相关:蜜宠甜妻:楚少的迷糊小娇妻   反派王妃上位指南   天才宝宝特工娘亲   恶魔专属:小可爱,超凶的   嫡妃不乖,王爷,滚过来!