GTC2023黄仁勋:人工智能正在经历iPhone时刻
作者:CBISMB 责任编辑:张金祥 2023-03-22 01:47:44 来源:ISMB 关键字:GTC 2023 黄仁勋ChatGPT 只是一个开始
NVIDIA 创始人兼首席执行官黄仁勋宣布,随着计算技术“光速”发展,NVIDIA与谷歌、微软、甲骨文和一系列领先企业建立广泛的合作伙伴关系,为每个行业带来新的人工智能、模拟和协作能力。
“曲速引擎是加速计算,能源是人工智能,”黄仁勋在公司 GTC 会议上的主题演讲中说。“生成式人工智能令人印象深刻的能力让公司产生了一种紧迫感,需要重新构想他们的产品和商业模式。”
在为为期四天的活动做主播的长达78分钟的演讲中,黄仁勋概述了 NVIDIA及其合作伙伴如何为尖端人工智能服务提供从培训到部署的一切服务。他宣布了新的半导体和软件库,以实现新的突破。黄仁勋 透露了一整套系统和服务,供初创企业和企业竞相将这些创新在全球范围内发挥作用。
黄仁勋在他的演讲中用这个生态系统在工作中的生动例子打断了他的演讲。他宣布 NVIDIA 和微软将把数亿 Microsoft 365 和 Azure 用户连接到一个平台,用于构建和操作超现实虚拟世界。他介绍了亚马逊如何使用复杂的模拟功能来训练新的自主仓库机器人。他谈到了新一代广受欢迎的生成式 AI 服务的兴起,例如 ChatGPT。
并强调了 NVIDIA 创新的基础性质,黄仁勋 详细说明了NVIDIA 计算光刻技术的突破将如何与 ASML、台积电和 Synopsis 一起帮助实现新一代高效、强大的 2 纳米半导体。
加速计算和人工智能的到来恰逢其时,摩尔定律放缓,各行业应对强大的动力——可持续性、生成人工智能和数字化,黄仁勋说。“工业公司正在竞相数字化并重塑为软件驱动的科技公司——成为颠覆者而不是被颠覆者,”黄仁勋说。
加速使公司能够应对这些挑战。“加速是回收电力、实现可持续发展和净零排放的最佳方式,”黄仁勋说。
GTC 现已走过第 14 个年头,已成为全球最重要的 AI 盛会之一。本周的会议有来自DeepMind 的 Demis Hassabis、Argonne Labs 的 Valeri Taylor、Adobe 的 Scott Belsky、Netflix 的 Paul Debevec、苏黎世联邦理工学院的 Thomas Schulthess 等领导者的 650 场演讲,以及黄仁勋 和联合创始人 Ilya Sutskever 之间的特别炉边谈话OpenAI 的创始人,ChatGPT 的创建者。
超过 250,000 名注册与会者将深入探讨从恢复 2,000 年前丢失的罗马马赛克到建造未来工厂,从使用新一代大型望远镜探索宇宙到重新排列分子以加速药物发现,到更多超过 70 个关于生成 AI 的演讲。
人工智能的 iPhone 时刻
NVIDIA 的技术是 AI 的基础,黄仁勋 讲述了 NVIDIA 如何参与生成式 AI 革命的初期阶段。早在 2016 年,他就向 OpenAI 交付了第一台 NVIDIA DGX AI 超级计算机——支持 ChatGPT的大型语言模型突破背后的引擎。
ChatGPT 去年年底推出,几乎瞬间成为主流,吸引了超过 1 亿用户,成为历史上增长最快的应用程序。“我们正处于人工智能的 iPhone 时刻,”黄仁勋说。
黄仁勋 报道说,NVIDIA DGX 超级计算机最初用作 AI 研究工具,现在在世界各地的企业中全天候运行,以提炼数据和处理 AI。一半的财富 100 强公司都安装了 DGX AI 超级计算机。
“DGX超级计算机是现代人工智能工厂”黄仁勋说。
NVIDIA H100,Grace Hopper,Grace,用于数据中心
黄仁勋 说,部署像 ChatGPT 这样的 LLM 是一个重要的新推理工作负载。对于像 ChatGPT 这样的大型语言模型推理,黄仁勋 宣布了一款新的 GPU——具有双 GPU NVLink 的 H100 NVL。
基于 NVIDIA 的 Hopper 架构,H100 具有一个 Transformer Engine,旨在处理模型,例如为 ChatGPT 提供动力的 GPT 模型。与用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 和双 GPU NVLink 的标准服务器速度提高了 10 倍。
“H100 可以将大型语言模型处理成本降低一个数量级,”黄仁勋说。
与此同时,在过去十年中,云计算每年增长 20%,成为一个价值 1 万亿美元的产业,黄仁勋 说。NVIDIA 为 AI 和云优先的世界设计了 Grace CPU,其中 AI 工作负载由 GPU 加速。Grace 现在正在抽样,黄仁勋 说。
NVIDIA 的新型超级芯片 Grace Hopper 通过高速 900GB/秒的连贯芯片到芯片接口连接 Grace CPU 和 Hopper GPU。Grace Hopper 非常适合处理大型数据集,例如用于推荐系统和大型语言模型的 AI 数据库,黄仁勋 解释说。
“客户希望构建大几个数量级的 AI 数据库,”黄仁勋 说。“Grace Hopper 是理想的引擎。”
DGX 人工智能基础设施蓝图
最新版本的 DGX 具有八个连接在一起的 NVIDIA H100 GPU,作为一个巨大的 GPU。“NVIDIA DGX H100 是客户在全球范围内构建 AI 基础设施的蓝图,”黄仁勋 说,并分享了 NVIDIA DGX H100 现已全面投产。
H100 人工智能超级计算机已经上线
Oracle Cloud Infrastructure宣布有限提供具有 H100 GPU 的新 OCI Compute 裸机 GPU 实例
此外,Amazon Web Services 还宣布了其即将推出的 P5 实例 EC2 UltraClusters,其规模最多可扩展至 20,000 个互连的 H100 GPU。这是继Microsoft Azure上周发布其 H100 虚拟机 ND H100 v5 的私人预览版之后。
Meta 现已为其 AI 生产和研究团队在内部部署了由 H100 驱动的 Grand Teton AI 超级计算机。OpenAI 将在其 Azure 超级计算机上使用 H100s 来支持其持续的人工智能研究。
提供 H100 的其他合作伙伴包括 Cirrascale 和 CoreWeave,这两家公司今天都宣布全面上市。此外,Google Cloud、Lambda、Paperspace和 Vult 都计划提供 H100。配备 NVIDIA H100 GPU 的服务器和系统可从领先的服务器制造商购买,包括源讯、思科、戴尔科技、技嘉、惠普企业、联想和超微。
DGX Cloud:立即将 AI 引入每家公司
为了加速初创企业和企业竞相构建新产品和制定 AI 战略的 DGX 功能,黄仁勋 宣布了 NVIDIA DGX Cloud,通过与 Microsoft Azure、Google Cloud 和 Oracle Cloud Infrastructure 的合作,将 NVIDIA DGX AI 超级计算机“带给每一家公司,从浏览器。”
DGX Cloud 经过优化以运行NVIDIA AI Enterprise,这是世界领先的用于端到端人工智能开发和部署的加速软件套件。“DGX Cloud 为客户提供最好的 NVIDIA AI 和世界领先的云服务提供商的最佳服务,”黄仁勋说。
NVIDIA 与领先的云服务提供商合作托管 DGX 云基础设施,首先是 Oracle 云基础设施。Microsoft Azure预计将在下个季度开始托管 DGX Cloud,并且该服务将很快扩展到 Google Cloud 等。黄仁勋表示,这一合作伙伴关系将 NVIDIA 的生态系统带给了云服务提供商,同时扩大了 NVIDIA 的规模和范围。企业将能够按月租用 DGX Cloud 集群,确保他们能够快速轻松地扩展大型多节点训练工作负载的开发。
增压生成人工智能
为了加快那些寻求利用生成式 AI 的人的工作,黄仁勋 宣布了 NVIDIA AI Foundations,这是一个云服务系列,适用于需要构建、改进和操作自定义 LLM 的客户,以及使用其专有数据训练的生成式 AI 以及针对特定领域的任务。
AI Foundations 服务包括用于构建自定义语言文本到文本生成模型的 NVIDIA NeMo;Picasso,一种视觉语言模型制作服务,适用于希望构建使用许可或专有内容训练的自定义模型的客户;和 BioNeMo,以帮助价值 2 万亿美元的药物发现行业的研究人员。
Adobe 正在与 NVIDIA 合作,为未来的创造力构建一套下一代 AI 功能。Getty Images 正在与 NVIDIA 合作训练负责任的生成文本到图像和文本到视频基础模型。Shutterstock 正在与 NVIDIA 合作训练生成式文本到 3D 基础模型,以简化详细 3D 资产的创建。
加速医学进步
NVIDIA 宣布 Amgen 正在通过 BioNeMo 加速药物发现服务。此外,Alchemab Therapeutics、阿斯利康、Evozyne、Innophore 和 Insilico 都是 BioNemo 的早期用户。
BioNeMo 帮助研究人员使用他们的专有数据创建、微调和服务自定义模型,黄仁勋 解释说。
黄仁勋 还宣布,NVIDIA 和全球最大的医疗保健技术提供商美敦力 (Medtronic) 正在合作构建软件定义医疗设备的 AI 平台。该合作伙伴关系将为美敦力系统创建一个通用平台,范围从手术导航到机器人辅助手术。
美敦力宣布其GI Genius系统基于实时传感器处理系统的软件库 NVIDIA Holoscan 构建,具有用于结肠癌早期检测的 AI,并将于今年年底左右发货。
“全球价值 2500 亿美元的医疗器械市场正在发生转变,”黄仁勋说。
加速生成人工智能应用程序的部署
为帮助企业快速部署新兴的生成式 AI 模型,黄仁勋 宣布推出用于 AI 视频、图像生成、LLM 部署和推荐推理的推理平台。它们将 NVIDIA 的全栈推理软件与最新的 NVIDIA Ada、Hopper 和 Grace Hopper 处理器相结合——包括今天推出的NVIDIA L4 Tensor Core GPU和NVIDIA H100 NVL GPU 。
• 用于人工智能视频的 NVIDIA L4 可以提供比 CPU 高 120 倍的人工智能视频性能,同时能效提高 99%。
• 用于图像生成的 NVIDIA L40 针对图形和支持 AI 的 2D、视频和 3D 图像生成进行了优化。
• 用于大型语言模型部署的 NVIDIA H100 NVL 非常适合大规模部署 ChatGPT 等大型 LLM。
• NVIDIA Grace Hopper for Recommendation Models 是图形推荐模型、矢量数据库和图形神经网络的理想选择。
谷歌云是第一家向客户提供 L4 的云服务提供商,推出了新的 G2 虚拟机,今天提供私人预览版。谷歌还将 L4 集成到其 Vertex AI 模型商店中。
微软和 NVIDIA 将 Omniverse 带给“数亿”用户
黄仁勋 宣布 NVIDIA 与 Microsoft 合作,将 NVIDIA Omniverse Cloud 这一完全托管的云服务推向全球各行各业,推出第二项云服务以加速企业前所未有的模拟和协作能力。
“微软和 NVIDIA 正在将 Omnivese 带给数亿 Microsoft 365 和 Azure 用户,”黄仁勋 说,同时还推出了新的 NVIDIA OVX 服务器和新一代工作站,这些工作站由 NVIDIA RTX Ada Generation GPU 和英特尔针对 NVIDIA Omniverse 优化的最新 CPU 提供支持。
为了展示 NVIDIA 为 3D 设计协作和数字双胞胎模拟而构建的开放平台 Omniverse 的非凡功能,黄仁勋 分享了一段视频,展示了 NVIDIA Isaac Sim 这一基于 Omniverse 构建的机器人模拟和合成生成平台如何帮助亚马逊节省时间和金钱具有完全保真度的数字双胞胎。
它展示了亚马逊如何努力编排亚马逊第一个全自动仓库机器人 Proteus 的动作,因为它与人类和其他机器人一起将产品箱从亚马逊巨大仓库中的一个地方移动到另一个地方。
将价值3万亿美元的汽车产业数字化
为了说明 Omniverse 的影响力和能力的规模,黄仁勋 深入探讨了 Omniverse 在价值 3 万亿美元的汽车行业数字化方面的作用。黄仁勋说,到 2030 年,汽车制造商将建设 300 家工厂,生产 2 亿辆电动汽车,而电池制造商正在建设 100 多个超级工厂。“数字化将提高行业的效率、生产力和速度,”黄仁勋说。
谈到 Omniverse 在整个行业的采用,黄仁勋 说 Lotus 正在使用 Omniverse 来虚拟组装焊接站。梅赛德斯-奔驰使用 Omniverse 来构建、优化和规划新车型的装配线。Rimac 和 Lucid Motors 使用 Omniverse 从忠实地代表他们汽车的实际设计数据构建数字商店。
BMW 与 Idealworks 合作,在 Omniverse 中使用 Isaac Sim 生成合成数据和场景来训练工厂机器人。黄仁勋 说,宝马正在使用 Omniverse 来规划全球工厂的运营,并正在建设一个新的电动汽车工厂,完全在 Omniverse 中,工厂开业前两年。
NVIDIA 今天宣布,比亚迪将在更广泛的 NEV 中扩展其对NVIDIA DRIVE Orin集中式计算平台的使用。
加速半导体突破
黄仁勋宣布 NVIDIA cuLitho 是一项突破,将加速计算带入计算领域,使 ASML、台积电和 Synopsis 等半导体领导者能够加速新一代芯片的设计和制造,因为当前的生产过程已接近物理学的极限计算光刻。
用于计算光刻的全新 NVIDIA cuLitho 软件库由世界领先的晶圆代工厂台积电和电子设计自动化领导者 Synopsys 集成到其最新一代 NVIDIA Hopper 架构 GPU 的软件、制造流程和系统中。
芯片制造设备供应商 ASML 正在与 NVIDIA 就 GPU 和 cuLitho 密切合作,并计划将对 GPU 的支持集成到他们所有的计算光刻软件产品中。黄仁勋 说,随着光刻技术达到物理极限,NVIDIA 对 cuLitho 的推出使该行业能够迈向 2nm 甚至更远。
“芯片行业是几乎所有行业的基础,”黄仁勋说。
加速世界上最大的公司
世界各地的公司都支持黄仁勋的愿景。
电信巨头 AT&T 使用 NVIDIA AI来更高效地处理数据,并且正在测试 Omniverse ACE 和 Tokkio AI avatar 工作流程,以构建、定制和部署用于客户服务及其员工服务台的虚拟助手。
美国运通、美国邮政服务、Microsoft Office 和 Teams 以及亚马逊是使用高性能 NVIDIA TensorRT 推理优化器和运行时以及多框架数据中心推理服务软件 NVIDIA Triton 的 40,000 家客户之一。
Uber 使用 Triton 每秒提供数十万个 ETA 预测。
Roblox 拥有超过 6000 万的日常用户,使用 Triton 为游戏推荐模型提供服务、构建头像以及管理内容和市场广告。
微软、腾讯和百度都在采用 NVIDIA CV-CUDA 进行 AI 计算机视觉。该技术处于公开测试阶段,可优化预处理和后处理,将成本和能源节省 4 倍。
帮助完成不可能的事
黄仁勋 在结束演讲时感谢了 NVIDIA 的系统、云和软件合作伙伴,以及研究人员、科学家和员工。
黄仁勋 宣布,NVIDIA 已经更新了 100 个加速库,包括用于量子计算的 cuQuantum 和新开源的 CUDA Quantum、用于组合优化的cuOpt 和用于计算光刻的 cuLitho。
据 黄仁勋介绍,全球NVIDIA生态系统现在涵盖NVIDIA Inception 中的400万开发人员、40,000 家公司和 14,000 家初创公司。
“我们正在帮助世界完成不可能的事情。”