什么是GPU?一位专家解释了推动人工智能繁荣的芯片,以及为什么它们价值数万亿

 5个月前     114  
什么是GPU?一位专家解释了推动人工智能繁荣的芯片,以及为什么它们价值数万亿

文章目录

随着世界争相利用最新一波人工智能技术,有一种高科技硬件已经成为令人惊讶的热门商品:图形处理单元(GPU)

顶级GPU的售价可达数万美元,随着对其产品的需求激增,领先制造商NVIDIA的市场估值飙升至2万亿美元以上

GPU也不仅仅是高端人工智能产品。手机、笔记本电脑和游戏机中也有功能较弱的GPU

现在你可能在想:什么是GPU,真的吗?是什么让它们如此特别

什么是GPU

GPU最初主要用于快速生成和显示复杂的3D场景和对象,例如视频游戏和计算机辅助设计软件中涉及的场景和对象。现代GPU还处理诸如解压缩视频流之类的任务

大多数计算机的“大脑”是一种称为中央处理器(CPU)的芯片。CPU可以用于生成图形场景和解压缩视频,但与GPU相比,它们在这些任务上通常要慢得多,效率也更低。CPU更适合于一般的计算任务,如文字处理和浏览网页

GPU与CPU有何不同

一个典型的现代CPU由8到16个“核心”组成,每个核心都可以按顺序处理复杂的任务

另一方面,GPU有数千个相对较小的内核,这些内核被设计为同时(“并行”)工作,以实现快速的整体处理。这使得它们非常适合需要大量简单操作的任务,这些操作可以同时完成,而不是一个接一个地完成

传统GPU有两种主要风格

首先,有独立的芯片,这些芯片通常是大型台式电脑的附加卡。其次是在同一芯片封装中与CPU组合的GPU,这种芯片通常出现在笔记本电脑和游戏机(如PlayStation 5)中。在这两种情况下,CPU都控制GPU的操作

为什么GPU对人工智能如此有用

事实证明,GPU的用途不仅仅是生成图形场景

人工智能(AI)背后的许多机器学习技术,如深度神经网络,在很大程度上依赖于各种形式的“矩阵乘法”

这是一种数学运算,将大量的数字相乘并求和在一起。这些操作非常适合并行处理,因此GPU可以非常快速地执行这些操作

GPU的下一步是什么

由于内核数量和运行速度的提高,GPU的数字运算能力正在稳步提高。这些改进主要是由台湾台积电等公司在芯片制造方面的改进推动的

单个晶体管——任何计算机芯片的基本组件——的尺寸正在减小,允许更多的晶体管放置在相同数量的物理空间中

然而,这并不是故事的全部。虽然传统的GPU对人工智能相关的计算任务很有用,但它们并不是最优的

正如GPU最初设计用于通过提供图形的专门处理来加速计算机一样,也有加速器设计用于加速机器学习任务。这些加速器通常被称为“数据中心GPU”。

一些最受欢迎的加速器,由AMD和NVIDIA等公司制造,最初是作为传统GPU。随着时间的推移,他们的设计不断发展,以更好地处理各种机器学习任务,例如通过支持更高效的“大脑浮动”数字格式

其他加速器,如谷歌的张量处理单元和Tenstorrent的Tensix核心,都是从头开始设计的,用于加速深度神经网络

数据中心GPU和其他人工智能加速器通常比传统GPU附加卡具有更多的内存,这对于训练大型人工智能模型至关重要。人工智能模型越大,其能力和准确性就越高。

为了进一步加快训练和处理更大的人工智能模型,如ChatGPT,可以将许多数据中心GPU汇集在一起,形成一台超级计算机。这需要更复杂的软件才能正确利用可用的数字运算能力。另一种方法是创建一个非常大的加速器,例如Cerebras生产的“晶圆级处理器”

专用芯片是未来吗

CPU也没有停滞不前。AMD和英特尔最近的CPU内置了低级指令,可以加速深度神经网络所需的数字运算。这种额外的功能主要有助于“推理”任务,即使用其他地方已经开发的人工智能模型

首先要训练人工智能模型,仍然需要类似GPU的大型加速器

可以为特定的机器学习算法创建越来越专业的加速器。例如,最近,一家名为Groq的公司生产了一种“语言处理单元”(LPU),专门用于按照ChatGPT的思路运行大型语言模型

然而,创建这些专用处理器需要大量的工程资源。历史表明,任何给定的机器学习算法的使用率和受欢迎程度都会达到峰值,然后下降——因此昂贵的专用硬件可能会很快过时

然而,对于普通消费者来说,这不太可能是个问题。你使用的产品中的GPU和其他芯片可能会悄悄地变得更快

想要了解更多关于脑机接口技术的内容,请关注脑机网,我们将定期发布最新的研究成果和应用案例,让您第一时间了解脑机接口技术的最新进展。

您可能感兴趣的

暂无评论

暂无评论...