菜单导航

详解异构计算FPGA基础知识

作者: 精装之家 来源: 精装之家 发布时间: 2020年01月13日 15:54:04

随着云计算,大数据和人工智能技术应用,单靠 CPU 已经无法满足各行各业的算力需求。海量数据分析、机器学习和边缘计算等场景需要计算架构多样化,需要不同的处理器架构和 GPU,NPU 和 FPGA 等异构计算技术协同,满足特定领域的算法和专用计算需求。今天,笔者带大家详细了解下 FPGA 技术。

FPGA 是英文 Field Programmable Gate Array 简称,即现场可编程门阵列。它是在 PLA、PAL、GAL、CPLD 等可编程器件的基础上进一步发展的产物。它是作为专用集成电路 (ASIC) 领域中的一种半定制电路,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

1、 FPGA 简介

FPGA 普遍用于实现数字电路模块,用户可对 FPGA 内部的逻辑模块和 I/O 模块重新配置,以实现用户的需求。它还具有静态可重复编程和动态在系统重构的特性,使得硬件的功能可以像软件一样通过编程来修改。可以毫不夸张的讲,FPGA 能完成任何数字器件的功能,下至简单的 74 电路,上至高性能 CPU,都可以用 FPGA 来实现。FPGA 如同一张白纸或是一堆积木,工程师可以通过传统的原理图输入法,或是硬件描述语言自由的设计一个数字系统。

2、FPGA 发展史

FPGA 的发展历史如下图所示。相对于 PROM、PAL/GAL、CPLD 而言,FPGA 规模更大性能更高。

2.png

图 1 FPGA 发展史

FPGA 芯片主流生产厂家包括 Xilinx、Altera、Lattice、Microsemi,其中前两家的市场份额合计达到 88%。目前 FPGA 主流厂商全部为美国厂商。国产 FPGA 由于研发起步较美国晚至少 20 年,目前还处于成长期,仅限于低端,在通信市场还没有成熟应用。

2015 年 12 月,Intel 公司斥资 167 亿美元收购了 Altera 公司。Altera 被收购后不久即制定了英特尔处理器与 FPGA 集成的产品路线图。这两种产品集成的好处是可以提供创新的异构多核架构,适应例如人工智能等新市场的需求,同时能大幅缩减功耗。

3.png

图 2 FPGA 在电信领域的应用历史

FPGA 在航天、军工、电信领域有非常成熟和广泛的应用。以电信领域为例,在电信设备一体机阶段,FPGA 由于其编程的灵活性以及高性能被应用网络协议解析以及接口转换。

在 NFV(NetworkFunction Virtualization 阶段,FPGA 基于通用服务器和 Hypervisor 实现网元数据面 5 倍的性能提升,同时能够被通用 Openstack 框架管理编排。

在云时代,FPGA 已经被作为基本 IaaS 资源在公有云提供开发服务和加速服务,AWS、华为、BAT 均有类似通用服务提供。

截至目前,Intel 的 Stratix 10 器件已被成功应用于微软实时人工智能云平台 Brainwave 项目。

3、两家主流 FPGA 公司发展近况

Xilinx 聚焦芯片领先和丰富的加速解决方案,通过开放策略获得主流云平台支持,确立了其在数据中心的领先地位。其 UltraScale+系列 FPGA 领先友商 1 年多,使其在云平台竞争中占领先机,其 VU9P 器件被大量应用于包括 AWS、Baidu、Ali、Tencent 及华为在内的多家公司的云计算平台。

为满足加速器领域对 FPGA 芯片日益递增的性能需求,Xilinx 已发布面向数据中心的下一代 ACAP 芯片架构、推出 7nm Everest 器件。此器件已不属于传统的 FPGA,它集成了 ARM、DSP、Math Engine 处理器阵列等内核,将于 2019 年量产。相较于 VU9P,Everest 支持的 AI 处理性能将能提升 20 倍。

Intel 则提供从硬件到平台到应用的全栈解决方案,不开放硬件和平台设计以避免生态碎片化,投入巨大但进展缓慢。

4.png

图 3 Xilinx 产品系列图

5.png

图 4 Intel(以 Stratix 系列为例) 产品工艺年代

FPGA 在数据中心服务器市场的实际应用中存在一定技术难点,具体包括如下几方面:

1、编程门槛较高:硬件描述语言不同于软件开发语言,需要开发者对底层硬件有着较深刻的认识;因此人才也就成为限制 FPGA 应用的一个重要因素。据了解,目前国内从事 FPGA 开发的人员初步估计大约两万多人。

2、集成难度较大:FPGA 开发与应用需要软硬件的协同,包括使用高级语言的系统建模、硬件代码(电路)设计、硬件代码仿真、底层驱动软件与硬件逻辑的联调等等。

3、开发周期相对软件要长:硬件开发比软件开发过程复杂,调试周期也被拉长。

4、很难获取独立逻辑 IP。

4、FPGA 整体结构

FPGA 架构主要包括可配置逻辑块 CLB(Configurable Logic Block)、输入输出块 IOB(Input Output Block)、内部连线(Interconnect)和其它内嵌单元四个部分。