联系我们

面试

ps学的创始人兼首席执行官Ludovic Larzul– Interview Series

mm

已发表

 on

Ludovic Larzul。是以下公司的创始人兼首席执行官 ps学,这是一家突破性的初创公司,专注于为 深度学习 inference. They’发明了一种技术来加速推理神经网络的计算,并向12博下载app用户隐藏硬件加速器。 Mipsology的Zebra是第一个将此类技术封装在一起的商用加速器,以提供高性能和易用性。

是什么首先让您对12博下载app和微芯片感兴趣?

在2012年被Synopsys收购之前,我曾与我以前的公司EVE合作设计特定类型的超级计算机大约20年。那些计算机,也称为ASIC仿真器,被全世界许多设计ASIC的公司使用。 。我非常喜欢这项工作的复杂性和多样性。要获得成功,您必须(a)了解电子设备,软件,复杂算法,人们如何设计芯片以及如何确保它们工作正常,芯片架构,功耗以及更深入的技术,(b)正确预测客户的需求a提前几年,(c)不断创新,(d)作为一家创业公司,以更少的资源击败竞争对手。经过20年的成功,我一直在寻找新的挑战。那时是12博下载app开始重新引起关注的时候。 AlexNet在理解图像方面迈出了一大步(往回看,它仍处于起步阶段)。深度学习是崭新的但很有前途的(谁记得在简单的网络上花几天的时间才能获得结果?)。我发现这很“有趣”,但是我认识到很多挑战。

 

开展Mipsology的灵感来自什么?

我不知道我是否会使用“灵感”一词。最初更像是:“我们可以做一些与众不同且更好的事情吗?”它始于对12博下载app人士的意愿和行为的假设,然后在接下来的几年中花了更多时间在此基础上找到更好的解决方案。我想说的不只是灵感,我想说的是,与我一起工作的人都希望以积极的竞争态度发挥自己的才能。这使得强大的团队可以解决其他人无法充分解决的问题。

 

ps学使用FPGA板而不是GPU。您能描述一下FPGA吗?

现场可编程门阵列是可以在硬件级别进行编程的电子组件。您可以把它想象成一套乐高积木—几百万。每个小块都执行一个简单的操作(如保持一个值),或执行稍微复杂的操作(如加法)。通过对所有这些块进行分组,可以在芯片制造后创建特定的行为。这与GPUS和几乎所有其他芯片相反,后者都是为特定功能而设计的,以后不能更改。

可以对某些程序(例如CPUS和GPUS)进行编程,但是它们不如FPGA并行。在任何给定的时刻,FPGA都会执行几百万次简化操作。每秒可能发生六到七亿次。由于它们是可编程的,因此可以随时更改其操作以适应不同的问题,因此非凡的计算能力可以发挥作用。 FPGA几乎已经无处不在,包括手机,网络,卫星,汽车等的基站。但是人们并不十分了解它们,因为它们不像笔记本电脑中的CPU那样可见。

 

是什么使这些FPGA板成为更流行的GPU的出色解决方案?

现场可编程门阵列在许多方面都有优势。让我们只关注几个重要的方面。

显卡设计用于渲染图像,主要用于游戏。由于操作的相似性,已发现它们与12博下载app中的某些计算非常匹配。但是它们仍然主要专注于游戏,这意味着它们具有与神经网络不太匹配的约束。

他们的编程还仅限于在可用前两三年确定的指令。问题在于神经网络的发展比ASIC的设计要快,而GPU是ASIC。因此,这就像试图预测未来:做到正确并非易事。您可以看到趋势,但是细节是真正影响结果(如性能)的因素。相反,由于FPGA在硬件级别是可编程的,因此我们可以更轻松地跟上12博下载app的发展。这使我们能够交付性能更好的更好产品,并满足客户的需求,而不必等待下一代芯片。

此外,GPU被设计为消费类产品。他们的寿命故意缩短了,因为设计GPU的公司希望在几年后向游戏玩家出售新的GPU。这在需要可靠多年的电子系统中效果不佳。 FPGA被设计为健壮的,并且以24/7的速度使用了很多年。

现场可编程门阵列的其他众所周知的优点包括:

  • 有很多选项可以适合特定领域,例如网络或视频处理
  • 它们在数据中心,边缘或嵌入式系统中都可以正常工作
  • 它们不需要特定的冷却(与大型GPU相比,水冷却要少得多)

一个主要缺点是FPGA难以编程。它需要特定的知识。尽管销售FPGA的公司已经在弥合复杂性方面付出了巨大的努力,但它仍然不像CPU那样简单。实际上,GPU也不简单。但是,隐藏对12博下载app编程的软件使该知识变得不必要。这就是Mipsology首先要解决的问题:消除了对12博下载app计算进行编程或对FPGA有任何了解的需求。

 

现场可编程门阵列板当前有任何限制吗?

一些FPGA板就像一些GPU板。它们可以插入计算机的PCIe插槽中。除了我之前提到的使用寿命外,一个众所周知的优势是功耗通常低于GPU。另一个鲜为人知的是,与GPU板相比,FPGA板的选择更多。面向更多市场的FPGA数量更多,这导致了更多适合市场不同领域的板卡。这仅意味着以更低的成本在各地计算神经网络的可能性更大。 GPU受到更多限制;它们适用于数据中心,但没有其他功能。

 

ps学的Zebra是第一个商业化的加速器,封装了FPGA板以提供高性能和易用性。您能描述斑马是什么吗?

对于那些熟悉12博下载app和GPU的人来说,最简单的描述是Zebra对FPGA而言就像Cuda / CuDNN对GPU一样。它是一个软件堆栈,将FPGA完全隐藏在PyTorch或TensorFlow等常规框架之后。我们主要针对图像和视频进行推理。 Zebra从通常在浮点受过训练的神经网络开始,并且无需任何人工操作或专有工具,即可在任何基于FPGA的卡上运行。这很简单:插入FPGA板,加载驱动程序,获取Zebra环境,并启动与在CPU或GPU上运行的推理应用程序相同的推理应用程序。我们拥有自己的量化功能,可以保持准确性,而性能则是开箱即用的。用户没有必须学习的专有工具,并且不需要花费大量的工程时间就能获得高吞吐量或低延迟。这意味着简单的快速过渡,这也减少了成本和上市时间。

 

Zebra最适合用于哪些不同类型的应用程序?

Zebra是一种非常通用的加速引擎,因此它可以为需要计算神经网络的任何应用程序加速计算,并且主要关注图像和视频,因为此类数据的计算需求更大。我们收到了来自非常不同的市场的请求,但是在计算神经网络时,它们都是相似的。它们通常都需要分类,分割,超分辨率,身体定位等。

由于Zebra在FPGA之上运行,因此可以使用任何类型的板。有些具有很高的吞吐量,通常用于数据中心。其他的则更适合在Edge上使用或嵌入。我们的愿景是,如果FPGA适合,那么用户可以立即使用Zebra加速其神经网络计算。而且,如果使用GPU或CPU,则Zebra可以替换它们并降低12博下载app基础架构的成本。我们与之交谈的大多数公司都存在类似的问题:他们可以部署更多基于12博下载app的应用程序,但是成本有限。

 

对于希望使用Zebra的公司,流程是什么?

只需让我们知道 [email protected] 我们会帮助您入门。

 

关于Mipsology,您还有其他要分享的内容吗?

我们很高兴收到来自12博下载app社区的Zebra解决方案反馈。具体来说,我们被告知这可能是市场上最好的加速器。短短几个月后,我们将不断增加感兴趣的合作伙伴的生态系统,其中包括Xilinx,Dell,Western Digital,Avnet,TUL和Advantech等。

我真的很喜欢这种突破性技术的学习。希望了解更多信息的读者请访问 ps学.

ps学展示了Zebra:高性能深度学习计算引擎

在YouTube上观看此视频

安东尼·塔迪夫(Antoine Tardif)是 Futurist 他对12博下载app和机器人技术的未来充满热情。他是 BlockVentures.com并已投资了50多个12博下载app和区块链项目。他是的联合创始人 Securities.io 一个专注于数字证券的新闻网站,是unite.12博下载app的创始合伙人。他也是 福布斯技术委员会。