(原标题:初创公司开发了一款光学NPU)激情五月天
若是您但愿不错往往碰头,迎接标星储藏哦~
着手:履行来自eejournal,谢谢。
诈欺基于光子学的技艺进行“光速揣摸打算”有彰着的诱惑力——不单是是极高的速率,尽管这固然很过失,而且与基于晶体管逻辑的揣摸打算竣事比拟,其功耗也极低。
已往几年,我构兵过几家提供各式光学揣摸打算措置决议的公司。但到咫尺为止,这些措置决议主要波及将不同频率和相位的多束光注入光纤,并诈欺插手进行复杂的揣摸打算,若是用硅片进行这些揣摸打算,则需要多半晶体管。
好吧,我刚刚构兵到光学揣摸打算限制的一些崭新事物。我和Michael F?rtsch 博士聊天,他是一家名为Q.ANT的德国初创公司的首席扩充官。固然,当我说“初创公司”时,咱们需要记取 Q.ANT 设立于 2018 年,到撰写本文时已过程去了六年。我不知说念你是若何想的,但从技艺角度来看,六年前对我来说似乎是一世之久。
粗浅先容一下布景故事,迈克尔领先从事的是揣摸打算网站的服务,但自后以为没趣,于是他初始学习数学和物理,终末获取了马克斯·普朗克学会的博士学位。随后,迈克尔在好意思国国度圭臬与技艺询查所(NIST)服务了几年,还作念了一些其他服务,终末他决定重返工业界,创办了 Q.ANT。
在连接之前,值得着重的是,咱们(东说念主类)但愿扩充的揣摸打算量现在每三个月傍边就会翻一番。这在多个层面上都是可怕的。
这里的一个问题是咱们扩充揣摸打算所奢靡的能量。咫尺,大多数揣摸打算都是使用基于 CMOS 技艺的硅芯片进行的。较小的晶体管比较大的晶体管奢靡的功率更少。咱们正在转向越来越小的工艺节点,其中晶体管的尺寸以纳米为单元,是以这很好 - 对吗?
问题是,咱们但愿扩充的揣摸打算量呈指数级增长,这意味着咱们需要在单个芯片上安设数百亿个晶体管。数百亿个晶体管会奢靡多半动力,而当一台服务器中有多个这么的芯片、一个机架中有多个服务器、一个数据中苟且偷安万个机架时,动力奢靡就会加重。
归根结底,咱们咫尺的揣摸打算措置决议 (a) 远莫得达到咱们所但愿的速率,而且 (b) 奢靡太多电力。举例,迈克尔指出,他最近进入了一次超等揣摸打算契机议和展览。他说每个机架都需要水冷。他还指出,在不久的将来,新的超标量数据中心将初始需要我方的专用发电站——可能是微型模块化响应堆 (SMR) 的形势。
Q.ANT 是一家景理意念念的公司。它领有来自 21 个国度的 100 多名众人,领有约 890 年的行业教化,平均年事约为 36 岁。该公司的责任是开发光子揣摸打算措置决议,以应答现在东说念主工智能 (AI) 期间的两大挑战:1)束缚东说念主工智能推理和其他数据密集型应用所需的多半数据(包括复杂的数学运算)。2)权臣减少现在寰宇东说念主工智能数据中心所奢靡的多半电力和动力。
现在,咱们不错真切询查 Q.ANT 的技艺,但我顾虑真切询查可能会磨灭更大的故事,是以让咱们将事情保执在相对较高的水平。让咱们从底下的图像初始,这是基于光子学的本机处理单元 (NPU),它设立在公司的光赋能本机算法 (LENA) 架构上。
Q.ANT 的光子芯片是 LENA 的中枢(着手:Q.ANT)
海选av女优与其他居品比拟,这款光子芯片的第一个别离在于,它接受薄膜铌酸锂 (TFLN) 制造而成。不雅察左侧的低损耗波导,它将引入光信号;不雅察右侧的低损耗耦合器,它将输出光信号。
中间的金色圆圈是电控光调制器。咱们不错这么分解,每个圆圈都是一个电容器的极板。通过向该极板施加电压,咱们不错调制通过调制器的光信号。多个调制器不错互相齐集使用,以竣事越来越复杂的揣摸打算。
这款 Q.ANT NPU 使用光而不是电子来扩充复杂的非线性数学运算,有望竣事比传统 CMOS 技艺至少高 30 倍的动力成果和权臣的揣摸打算速率晋升。 想想看,傅里叶变换在传统揣摸打算中往往需要数百万个晶体管,而现在只需一个光学元件就能完成。这很令东说念主应允,不是吗?
基于这一底层技艺,Q.ANT 秘书推出其首款营业居品——基于光子学的 NPU,它配备了行业圭臬的 PCI-Express(PCIe)接口,与现在现存的揣摸打算生态系统十足兼容。
PCIe 卡上的 Q.ANT NPU(着手:Q.ANT)
嗯,这如实看起来很棒,但这项技艺到底有多好呢?我很状态你问这个问题,因为迈克尔共享了一张以终点直不雅的步地“传达这个主见”的图片,如下所示。
LENA 与圭臬 GPU(着手:Q.ANT)
假定咱们试图查验 AI 识别文森特·梵高的《星夜》。咱们使用基于 LENA 的 NPU 而不是在传统图形处理单元 (GPU) 上竣事的圭臬东说念主工神经汇聚 (ANN) 进行查验
上行露馅一个查验周期 (epoch) 后的截至。下行露馅 150 个周期后的截至。很容易看出 Q.ANT 措置决议有多先进。不异值得着重的是,LENA 仅需要 0.1 百万个参数,仅扩充 0.2 百万次操作,而 GPU 则需要 5.1 百万个参数和 10 百万次操作。
现在我仍是引起了你们的着重,我会起初告诉你们咫尺的情况,然后告诉你们我认为畴昔事情可能会如何发展。
咫尺的情况是,上图第一张图中所示的 TFLN NPU 安设在一块原始的硅基板上——基本上便是一块莫得任何晶体管的硅片。咫尺,这块基板的主要作用(固然,除了提供甩掉物除外)是为调制器提供电容器的另一侧(我将其视为不错偏置或至少接地的“大容量电容器板”)。此外,如今,光信号通过惯例光纤传入和传出该开辟。
那么畴昔会若何呢?起初,我不错设计将铌酸锂层平直安设在功能皆全的硅芯片上。在这种情况下,咱们不错在芯片顶部(构兵 NPU 底面的一侧)使用金属化圈行为各个调制器电容器的名义,而且不错在 NPU 顶面上涂一层导体行为“大容量电容器板”。
其次,与使用光纤将光信号“水平”地传送到铌酸锂层的边际不同,咱们不错使用硅芯片中制造的激光二极管将光信号垂直进取传输到 NPU 的低损耗光波导中。不异,与使用光纤打听从铌酸锂层的边际“水平”传出的光信号不同,咱们不错使用硅芯片中制造的光电二极管从 NPU 的低损耗光耦合器垂平直收这些光信号。
联想一下,将现在任何高端 CPU、GPU、FPGA 或 SoC(咫尺仅由硅制成)与上述光学 NPU 相齐集。扫数东西都将放在合并个封装中(不比今天的封装大),在外界看来就像庸碌芯片一样。我应该指出,扫数这些都只是我的预见;这不是迈克尔说 Q.ANT 正在作念的事情,但若是我在 Q.ANT 有话要说,我会探员这件事。
非线性汇聚的潜在应用不错通过 Q.ANT 技艺得到增强,从而提供更高的性能,同期奢靡更少的电量,这些应用多种千般。底下列出了一些示例。
非线性汇聚的示例应用(着手:Q.ANT)
我认为,对于任何参与 AI 和高性能揣摸打算 (HPC) 的东说念主来说,这种光子处理在成果和性能方面都终点意念念意念念。固然,这不全是对于我的(应该是,但事实并非如斯)。那么,你对这一切有什么主张?
如有硅光流片需求,
迎接扫码,将有专东说念主对接。
https://www.eejournal.com/article/a-bold-new-twist-on-optical-computing/
半导体极品公众号保举
专注半导体限制更多原创履行
关心寰宇半导体产业动向与趋势
*免责声明:本文由作家原创。著作履行系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或援手,若是有任何异议,迎接操办半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3976期履行,迎接关心。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的履行就点“在看”共享给小伙伴哦激情五月天