当前位置:首页 > 科技资讯 >

[专利解密]百度帮助AI芯片技术改革

2021-07-22 12:30:18 来源:文章来源与网络

[佳勤评论]百度的人工智能芯片专利,通过与各指令源的弱耦合,实现了多指令源共享SFU,减少了指令源调用SFU进行复杂计算时的数据路径,降低了AI芯片的面积开销和功耗成本。

据知情人士透露,百度人工智能芯片部门昆仑最近完成了一轮融资,价值约20亿美元。目前,昆仑芯片主要用于智能电动汽车和云计算。百度将继续在与人工智能芯片相关的领域开展工作。

人工智能算法中有许多复杂的计算。现在大多数人工智能处理器使用一条指令来调用一个特殊的复杂计算单元来实现复杂的计算。由于这些复杂的计算单元占据了相对较大的逻辑区域,所以在多核人工智能处理器中,如果每个处理器核心单独共享这些复杂的计算单元,它将占用一个大的芯片面积,实现成本太高;在实际应用场景中,这些复杂计算指令的频率并不特别高,而且当每个处理器核单独使用这些复杂计算单元时,这些复杂计算单元的利用率并不高。

为此,百度于2020年6月30日申请了一项名为复杂计算设备、方法、人工智能芯片和电子设备的发明专利(申请号:202010612288.3),申请人是北京百度网络新闻技术有限公司。

GB/T1481-1991芯片结构原理图

图1是本发明提出的ai芯片结构的示意图,AI芯片中的多个指令源100连接到复杂计算设备200,指令源100可以是ai处理器核,其中复杂计算设备200包括输入接口210、多个计算部分220和输出接口230。输入接口210可以连接在多个ai处理器核100和多个计算部分220之间,并且多个输出接口可以连接在计算部分220和多个ai处理器核100之间。

多个计算部分220构成一个特殊的功能单元,每个单元具有独立的计算能力,可以实现某种类型的复杂计算。计算部分220至少包括以下之一:应用专用集成电路、芯片和现场可编程门阵列。

ai处理器核100可以在接收待执行指令时解码执行指令,并将解码后的数据拼接成复杂计算指令,ai处理器核100可以向复杂计算装置200的输入接口210发出指令请求,而复杂计算设备200的输入接口210又从每个ai处理器核100获得复杂计算指令,并根据每个复杂计算指令中的计算类型将其分别仲裁到相应的计算部分220。

计算部分220从接收到的复杂计算指令中获取源操作数,并生成用于反馈到输出接口230的计算结果指令。计算结果指令包括指令源识别、计算结果和写回地址等,计算结果是计算部分220对源操作数的复杂计算的计算结果,指令源识别和写回地址来自计算部分220接收的复杂计算指令中的数据。

输出接口230接收来自每个计算部分220的计算结果指令,并根据计算结果指令的指令源标识,将计算结果和每个计算结果指令的回写地址仲裁到相应的指令源,例如ai处理器核心100。AI处理器核100根据所述写回地址将计算结果写入内部寄存器。

总之,百度的人工智能芯片专利通过与各指令源的弱耦合,实现了多指令源对SFU的共享,减少了指令源调用SFU进行复杂计算时的数据路径,降低了芯片的面积开销和功耗开销。

百度是世界领先的人工智能公司,在人工智能计算能力、算法、开放平台、开发人员生态等方面建立了领先优势,成为强劲增长的快车道。在云、人工智能和互联网一体化发展的大趋势下,百度布局多引擎增长的新模式,节约了强大的潜力,支持未来的发展。

(校对/冬青)回到搜狐看更多

上一篇:共享电动汽车的标准已经出台,该市已经禁止发布或引入了一个转机,但网民们
下一篇:最后一页

热点推荐

热点速递