神经元:对从树突接收到的时空信息进行整合,并在超过特定阈值时发放新的脉冲,通过轴突传递到其他神经元。准确但复杂度高的神经元模型:HH模型;较为简化神经元模型:累积释放(I&F)模型。
突触:突触是不同神经元之间的连接,支撑记忆、学习功能;记忆以突触连接强度的形式存储在神经网络中。突触连接强度能够变化,体现为不同类型的可塑性包括短时程、长时程可塑性等,从而实现神经网络的学习功能。
群编码:信息编码在某一组神经元的行为模式中。
关键技术:片上网络、片上网络拓扑、片上网络路由
片上网络的四个基本组成部分:
路由节点:执行通讯任务的节点,其核心是交换开关,包括仲裁器、纵横交换电路、输入缓冲器等。
通道:指路由节点与资源节点之间、路由节点与路由节点之间的连线,通道具有一定的方向性。
按照路由节点的连接方式,NoC拓扑结构可分类如下:
二维结构:网格(Mesh)、环面(Torus)、多边形、蜘蛛网形(Spidergon)、星形(Star)等。
路由设计的功能考量多种不利现象:
死锁:数据包等待前级清空,前级又在等待更前级,依赖关系形成闭环,数据包无法路由。
活锁:数据包持续进行路由,但就是无法到达目标地址。只出现在自适应的非最短路径中。
饥饿:多个方向的数据包竞争输入,优先级固定只处理一个方向,其他方向被完全堵死。
解决活锁:仅使用最短路径路由方案,限制错误路由操作数量。
解决饥饿:采用需求跟踪的循环优先级,为低优先级适当保留带宽。
解决死锁:一般有死锁预防、死锁恢复和死锁避免方案。
关键技术:SNN学习算法
脉冲神经网络学习算法分类:
ANN转SNN离线学习:任何在ANN中能实现学习的算法,只要求能转换到SNN。
监督在线学习:依赖于梯度下降、突触可塑性、脉冲卷积序列、时空反向传播的浅层/深层学习算法。
其他在线学习:基于SNN的强化学习、半监督学习、液体状态机学习、深度信念网络学习等。
其中,无监督在线学习的实现方式包括:
突触可塑性:无监督学习的理论基础,生物可信,表征为突触连接强度增强或抑制。
长时程增强(LTP):NMDA受体强烈兴奋,Ca2+大量内流,形成新的AMPA受体。(海马体)
长时程抑制(LTD):NMDA受体活动处于低水平,Ca2+流量低下,AMPA受体消亡。(纹状体)
类脑计算芯片与应用
IBMTrueNorth芯片
NoC拓扑:片内及片间扩展均为2DMesh结构,片间传输速度显著慢于片内。
路由算法:片内外均为X-Y维序路由,片内采用异步双轨四相、片间采用异步单轨两相协议。
近存计算:非冯·诺依曼架构,存储与计算单元邻近分布在各处理核,高度并行,事件驱动。路由节点:需要处理东/西/南/北/本地五个方向的数据出入,首先处理东西向,再处理南北向。路由节点内置FIFO缓存缓解拥堵饥饿,最短路径算法避免活锁,支持一对一发射(同时避免死锁)
NoC拓扑:四个核与一个路由节点构成四叉树,路由节点之间构成2DMesh结构,片间也是2DMesh。
路由算法:片内及片间X-Y维序算法,纯异步路由握手设计。
框架本身仅支持一对一发射,但可在源神经元处,通过复制多个一对一实现一对多发射。
规格指标:156核众核架构(12x13),每核256神经元、64K突触(256x256)。
路由算法:片内外均为X-Y维序路由,片内采用异步握手协议。
可使用额外的广播神经元和复制神经元来实现一对多发射,也可在核内执行多播判断
北京大学:PAICore芯片
规格指标:64核众核架构(8x8),每核1K神经元、1M突触(1024x1024)。
NoC拓扑:片内及片间扩展均为2DMesh结构,片间采用8:1Merge/Split合并或分流8个核心的数据。
路由算法:片内外均为Y-X维序路由,采用基于异步FIFO的异步握手协议。
路由地址采用绝对地址表示,比对目标地址与当前核地址是否一致。
智能芯片的发展趋势
人脑的优势:
超低功耗
在处理同样复杂任务时,没有任何人工系统能够媲美人脑的高能效性。
学习能力
没有任何自然/人工系统能够像人脑一样,具有对新环境的自适应能力、对新信息与新技能的自动获取能力。
存算融合
神经元实现信息整合,突触完成存储和学习,每个神经元通过上万突触与其他神经元互联,高度并行、存算一体。
高鲁棒性
没有任何系统能够像人脑一样,在复杂环境下有效决策并稳定工作、能够在多处损伤情况下依然具有很好鲁棒性。
智能芯片的未来发展:
计算驱动:算力和能效的持续提升推进军事智能应用。
SNN类脑计算芯片:事件驱动型稀疏性数据、低功耗。
生物启发:持续提升规模、复杂度探索通用智能实现方法。
审核编辑:郭婷
原文标题:类脑芯片应用如何?
长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)