研究人员使用硬件加速核心芯片的片上通信
即时发布
来自北卡罗来纳州立大学和英特尔公司的研究人员开发了一种新方法,可以显著加快核心间的通信。它们的发展依赖于硬件来协调多处理器操作的核心之间的工作。
许多计算机功能需要多个处理器或内核,以协调的方式共同努力。目前,通过在核之间发送和接收软件命令来实现这种协调。但这需要核心来读取和执行该软件,这需要时间。
现在研究人员开发了一种芯片设计,替换了具有内置硬件的软件指令,可协调核心之间的通信,加速过程。
“这种方法称为核心到核心通信加速框架(CAF),将通信性能提高了两到12次,”NC州的电气和计算机工程教授和一篇论文的共同作者工作。“换句话说,执行时间 - 从开始完成 - 是快速或更快的两倍。”
CAF设计的关键是队列管理设备(QMD),它是一个附加到芯片上处理器网络的小设备。QMD能够简单的计算功能,有效地跟踪核心之间的通信请求,而无需依赖于软件例程。
研究人员还发现,由于它可以执行基本计算,因此QMD可用于聚合来自多个核心的数据 - 加速一些基本计算功能的数量多达15%。
“我们现在正在寻找开发其他可以加速更多多核计算的片上设备,”Solihin说。
这篇题为“CAF:核心对核心通信加速框架”的论文将于9月11日至15日在以色列海法举行的第25届并行架构和编译技术年度会议上发表。该论文的主要作者是曾在北卡罗来纳州立大学攻读博士学位的王益鹏。该论文由英特尔公司的Wang Ren、Andrew Herdrich和James Tsai共同撰写。
- 船员 -
编辑注:研究摘要跟随。
CAF:核心对核心通信加速框架
作者:北卡罗来纳州北卡罗来纳州立大学的王鹏王和严索林;任王,安德鲁Herdrich和詹姆斯·蔡,英特尔公司
提出了第25届并行架构与编译技术年会,9月11-15日,以色列海法
抽象的:随着多核系统中的核心数量的增加,核心 - 核心(C2C)通信越来越多地限制了经常共享数据的工作负载的性能缩放。传统的方式核心通信是在它们之间使用共享的内存空间。但是,共享内存通信从根本上涉及一致性失效和缓存未命中,这导致大量的性能开销并产生高量的网络流量。许多重要的工作负载产生了显着的C2C通信,并且由于增量而受到显着影响,包括流水线数据包处理,这些数据包处理广泛用于基于软件的网络解决方案。在这些工作负载中,线程在不同的核心上运行,并将数据包从一个核心传递给另一个核心,用于使用软件队列处理的不同阶段。在本文中,我们分析了软件队列管理的行为和开销。基于该分析,我们提出了一种新颖的C2C通信加速框架(CAF)来优化C2C通信。CAF将核心和内存卸载到指定的高效硬件设备的大量通信负担,我们将其称为芯片上的网络上的队列管理设备(QMD)。CAF结合了硬件和软件优化,以有效地降低了队列诱导的通信开销,并通过传统的软件队列实现将整体系统性能提高到2-12倍。
