发布时间:2024-11-28 09:08:02 人气:
在传统的计算机中,微处理器加装在一个小的电路板上,其底部有一个电导线。这个芯片不会金字在电脑的主板上,以使数据在处理器和电脑的主要存储库之间来回。随着处理器晶体管数量的减少,处理器和主存储器之间的比较较慢的相连早已沦为提升计算机性能的主要障碍。
因此,在过去的几年里,芯片制造商开始将传统上作为主存储器的动态随机存取存储器(DRAM)PCB在芯片上。这种存储器是一种高容量内存,需要较慢地存储本地常用数据。但是DRAM彻底不同于一般来说用作芯片内存的内存类型,而且现有的内存管理计划并没有效地用于它。
在最近的IEEE/ACM国际微结构研讨会上,来自麻省理工学院、英特尔和苏黎世ETH的研究人员明确提出了一种新的内存管理方案,该方案将内包DRAM内存的数据速率提升了33%到50%。麻省理工学院计算机科学与人工智能实验室的博士后、及该论文的第一作者Xiangyao Yu说道:“这个PCB的DRAM的比特率有可能比非PCB的DRAM低5倍。且事实证明,以前的内存管理计划花费了过于多的流量来采访元数据或移动数据,但却不是确实想的数据,而且它们浪费了大量的比特率。
”内存散列在现代计算机芯片中,当处理器必须特定的数据块时,它就不会检查其本地内存,以查阅数据否早已不存在。这些缓存数据都会被标记其所来源数据的地址,即元数据。一个典型的芯片内存有可能有充足的空间用作64000个数据项,且每个数据都会张贴上元数据变迁。
似乎,一个处理器并想每次都从64000个条目中搜寻自己感兴趣的数据。因此,内存系统一般来说用于所谓的“哈希表格”来的组织数据。
当一个处理器用于特定的标签来找寻数据时,它首先将标签对系统给一个哈希函数,该函数以制订的方式处置,并产生一个新的数字,而这个数字正是用作登录数据表中所查询数据的方位。哈希函数的意义在于,十分相近的输出产生截然不同的输入。这样,即使处理器相当严重依赖来自狭小地址范围的数据,比如在一个大图像的一个部分继续执行简单的操作者,数据也不会在内存中间分隔来,这样就会在单个方位导致数据堵塞。
此外,哈希函数也可以为有所不同的输出产生完全相同的输入,即如果用户想要处置各种有可能的输出,正如内存方案一样,那么就更加有可能产生完全相同的输入。因此,内存的哈希表格一般来说不会在完全相同的散列索引下存储两个或三个数据项,且搜寻一个等价标记的两个或三个条目要比搜寻64000条目便利得多。DRAM和SRAMDRAM和SRAM(静态随机存储器)在标准内存中用于的技术有哪些区别呢?SRAM对于其存储的每一个数据都会用于6个晶体管,而DRAM只用于一个,这意味著其空间效率更高。
但SRAM有一些内置的处置能力,而DRAM则没。如果处理器想在SRAM内存中搜寻一个数据项,该处理器不会将标签发送到内存中,然后,SRAM电路本身将标签与存储在号召的散列方位的数据项标记展开对比,如果给定,则回到涉及数据。相比之下,DRAM承托传输催促的数据。因此,处理器将催促存储在等价的散列方位的第一个标记,如果给定则发送到第二个催促以提供涉及数据。
如果不给定,它将催促第二个存储标记,如果还不给定,将发送给第三个,告诉寻找它想的数据,或者退出,然后转入主内存。PCB的DRAM有可能有很多比特率,但这个过程不会闲置其比特率。Xiangyao Yu及其同事通过对大多数现在芯片中内存管理系统的微小改动,从而防止了所有的元数据传输。任何运营在计算机芯片上的程序都必需管理自己的内存用于,而且一般来说让程序像享有攻击的专用内存存储一样便利。
但实质上,多个程序一般来说同时运营在同一芯片上,他们同时将数据发送到主内存。因此,芯片中的每一个核心或处理单元一般来说都有一个表格,将单个程序所用于的虚拟世界地址映射到存储在主内存中的数据的实际地址。该新的系统被称作Banshee,且在表格中的每个条目中加到了3 bits的数据。其中一个回应虚拟地址中的数据否可以在DRAM内存中寻找,而另外两个则命令其方位相对于具备完全相同哈希索引的任何其他数据项。
Xiangyao Yu回应:“在条目中,你必须有物理地址,虚拟地址,以及一些其他数据。而这些特一起早已差不多100 bits了。
所以三个额外的bits早已是十分小的了。”标记缓冲区但这种方法不存在一个问题,这也是Banshee必需解决问题的问题。如果一个芯片的核心将一个数据项扯放在DRAM内存中,那么其他的内核就不告诉了。
每次向芯片内核发送到消息时,每次改版内存都会消耗大量的时间和比特率。因此,Banshee引进了另一个称作标记缓冲区的小电路,在那里,任何等价的核心都可以记录它内存的数据项的新方位。
任何核心的催促都通过标记缓冲区发送到DRAM内存或主内存,这将检查所催促的标记否已被新的同构。只有当缓冲区填充时,Banshee才不会通报所有的芯片内核,它们必须改版其虚拟内存表格。然后它清理缓冲区,并新的开始。缓冲区较小,只有5千字节,因此它的减少会闲置过于多芯片内存。
研究人员的建模结果显示,每次内存采访所需的额外地址查询所需的时间与Banshee所节省的比特率比起是微不足道的。人工智能——2017年最火热的标签。
对于众多AI试水者,你告诉如何均衡技术与市场需求吗?你告诉如何利用政策事半功倍吗?你告诉如何找寻公司的投资伯乐吗?12月14日,「2017亿欧创新者年会·AI产业应用于峰会」,我们将邀众多投资人、创业者、AI领域精英联合探究,不仅是AI+产业+应用于,这里是需求方和技术获取方的交流平台,是政策专家与企业方的交流平台,是投资人与企业方交流的互猎平台,是应届毕业生和企业方的接入平台。多维度,更加深度,来这里构建归属于你的AI!。
本文来源:亚傅体育app官网登录入口-www.njjsqygl.com