人民网
人民网>>传媒>>人民网奖学金>>清华计算机2015

一种新的数据中心网络完全自适应路由算法

虞志刚
2016年04月19日09:44 | 来源:人民网研究院
小字号

摘 要:作为云计算、大数据以及下一代网络技术的技术设施,数据中心网络成为工业界和学术界的研究热点。而Torus网络凭借其优越的结构特性,在当今数据中心网络以及商用超级计算机中得到了广泛应用,同时也引起了学术界的广泛关注.高效、无死锁的路由算法设计是数据中心网络研究的一个重要方面.针对Torus网络实现自适应路由所需虚通道数目多的缺点,提出了自适应路由算法Gear,该算法基于中心距离的方法来限制虚通道的使用,在虚切通交换下仅需两条虚通道即可为Torus网络提供无死锁自适应路由.通过仿真对文中所提算法的有效性进行了验证,结果表明,在同等情况下算法Gear的性能较经典的维序路由和Duato协议具有非常明显的优势.

关键词:Torus网络; 路由算法; 虚通道; 自适应路由 

1、引言

作为云计算、大数据的基础设施以及下一代网络技术的创新平台,数据中心网络的研究受到学术界和工业界的广泛关注[6]. 随着云计算和大数据技术的持续发展,以及互联网+时代的到来,存储海量数据信息的数据中心成为这些热点技术的关键。为数据中心网络选择合适的网络拓扑以及设计高效的路由算法,至关重要. [1,2]

Torus网络是一种完全对称的拓扑结构,具有很多优良特性,如网络直径小,所有节点度相同,结构简单,路径多以及可扩展性好等.因此被广泛应用于商用系统中,早期的超级计算机Cay T3D/T3E[8]和2004年超级计算机TOP 500中排名第一的IBM Blue Gene/L就采用了3-D Torus网络[7];最新的超级计算机IBM Blue Gene/Q和2011年TOP 500中排名第一的K Computer就分别采用了5-D Torus和6-D Torus作为系统互连拓扑[27].Torus网络不仅被用于超级计算机,也被广泛用于数据中心网络的互连,如最新的Eurotech Aurora 数据中心就采用了3-D Torus作为其互连拓扑结构[30]。因此在Torus网络中设计高效、无死锁路由算法至关重要.

数据中心网络中交换机制决定怎样给分组分配通道、缓冲区等网络资源. 分组交换要求在做路由决策之前分组必须被完整接收,而虚切通交换(Virtual Cut-Through Switching, VCT)[1,2]不同,引入了流水线式消息传输,在路由器完全接收分组之前,分组直接跨到下一个路由器上.VCT交换被广泛用于超级计算机中,如商用超级计算机Cray XT/Cascade 2011就采用了VCT交换技术[28].如未特别说明,下文所设计路由算法都针对VCT交换网络.

路由算法决定了每个消息或分组将在网络中传输的路径,它负责将分组正确无误的发送到目的节点.确定性路由算法, 分组在任意节点对之间总是提供相同的路径,而与网络状态无关.该算法简单,但路径惟一,因此路径中有一条通道或节点发生故障时,分组就不能被正确传输.适应性路由算法[1,2,8,18]在做路由决策时要考虑当前网络的状态.通常分组在任意节点对之间都有多条路径供选择,所有分组均匀的使用各条通道,使得网络流量更加均衡,有利于网络性能的提高.

2、相关工作

Glass和Ni的转弯模型理论[12,13]通过限制特定的转弯来消除通道间的环状依赖,实现无死锁路由,不过该算法在一定程度上损失了自适应度.付斌章[22]提出了一种用于Mesh网络的路由算法AbTM,该算法不需要虚通道就可实现可重构路由.平面自适应算法[14],限制分组在一系列的二维平面中进行路由,该算法为部分自适应路由.基于虚拟网络划分的算法[11,15,16],将网络分成几个不相交的虚拟网络,但需2n-1条虚通道为n-D Mesh提供完全自适应路由.

与Mesh网络相比,Torus网络中引入的环绕通道虽然减少了网络直径和平均距离,但是环绕通道在每一维引入了环,这使得针对Torus网络设计无死锁自适应路由异常困难[4,18,23],尤其在虚通道资源有限的情况下.

Dally[1,19]提出了适用于Torus网络的维序路由算法(Dimension Order Routing, DOR),需要2条虚通道,分组严格按照特定次序跨越所有的维,当分组跨过环绕通道后,使用另外一条虚通道.但是该算法为确定性路由,使得系统性能受限.顾华玺[8]将转弯模型扩展到Torus网络,设计出了部分自适应路由算法,需要3条虚通道.Gravano[1]提出了两种完全自适应路由算法:*-channel和4-class,该算法分别需要5和8条虚通道.Puente[20,24]提出了气泡流控机制,只需要1条虚拟通道即可实现完全自适应路由,然而该算法不能直接用于常见的虚通道路由器[28]中,而需重新设计路由器结构,因此在后文中将不再提及.Duato[19]提出了一种完全自适应路由算法的设计策略,在无死锁确定性路由算法的基础上,增加一条虚通道提供完全自适应性即可.如果以DOR作为Torus网络基本的路由算法,再增加一条虚通道实现完全自适应路由,共需要3条虚通道.为了后续表述方便,称这一算法为Duato协议.

3、预备知识

3.1定义与符号

定义1(Torus) k元n立方有k1×k2×…×kn-1×kn(ki=k, ?i∈[1,n])个节点,k是第i维的节点数,k ≥2.每个节点X的坐标由n位坐标(x1,…, xn-1, xn)定义,其中0 ≤xi≤ k-1, ?i∈[1,n]. X和Y相邻的充要条件是:存在j使得yj=(xj±1)mod k,而对任意的i≠j 且1≤ i,j≤ n,有yi=xi. k元n立方由于增加了环绕通道,使得网络更加规整对称,如图1所示为一个8元2立方(即8×8 Torus)网络,不难看出网络无论对边还是点都是完全对称的.

定义2(虚通道) 虚通道[9]是互连网络研究中常用到的概念,每条虚通道具有独立的缓冲区,而多条虚通道分时复用一条物理通道.从逻辑上看,每条虚通道就像使用一条低速工作的物理通道一样.虚通道可以用来降低消息延迟,提高网络吞吐量.既然允许多条分组以时分复用的方式共享一条物理通道,分组就可以继续发送而不必阻塞.

另外,虚通道还可以用来避免死锁、优化物理通道利用率、降低阻塞概率等.但虚通道的引入是有代价的,它增加了路由器的硬件开销[23],使得路由调度更加复杂.虚通道、缓冲区和面积是互连网络中的重要资源,特别是在面积和资源有限的(如片上网络)情况下.本文主要研究内容是在虚通道数有限条件下,为Torus网络设计更加高效的路由算法.

定义3(死锁) 死锁是指当多个分组等待路由转发时,各自占用部分资源又相互等待对方释放资源时,出现的所有的分组都永久阻塞的一种网络状态[6,28,29].

图2示出了一个死锁的例子,在图(a)所示的网络中,同时存在四个分组,分组A的源节点为n1,目的节点为n3,当前分组占用通道c1申请通道c2;分组B源节点为n2,目的节点n4,当前占用c2申请c0;依次类推,分组C占用c3申请c4;分组D占用c4申请c1.这样分组A,B,C,D即形成了图b)所示的通道间的循环依赖关系,所有分组都将不能前进,构成了死锁.

3.2、Torus网络维序路由算法—DOR

在路由分组时,严格按照递增(或递减)次序跨越所有维,只有在上一维的偏移量降为零后才再转入下一维进行路由.Torus网络的维序路由[25]需要使用2条虚通道来避免死锁.分组在跨越某一维的环绕通道之前使用虚通道1;跨越之后就使用虚通道2.在最短路径路由算法中,一条分组最多跨越每一维一次,因此只存在通道1到通道2的依赖,而不存在反过来的依赖,而通道1和通道2本身都是维序路由,故算法无死锁[1].

由于该算法是本文所提出路由算法的比较对象,图3给出了n-D Torus维序路由算法,其中VC1,VC2分别表示虚通道1和虚通道2,offi表示当前节点与目的节点在第i维上的偏移,VCi,j+表示第i维正方向上的VCj通道,下同.

4.中心距离

为了后续路由算法阐述方便,下面给出网络中心距离(Center Distance)的概念.

定义4(中心距离) 中心距离是指网络中任意节点与网络中心的距离,用CD表示.k元n立方网络中,任意节点x=(x1, x2,…, xn),0≤ xi ≤k-1,?i∈[0,k-1]与网络中心((k-1)/2, (k-1)/2,…, (k-1)/2)的距离记为:

CD(x)为节点x=(x1, x2,…, xn)到网络中心之间直线距离.每个节点都可以定义这样一个距离,k元n立方网络中,网络的最大距离为(k-1)√n/2; k为奇数时,网络的最小CD=0;k为偶数时,最小CD=√n/2,.

5、基于中心距离的完全自适应路由算法

5.1设计思想

本节提出了一种基于虚切通交换Torus网络的路由算法:Gear,该算法只需要2条虚通道即可为Torus网络提供完全自适应、最短路径路由.下面将详细叙述算法的设计思想,具体算法以及无死锁证明将分别在5.2和5.3介绍.

Gear算法基于网络中心距离的概念,对通道的使用进行限制.算法中要用到两条虚通道,为了表述方便,用VC1,VC2分别表示虚通道1和虚通道2.

规则1:如果分组从源到目的节点不需要过环绕通道,VC1提供完全自适应路由.

规则2:如果分组从源到目的节点不需要过环绕通道,VC2提供维序路由.

规则3:如果分组从源到目的节点需要过环绕通道(1条或者更多),VC1提供从A到B的路径,当且仅当满足CD(A)≤CD(B).

规则4:如果分组从源到目的节点需要过环绕通道,分两种情况:(1)VC2提供从A到B的路径,若CD(A)>CD(B);(2)用l表示分组需要过环绕通道的最低维,如果分组头微片在维l的边界节点,则提供该维方向上的环绕通道.

规则1、2表示,对于从源节点到目的节点不需要过环绕通道的分组,VC2提供连接的、无死锁的确定性路由—维序路由,VC1提供所有可以使分组向目的节点靠近的路径—完全自适应路由.VC2保证分组最终能够传递到目的节点,VC1为路由提供自适应性,提高网络性能.

规则3和4为需要过环绕通道的分组提供了路径选择.如果分组需要过环绕通道,VC1使分组向中心距离不小于当前节点的节点路由;VC2不仅提供中心距离减少的路径;当分组在需要过环绕通道的最低维的边界节点时,还提供通过环绕通道的路径.

根据某一时刻分组是否要过环绕通道,可以将分组分为两类{M1,M2},M1表示不需过环绕通道的分组,M2表示需要过1条甚至更多条环绕通道的分组.显然,分组在不同的时刻可能属于不同的集合.例如某一时刻分组m属于分组集M2,但若干个时钟周期后,分组m可能已经通过了所需通过的所有环绕通道,从而成为分组集M1中的一员.也就是说,属于分组集M2的分组可以向M1转化;但是,反过来不成立.

借助分组集的概念不难发现,规则1和2保证分组集M1中的分组最终能够路由到目的节点,而规则3和4保证分组集M2中的分组一定能向M1转化.Gear仅用2条虚通道为虚切通交换Torus网络提供了连接的、无死锁、完全自适应路由.Gear的无死锁证明将在5.3节给出.

5.2算法描述

依据5.1节算法规则,图5为适用于n-D Torus网络的Gear算法.首先,计算当前节点和目的节点每一维上的偏移,如果所有维的偏移均为零,那么分组到达目的节点;如果偏移不全为零,调用函数checkWraplink()计算分组从当前节点到目的节点需要通过环绕通道的次数:若c=0,分组不需要过环绕通道,那么调用函数noWraplink()为分组选择输出路径;若c≠0,那么调用函数Wraplink()为分组选择输出路径.图6所示为函数noWraplink(),图7所示为函数Wraplink().

如图6所示,函数noWraplink()示出了不需要过环绕通道的分组的路由过程,VC1通道为分组提供完全自适应路由,也就是说,对于任意维i,如果0< offi ≤ k/2 或者 offi < -k/2,提供VCi,1+(VCi,1+表示第i维正方向上VC1通道);如果-k/2 ≤ offi < 0或offi > k/2,提供VCi,1-.而VC2通道为分组提供维序路由,用j表示偏移不为零的最低维,如果offj > 0(offj < 0),则提供VCj,2+(VCj,2-).选择函数select()在所有可选路径中选择一条作为分组的下一跳:

图7中函数Wraplink()示出了需要过环绕通道分组的路由过程,此时可以认为VC1和VC2为分组提供完全自适应路由,但是这些路径必须要满足算法对VC1和VC2通道的限制,函数VC1_Restrain()和VC2_Restrain()将对以上提供的路径进行判断,如果满足算法要求则返回该路径;否则返回?.步骤b)到c)即实现了以上的路由过程.根据Gear规则4,设分组需要过环绕通道的最低维为l,那么若分组当前在第i=l维的边界节点,那么VC2通道为分组提供过环绕通道的路径.具体过程如步骤d)所示,如果ci=0,那么为分组提供环绕通道VCi,2-;如果ci=k-1,那么为分组提供环绕通道VCi,2+.

5.3无死锁证明

无活锁、饿死和死锁是对路由算法的最基本的要求,无活锁是指分组不会在目的节点周围游荡;无饿死是指分组申请的资源不会总是被其他的分组占用;无死锁表示分组不会在网络中永久阻塞,也就是说分组最终能够到达目的节点[10].解决活锁和饿死问题相对比较简单,最短路径路由是解决活锁最常用的方法,而使用正确的资源分配策略会消除饿死[2].死锁是迄今为止最难解决的问题,处理死锁有三种策略:死锁预防、死锁避免和死锁恢复.Gear采用正确的资源分配策略,并提供最短路径路由,故不存在活锁和饿死问题.因此,本节只给出Gear算法无死锁特性证明.

Verbeek[29,30]对Duato关于自适应路由算法无死锁的充分必要条件[17]进行了修正,并给出了新的充分必要条件以及相应的死锁检测算法.在算法设计的过程中,本文使用该理论对算法进行了检测,结果是无死锁的.

6、试验结果与性能分析

为了研究本文提出的完全自适应路由算法Gear的性能,开发了一个微片级的互连网络模拟器.模拟器实现了以上算法,并实现了Torus网络维序路由算法DOR以及Duato协议.通过比较以上算法在同一个模拟器下的性能,来验证Gear算法在高效利用资源实现高性能路由方面的改进与提高.

实验中采用分组路由的平均延迟以及标准化可接受流量来衡量算法性能.延迟是指从分组开始发送到目的节点接收所经历的时间.单个分组的延迟是不重要的,在多数情况下,平均延迟直接关系到网络性能.标准化可接受流量是指吞吐率除以网络饱和负载,在一定的负载条件下,较低的延迟和较高的可接受流量意味着该算法具有更好的性能.

所用到的网络结构为8×8,使用三种不同的流量模型来检验算法性能:均匀流量模型、对位传输模型和热点流量模型.在均匀流量模型下,每一个节点等概率发送分组到其他节点;在对位传输模型下,节点(i, j)只发送分组到(j, i);在热点流量模型下,一个或更多的节点被设为热点,它们将接收到比一般节点更多的流量,本文对单个热点的情况进行仿真,其位置随机产生,它将比其他节点多获得10%的流量.

下面将从流量模型和通道使用率等方面对算法Gear的性能进行研究.

6.1流量模型

本节讨论算法在不同流量模型下的性能:我们比较了在不同流量模型下,2条虚通道下Gear与DOR以及3条虚通道下,Gear和Duato协议在各流量模型下的性能比较.Gear提供完全自适应路由,DOR为确定性路由,为比较算法的性能,将Gear与Torus网络完全自适应路由算法——Duato协议进行对比.Duato协议需要3条虚通道来实现完全自适应路由,其中2条虚通道提供逃逸通道,另外1条通道提供自适应通道,这是迄今为止在Torus中实现自适应路由所需虚通道的最小值.为了公平起见,Gear也使用3条虚通道.

如图11示出了均匀流量模型,使用2条虚通道情况下算法Gear、DOR和使用3条虚通道情况下Gear和Duato协议的性能曲线.从图中可以看出,(1)在同等条件下,Gear分别优于DOR和Duato协议:当标准化实用负载达到0.3时DOR趋于饱和,Gear(2VC)的饱和点在0.48;Duato协议在0.5时趋于饱和,而Gear(3VC)的饱和点在0.6左右.综上,Gear(2VC)性能较DOR提高了67%;Gear(3VC)性能较Duato协议提高了20%.(2)Gear只需2条虚通道可以为分组提供完全自适应路由,Duato协议需要使用3条虚通道才能为分组提供完全自适应路由.但是从图中不难看出,Gear在2条虚通道情况下,性能与Duato协议差别不大,仅为4%.(3)另外在网络流量不断增大的情况下,算法Gear为分组提供完全自适应路由,性能一直优于DOR;Gear(3VC)增加1条通道用于完全自适应路由,使整体性能大幅提升,特别在高负载情况下性能改善更加明显.

图12和图13分别示出了在对位传输模型和热点模型下,算法Gear(2VC)与DOR,Gear(3VC)与Duato协议的性能曲线的性能比较.从图中可以看出,无论在哪种流量模型下,Gear为所有分组提供所有的最短路径,而DOR只提供一条确定路径,从而获得了性能上的极大改善.在对位传输模型下,Gear的饱和点为0.4,DOR的饱和点为0.2,提高了1倍.在热点模型下,Gear(0.45)较DOR(0.25)提高了80%,也就是说,在网络负载较大时,Gear能够为分组提供自适应度,分组可以选择所有最短路径进行路由,从而能够有效的减少拥塞和消息延迟,提高网络吞吐,改善网络性能.如图13所示,Duato协议在0.44趋于饱和,而Gear在0.55趋于饱和,提高了25%左右.另外,不管在低负载还是高负载情况下,算法Gear性能都优于Duato协议,特别是在高负载情况下,优势更加明显.在对位传输模型下,Gear的性能也优于Duato协议,性能改善12.5%.

6.2通道使用率

本节将进一步分析算法Gear,并从通道使用率的角度来解释,Gear性能优于DOR的原因.本节实验在均匀流量模型下,在相同消息注入率时,分析Gear和DOR对虚通道1和虚通道2的使用情况.如表1所列,在相同注入率下,Gear对两条通道的使用更加均衡.如在负载为0.35的情况下,Gear对VC2的使用率34.05%较DOR(7.63%)提高了3.5倍.然而,从整体上来说,两条通道的使用率还不够均衡,因此在后续工作中,将根据这一现象,对虚通道的使用进一步优化.

7.结论

随着云计算和大数据技术的发展,以及互联网+时代的到来,存储海量数据信息的数据中心越来越成为这些热点技术的关键。为数据中心网络选择合适的网络拓扑以及设计高效的路由算法,至关重要。Torus网络在当今数据中心网络以及商用超级计算机中得到了广泛应用,同时也引起了学术界的广泛研究.路由算法是决定网络性能的关键因素之一,设计高效无死锁自适应路由算法是提高网络性能的重要方面.本文基于网络中心距离的概念,通过限制部分虚通道的方法,为Torus网络设计了无死锁自适应路由算法Gear,仅利用2条虚通道实现了Torus网络的完全自适应路由.这是迄今为止,在Torus网络中实现完全自适应路由的所需虚通道数的最小值.仿真试验表明,在同等条件下,与DOR和Duato协议相比,算法Gear获得了不低于20%的性能改善,具有更低的网络延迟以及更高的网络吞吐;且Gear均匀使用2条虚通道.该算法具有非常重要的实用价值.

参考文献

[1] DALLY W. J.,TOWLES B. Principles and practices of interconnection networks[M]. San Francisco CA: Morgan Kaufmann, 2004: 112-321.

[2] DUATO J., YALAMANCHILI S., et al. Interconnection Networks: an engineering approach[M]. San Francisco, CA: Morgan Kaufmann, 1997:1-204.

[3] DALLY W. J., SEITZ G. L., Deadlock-free message routing in multiprocessor interconnection networks[J], IEEE Transaction on Computers, 1987, 36(5): 547-553.

[4] MATSUTANI H., KOIBUCHI M. et al. Fat H-Tree: A cost-efficient tree-based on chip network[J], IEEE Transaction on Parallel and Distributed Systems, 2009, 20(8): 1126-1141.

[5] 赵宏智.2D Mesh片上网络中交换机服务性能影响的研究及其拓扑改进[J].电子学报,2009,37(2):294-298.

ZHAO Hong-zhi. Study of the impact of switch service performance on 2d mesh network on chip and its improved topology[J]. Acta Electronica Sinica, 2009, 37(2): 294-298.(in Chinese)

[6] 顾华玺,刘增基,等.Torus网络中分布式自适应路由算法[J].西安电子科技大学学报(自然科学版),2006,33(3):352-358.

GU Hua-xi, LIU Zeng-ji, et al. Distribute adaptive routing in torus networks[J], Journal of Xidian University (Science), 2006, 33(3):352―358.(in Chinese)

[7] ADIGA N. R., BLUMRICH M. A., et al. Blue Gene/L Torus interconnection network[J], IBM Journal of Research and Development, 2005, 49(2): 265-276.

[8] SCOTT S., THORSON G. The Cray T3E Network: Adaptive routing in a high performance 3d torus: HOT Interconnects IV[C], Stanford University, 1996.

[9] DALLY W. J. Virtual-channel flow control[J], IEEE Transaction on Parallel and Distributed Systems, 1992, 3(3):194-205.

[10] SCHWIEBERT L., JAYASIMHA D. N. A necessary and sufficient condition for deadlock-free wormhole routing[J], Journal of Parallel and Distributed Computing, 1996,32(1):103–117.

[11] LINDER D. H., HARDEN J. C. An adaptive and fault tolerant wormhole routing strategy for k-ary n-cubes[J], IEEE Transaction on Computers, 1991, 40(1): 2–12.

[12] GLASS C. J., NI L. The turn model for adaptive routing[J], Journal of The ACM, 1994, 41(5):874-902.

[13] CHIU G. M. The odd-even turn model for adaptive routing[J], IEEE Transaction Parallel and Distributed Systems, 2000 11(7): 729- 738.

[14] CHIEN A., KIM J. H. Planar-adaptive routing: Low-cost adaptive networks for multiprocessors[J]. Journal of the ACM, 1995, 42(1):91-123.

[15] XIANG Dong, ZHANG Yue-li, et al. Practical deadlock-free fault-tolerant routing in meshes based on the planar network fault model[J], IEEE Transaction on Computers, 2009, 58(5): 620-633.

[16] XIANG Dong, WANG Qi, et al. Deadlock-free fully adaptive routing in tori based on a new virtual network partitioning, 37th International Conference on Scheme Parallel Processing, 2008[C]:612-619, 9-12.

[17] DUATO J. A new theory of deadlock-free adaptive routing in wormhole networks[J], IEEE Transaction on Parallel and Distributed Systems, 1993 4(12):1320-1331.

[18] CHEN J., XU D., et al. A positive-first and negative-first fault-tolerant routing schemes for concave and convex faults, In Proceedings of the Future Computer and Communication Conference 2010[C]. 1(1):53-58.

[19] XIAND Dong. Deadlock-free adaptive routing in meshes with fault-tolerance ability using channel overlapping[J], IEEE Transaction on Dependable and Secure Computing, 2011, 8(1): 74-88.

[20] PUENTE V., BEIVIDE R., et al. Adaptive bubble router: a design to improve performance in torus networks, International Conference on Parallel Processing 1999[C]: 58-67.

[21] XU Yi, ZHAO Bo, et al. Simple virtual channel allocation for high throughput and high frequency on-chip routers, IEEE 16th International Symposium on High Performance Computer Architecture, 2010[C]:1-11, 11-14.

[22] FU Bin-zhang, HAN Yin-he, et al. An abacus turn model for time/space-efficient reconfigurable routing, International Symposium on Computer Architecture, 2011[C]. San Jose, CA: ACM Sigarch Computer Architecture News, 2011:259-270.

[23] 马立伟,孙义和.片上网络拓朴优化:在离散平面上布局与布线[J].电子学报,2007,35(5):906-911.

MA Li-wei, SUN Yi-he. Network-on-Chip topology optimizations: floor-plan and routing on discrete plane[J], Acta Electronica Sinica, 2007, 35(5): 906-911.(in Chinese)

[24] 肖灿文,张民选,过锋.环网中的维度气泡流控与自适应路由算法.计算机研究与发展,2007,44(9):1510-1517.

XIAO Can-wen, ZHANG Min-xuan. Dimensional bubble flow control and adaptive routing algorithm in torus networks[J], Journal of Computer Research and Development, 2007, 44(9): 1510-1517.

[25] RAMANUJAM R. S., LIN B. Weighted random routing on torus networks[J], IEEE Computer Architecture Letters, 2009, 8(1):1-4.

[26] ASCIA G., CATANIA V., et al. Implementation and analysis of a new selection strategy for adaptive routing in networks-on-chip[J], IEEE Transaction on Computers, 2008, 57(6):809-820.

[27] LUO Wei, XIANG Dong. An efficient adaptive deadlock-free routing algorithm for torus networks[J], IEEE Transaction on Parallel and Distributed Systems, 2012, 23(5):800-808.

[28] MATSUTANI H., KOIBUCHI M., et al. “Prediction Router: A low-latency on-chip router architecture with multiple predictors[J], IEEE Transaction on Computers, 2011, 60(6):783-799.

[29] VERBEEK F., SCHIALTZ J. A comment on a necessary and sufficient condition for deadlock-free adaptive routing in wormhole networks[J]. IEEE Trans. Parallel Distribute System, 2011, 22(10):1775-1776.

[30] http//:www.eurotech.com.cn/en/hpc/hpc+solutions/data+center+hpc 

(责编:王妍(实习)、燕帅)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部