TensorFlow™

TensorFlow TensorFlow是一个使用数据流图进行数值计算的开源软件库。图中的节点表示数学运算,而图边表示在它们之间通信的多维数据阵列(张量)。

其灵活的架构使您可以使用单个API将计算部署到桌面、服务器或移动设备的一个或多个CPU或GPU。TensorFlow最初由谷歌的机器智能研究机构下属的Google Brain团队的研究人员和工程师开发,目的是进行机器学习和深度神经网络研究,但该系统具有足够的通用性,也可用于其他各种领域,如语言翻译、医学研究、自动驾驶汽车、图像识别、安全等等。

RDMA技术扩展了分布式系统的性能边界。TensorFlow利用高性能的开源通用RPC框架(gRPC)来传输数据,并利用基于RDMA的gRPC,其性能比基于TCP的gRPC高322%。

TenserFlow
将RDMA用于TensorFlow的另一种方式是使用MPI(消息传递接口)。MPI版本的TensorFlow提供MaTEx(Machine Learning Toolkit for Extreme Scale——用于极限规模的机器学习工具包),这是一套高性能机器学习和数据挖掘(MLDM)算法。



Mellanox®解决方案

Mellanox I/O网卡可提供高达200 Gb/s的可靠无损连接,延迟不到1微秒,消除了处理瓶颈。一个网卡即可为整个刀片服务器系统提供最优连接,从而为数据中心节省维护多个以太网网卡的成本。作为分布式机器学习框架的最佳选择,只有Mellanox能够提供本机加速引擎,如RDMA、GPUDirect® RDMA以及SHARP™ v2,以大大提高认知计算应用的性能。 Mellanox InfiniBand交换机和网关还能帮助实现数据中心结构整合,从而进一步提高性能。