服务器定制化早已不是什么新闻,以互联网大佬为首的业界新贵们正在用自己的方式为服务器行业的未来打造新的路径。Open Compute Project(OCP)自2011年启动以来,发展迅猛。而其与之对应,国内“天蝎计划”不温不火。这其中到底有哪些原因?
联想集团企业业务集团IPDC产品开发总监谢政维
联想集团企业业务集团IPDC产品开发总监谢政维日前接受了媒体专访,介绍了联想作为最早参与天蝎计划的厂商之一,是如何看待目前天蝎项目,以及他对未来天蝎发展的观点。
天蝎项目的前世今生
Facebook主导的“开放计算项目”(OpenComputeProject)在国外已经风生水起。在国内同样由互联网老大牵头,天蝎计划在2011年被正式提出,并在同年年底确立了最初的技术规范。在这个项目中,由BAT三巨头及中国电信主导,旨在为互联网数据中心定制IT基础架构。从技术规范来看天蝎以整机机柜服务器机架作为一个解决方案,该方案采用模块化设计,分为机柜模块、网络模块、供电模块、服务器节点、集中风扇散热模块、集中管理模块六大部分。在机柜模块上,采用当前最为成熟流行的标准尺寸,实际可用空间为44U,最多可部署120台服务器。
在天蝎1.0中,天蝎项目的机柜的主要标准为44U标准机柜,最小单位为1U,承重标准为1200KG,分为上中下三个空间,1-20U和25-44U是计算节点的安装位,中间的4个U为网络设备的安装位。近日新发布的天蝎2.0整机柜服务器解决方案,是在天蝎1.0技术规范基础上的演进版本。仍然采用模块化设计方案,分为机柜子系统、网络子系统、供电子系统、服务器节点子系统、集中风扇散热子系统、集中管理子系统共六大部分组成。
主要改进点:
- 定义了2100mm、2300mm两种规格的机柜;
- 重新定义了机柜的内部尺寸,统一为538mm内框;
- 重新定义了每U的高度为46.5mm;
- 增强了机柜背板功能,并可实现热插拔维护;
- 服务器节点与机柜系统解耦,可实现服务器节点混插互换;
- 明确定义了风扇的尺寸,统一为140*38规格;
- 增加了2300mm机柜顶部扩展功能。
机柜子系统采用了当前流行标准机架的外形尺寸,高度为2100mm和2300mm两种规格、宽600mm、深1200mm。机柜实际可用空间分别为42U和46U,分为上、中、下三部分,最上面19U(或23U)、最下面20U为服务器和交换机空间,可部署1U1、1U2、1U3形态的服务器节点,或TOR网络交换机,且在机柜顶部预留扩展功能,实现交换机外置机柜顶部,对交换机数量进行扩展中间3U空间用于部署PSU和RMC单元。
集中电源子系统占3U空间,采用模块化设计方案。最多可容纳10个PSU模块,可提供双路输入冗余,实现N+N或N+1模块冗余,支持7~12KVA的供电容量。电源支持220VAC、380VAC、240VDC输入,集中输出至12VDC铜排,机柜内铜排设计分为上下两段,每段最大设计电流为600安培。服务器节点、FAN通过12VDC母排直接取电。谈到电源问题时,谢政维表示电源是一个比较基础的设施层面,还有应用负载对组件编排的管理。
集中风扇散热子系统,采用了风扇墙共享设计,由RMC或机柜背板(RBP)实现独立风扇控制。以CoolingZone为单位独立设计,采用了N+1冗余设计,可以实现独立维护,并对节点透明。
联想在天蝎2.0做了什么?
在天蝎2.0里面联想做了很多技术性的建议,谢政维举了个例子,在整机柜管理上面,百度本来的中板设计和背板设计是有一些问题的,联想在中板和背板设计提供一些自己的想法去说服百度去接受这样的想法,在天蝎计划上做这些修改。同时他表示在散热和供电上联想也有很多建设性的意见,目前还在测试之中,不方便透漏。同时在制造这方面,谢政维表示主板有一部分是自己设计,一部分跟外面的人去合作,电源部分也有合作伙伴,通过这些合作活动形成一个封闭的生态环境。同时联想和BAT等天蝎项目发起者会定期做一些交流,讨论。
对于天蝎的计算节点上的限制,谢政维表示目前大家都是以英特尔为base去做,但是并不是说技术上不支持别的技术,比如ARM和Power,浪潮现在是Open Power的联盟了,下半年它会推出Power8的服务器,他有可能把Power带入到天蝎,在技术上面是可达到的,但只是有没有这个需求,目前我不晓得。另外存储的部分,目前我所知道其他台湾ODM或者浪潮的设计并没有办法全部满足这三家的存储要求,但是联想在这个部分是满足三家要求的。在天蝎上面冷存储的概念,另外几家都没有冷存储的概念,目前只有联想有。他表示百度对冷存储要求会高一些,腾讯可能会对在线交互的响应、游戏要求高一些,阿里可能对在线处理高一些,不过在天蝎项目中百度和腾讯最关注的还是存储这一块。
如何胜出?求同存异!
和其他服务器厂商一样,联想在互联网大潮中同样面临着巨大的机会,联想服务器近年来在IPDC市场获得了高增速。IPDC中,特别是拥有大型数据中心的运营商、云提供商和大型互联网公司,对服务器有着特别的需求,比如集中部署能力、快速部署能力、高密度、低功耗等等。谢政维表示,天蝎的概念是一个整机房、整机柜的产品概念,不是只有BAT对这个有兴趣,其他的像京东、奇虎都有兴趣。作为最早参与天蝎计划的厂商之一,联想在整机柜产品上已经非常成熟。
天蝎计划中最主动的是BAT,它们提出了大量的需求,那么联想在其中的主要作用和贡献是什么呢?面对天蝎计划中其他的竞争对手,怎么样才能保证自己胜出呢?
谢政维表示联想做的有以下两点:首先BAT提出的是一个概念,联想在这边会针对这个概念去做一些实现,怎么把它实现这是联想要做的;其次面对这个概念中的不足,联想需要提出自己的意见,需要去修改完善。
谈及竞争对手谢政维认为只有做出有差异化的产品,才能够胜出!这个差异化主要体现在研发、产品、成本三个方面。他表示要想做出差异化产品,软件部分的独特设计尤为重要。好的设计可以帮助客户减少整机功耗,提升工作效率。在系统架构设计方面,联想努力让自己的产品具备同行厂商不具备的亮点。比如,在下一代服务器产品中,联想的2U产品将支持6+9的硬盘分区设计,同时支持8个PCI-E插槽;联想的1U服务器产品将支持14块硬盘,同时支持机箱的导轨设计,这样就能在1U的空间里放入2U的产品。联想正是凭借这样的高密度服务器产品,满足了腾讯、百度等互联网巨头的特殊需求,并在互联网企业市场获得可观的市场份额的。
天蝎中面临的问题
天蝎计划由BAT三巨头及中国电信主导,旨在为互联网数据中心定制IT基础架构。在这个过程中,服务器厂商也面临了很多难题。谢政维认为有三大难点:
- 结构设计,这是天蝎机柜设计最大的难点。首先宽度增加,以提供更大的硬盘空间;同时,天蝎机柜相当于一个40多U的大机箱。天蝎推出的是概念,而这个概念的落实就需要联想等服务器厂商动脑子了,机柜强度、可靠性、每个节点结构的设计困难我们都要一一克服。
- 电源配置与功耗管理。天蝎机柜采用集中电源,可以用很少的电源来实现1比1的冗余备份。但这对于整个机柜内部的电源配置、与背板的配合等带来了更大挑战,如何优化功耗更是重中之重。
- 管理性。包括电源管理、散热风扇管理等,都与传统服务器不同,需要研发团队专门设计。
当然,联想的研发团队一一攻克了这些难关。联想为客户提RMC(RemoteManagementController)进行以机柜为单位的集中管理,可以实现整个机柜的健康状况预警、管理,而不是单个节点。而针对天蝎中最为关键的功耗问题,联想成立了专属研发团队,最终通过电源配置、散热优化、软件管理等手段有效降低了功耗,仅风扇一项就节能10%。
天蝎未来的发展
谢政维很看好天蝎计划的未来,他表示国内“天蝎计划”不温不火。其根本原因是国内企业对于软件的要求不同,对于服务器的要求也不一样,同时功耗和价格是天蝎项目的最大拦路虎。
谈到联想的动作,他表示联想目前这个项目的人员投入有40-50人的团队。同时今年九月份会推出基于天蝎2.0的产品,主要是计算型和存储型这两个产品为主。他认为天蝎产品分为很多类型,所以很多产品都可以在天蝎计划中实现。联想的看法是,两年内天蝎会渐渐起步,如果能让大量的客户参与进来,让成本更有竞争力,同时天蝎产品功耗低、可管理性强过一般机柜产品,其市场占有率会越来越大。
同时,联想也准备好了抓住天蝎计划带来的市场机遇。目前,百度、腾讯、奇虎都是联想的重要客户,这与联想的快速交付能力是离不开的,联想通过产能优化和整机柜交付实现了交付能力的10倍增长,一天可交付3000台服务器。天蝎计划需要服务器厂商拥有强大的对产品进行深度定制的研发能力,而联想现在已经建立了强大的全球研发体系,在顺利收购IBMx86业务后,研发实力得到极大扩充,有更为充裕的资源用于天蝎产品的研发。
当问及对未来天蝎3.0的看法时,谢政维表示目前听到客户的声音是希望在2.0的基础架构上去发展3.0,他们不希望2.0的基础做太多的改变。3.0他们要求怎么样去做管理或者怎么样去做分配,目前天蝎的混合性部署他们现在都一直在想思考,但是怎样达成这一点他们还没有一个很好的结论,所以现在其实大部分有效性混合部署和管理。在管理软件方面天蝎3.0应该会做出一个比较大的调整。