首页 > 企业

2020企业要乘“热风”起航

2020/01/07 14:58      北国网   


  在2019年,AI、5G、IoT等关键词备受关注,即使各位不甚了解,也隔三差五在电视、网站或文章里看到。内容无一不是表达新的风口正在逐渐形成。那么在2020年里,真正的风口将会有多少?更重要的是,企业该如何在风口下起航前进呢?

  风头正劲

  本文以目前最热门的AI(人工智能)来说,在Gartner公布的2019年5大前沿技术创新趋势中发现,大部分技术都是围绕人工智能来进行,如无人自动驾驶、情感分析、AI-PaaS等等。可以说,如果这些新技术没有AI的支持,将会变得寸步难行。更何况目前我们已经在使用的语音识别控制、机器视觉识别、虚拟现实等应用都是依赖AI的助力才得以“起飞”。

  正如最近Gartner研究副总裁Brian Burke 在一个采访中指出:“人工智能渗透到了其他所有趋势中。”的确,AI从诞生以来,理论和技术不断成熟,每年应用的领域也在成倍地扩大。与此同时,AI“成熟的香味”也在不断“渗透”大家的期望。

11-min

  从上图我们可以看到,对于未来5-10年间(中期)稳定的技术,人们的期望是处于持续上升阶段,所以相信在未来一段时间内,市场对这些技术的部署和投入也会相应地增加。而且相比5G技术,AI相关技术可以更快地挖掘新的需求和场景,这对于消费者还是产业链来说,都能够较快地尝到“甜头”,那么企业作为新技术发展的先导力量,如果要紧贴市场潮流,大力研发/采用AI技术已是似箭在弦。

  事实上,全球企业都在付诸于行动,希望通过AI技术改进现有业务。2018年,亚马逊花费10亿美元收购了美国公司Ring Inc.大力发展它的智能家居业务,谷歌则在上年6月宣布有意花费26亿美元收购商业智能公司Looker Data Sciences,随后与Google Cloud Platform(GCP)合并,从而推动其利润丰厚的云计算业务的发展。还有牙膏厂刚刚宣布了将以20亿美元收购以色列AI公司Habana Labs,推进AI战略,并增强数据中心AI产品组合。

  全新玩法

  随着AI技术发展以及相关产品的涌现和落地,GPU服务器也凭借自身强大的运算能力,出现在各大机房的采购目录里,旨在帮助企业加速进行训练和推理。可是由于AI的划时代性,无论是数据中心还是企业用户,都不可以完全套用过往的“那一套”来使用GPU服务器。

  其一,AI的数据存储要求会根据应用程序和数据的不同而有很大差异。据Gartner称,用于零售POS数据集通常是100MB至200MB,配备传感器的现代客机每次航班将产生50GB至100GB的维护和运营数据。而根据Intel首席执行官Brian Krzanich称,未来一辆无人驾驶汽车每分钟将收集100GB的数据量。若果真如他所言,一辆无人驾驶汽车中的传感器每小时大概产生5TB的数据,1个季度下来大概是11PB,那么200辆车每季度估计产生2.2EB。

  由于GPU具有成本效益和巨大的知名度,GPU成为无人驾驶技术最主要的芯片架构。在这方面,英伟达似乎取得了较好的发展。继15年的Drive PX,它又推出了Pegasus,用于增强5级自治。这是在它的CUDA GPU上构建的,CUDA GPU的计算速度提高了10倍,功耗降低了16倍。配备了这些具有5级功能的GPU,或许无人驾驶汽车很快就会应用在机场或大学校园等受限环境下的打车服务。据外媒报道,德国汽车零部件供应商罗伯特.博世(Robert Bosch GmbH)和商用车制造商戴姆勒(Daimler AG)已经与英伟达达成合作关系,将从2020年开始把Pegasus系统用作进行自动驾驶汽车设计的平台。

  除了汽车领域外,医疗领域也是AI的应用重地。诸如谷歌、苹果和腾讯之类的科技巨头正在研发GPU产品来改善全球医疗保健,如预测分析患者病情。大家还记得谷歌于2014 年宣布收购英国AI公司 DeepMind的新闻吗?最近,谷歌已经完成了对其医疗部门的收购。据了解,该争议性收购主要体现在医院患者和研究数据及应用的控制权,虽说相关医院表示匿名数据是经过加密的,而且将保留对匿名数据的控制权,并负责决定如何使用它。但是考虑到重新识别的风险,这些“匿名”的高维健康数据让社会保留怀疑态度。其实不单单是医健行业,还有金融、军工等需要高度隐私和安全的行业在选用新技术和应用的时候,往往会由于合规性面临许多考虑,并不能如互联网企业一般迅速调整架构,享受GPU运算的好处。

  其二,AI的整个生命周期对存储和I / O的要求尽不相同。常规的AI系统需要训练,如深度学习系统具有自我训练的能力,因此需要不断地访问数据。在这阶段,它们将变得更加I/O密集型,这是他们可以使用闪存和NVMe的地方。但是在“推断”阶段,他们将更多地依赖于计算资源。

  当一些企业谈及用于机器学习(ML)或深度学习(DL)的存储时,它们通常只是意味着对模型进行训练,而这需要非常高的带宽来让GPU保持繁忙。但是,对于数据科学团队来说,真正提高生产力在于管理从挖掘到推断的整个AI数据管道,但它既不是线性的也不是固定的。

  对AI程序来说,它与传统业务分析,ERP和数据库系统这些都没有什么不同。它也需要大容量存储,也就是说旋转磁盘,云甚至是磁带。随着时间节点的不同,他们所处的存储环境也可能不同。但唯一不变的是,保证满足业务以及灵活性要求。

  对于拥有大量数据的企业来说,云存储虽然是个十分吸引人的选项。但这并不意味着把所有AI数据都要放到上面。一般情况下,大部分企业在刚刚创立的时候业务量较少,收集的数据也少,那么上公共云即可解决业务问题,可是随着业务场景的增多,数据变得越来越多且复杂,原有的云策略不再好使,而选择私有云、多云,甚至采用混合云策略显得更为合适。

  再者,存储取决于特定的用例和算法,对于某些应用程序,例如DL,它是计算密集型的。对此,我们看到客户使用GPU密集型架构。另一方面,对于存储密集型的应用程序,最好将计算放到数据所在的位置。所以,GPU密集度较低的应用程序很可能成为云计算的候选者。例如,谷歌已经开发了AI专用芯片来与其基础设施一起工作。但是,正如IBM之前警告说的,鉴于技术和成本方面的限制,目前云支持AI的可能性更高,而不是成为AI的核心。

  抵御热浪

  俗话说,能力越大,责任越大。面对业务需求的不断提高,市面上的服务器也变得更加强大。它们的性能越强,所消耗的电量和产生的热量也就越大。据APC报告数据,能源消耗只有大概47%进入到服务器中,而41%则被散热消耗掉,由此可见制冷消耗的电力占据服务器电力消耗很大的比重,从而大幅度增加数据中心TCO。

  事实上,GPU服务器的“强势进驻”,让这两个问题更加突出。对此,各方为了应对这 “高热高耗”的未来热潮,不惜重新设计数据中心内的散热和冷却系统,为它们 “上刀山下火海”。

  在2017年10月,腾讯就将数据中心放进了山洞。这个山洞数据中心坐落于我国贵州贵安,那里年平均气温12.8—16.2℃,常年恒温恒湿且自然灾害甚少,十分适合建设数据中心。而且贵州作为西电东送的骨干电源地,数据中心用电电价十分地低,还有值得一提就是它的山洞结构不但提供了高隐蔽、高防护、高安全等特点,而且还充分利用自然冷源,帮助数据中心高效换热。

  2018年年中,微软则选择了把数据中心沉入海底。他们最主要的目的在于利用海底的低水温来为数据中心散热,降低制冷消耗的电力,降低PUE。当然,微软并不是第一个使用自然水源来达成冷却目的的公司,谷歌在早些年开始就用工业运河的水,甚至是下水道/马桶水来为数据中心冷却,因为他们意识到冷却系统所使用的水并不需要足够干净。

  除了外部环境外,数据中心的内部环境也是冷却的重要战场。

  数据中心内常见的风冷系统,大家都知道需要湿度控制,CRAC,制冷机,热/冷通道,高楼底,高架/特殊地板等等来达成冷却的效果。而对于最新的浸没式冷却来说,以上说的这些它都不需要,而且它不太需要十分大型的备用发电机(要求相对较低)。

  所谓浸没式冷却,顾名思义就是把完成的物理服务器放到热传导介质液体中,使液体与热组件充分直接接触,然后通过冷热交换器将热量从系统中除去。

  虽说浸没式冷却在上一年才成为热点,但是行内实践从几年前就已经开始了。如阿里的张北数据中心在2018年就已经采用了浸没液冷的生产集群,规模大概2000台服务器。据称,全年平均PUE值1.09,基于PUE比较,浸入式冷却的能效比同气象区的风冷提升了12.8%。还有华中科技大学(大数据)、日本东京工业大学(超算)、CGG(地球物理)、Vienna Scientific Cluster(超算)等等组织。

  但总的来说,相比行间冷却及传统CRAC和冷风式冷却,它可以降低服务器功率(减少了服务器风扇消耗的能量),降低PUE。还有在总功耗(服务器和冷却系统)和总电力费用方面都省下不少。

  借力航线 加速出海

  回顾去年,各种AI服务器与数据处理解决方案的相继推出,促使AI产品和服务的发展。与此同时,在AI的驱动下,企业数字化转型也将进入“快车道”。新天域互联作为香港IDC,与中外企业客户频繁交流,都发现有一个共通点,就是他们都容易在起跑线迷失方向,尤其是出海企业,在互联上屡遭困境。

  在网络传输方面,除了必要的防护措施外,理想的企业网络一定是高连通率且低延迟性。选用互联网自不用说,核心业务数据一定要走SLA保证线路,如果走专线网络,就挑选适合自己的线路,然后以双线冗余点对点连接两地,充分保证网络稳定以及业务的不间断性。可是出海企业往往由于信息不对称的原因,在网络和数据中心选择上举棋不定,最终不但影响产品的上线时间,而且还浪费企业资源。对此,新天域互联凭借13年来的经验和资源,协助中外企业设计专属互联方案,包括互联网、专线、本地电路连接,数据中心选址、网络资源筛选等。

  或许部分企业以为目前使用的网络资源可以应付目前的业务情况,有时候即便效果不理想也要忍忍。但是从持续长远发展的角度来看,随着AI、5G、IoT、边缘等进一步发展,数据的样式和数量将会进入新一轮的井喷阶段,也就是说目前的高品质网络资源对于未来企业来讲是必需品。

  同样,对于云数据存储,越来越多的企业正在重新调整云策略以便适应未来数据的发展。但是许多企业都面临着共同的问题,如复杂工作负载迁移、筒仓、SLA不一致等,这些都间接增加了企业的运营成本和风险。为了帮助企业解决以上问题,根据我们过往的案例经验,我们强力建议采用一致性混合云平台,以此达到一致的管理和运营、工作迁移简化、一致的安全策略管理等目的。

  毕竟,过去十年企业可能以办公大楼彰显企业实力,而在未来十年,企业将以数据和网络展现自身发展潜力。

  榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。

相关阅读