COVID-19危机揭示了远程数据中心管理的优点

在Nutanix和其他地方的IT领导者考虑人工智能驱动的未来时,熄灯操作和自动化提供了及时的好处。

由斯坦·吉布森

由斯坦·吉布森2020年5月22日,

尽管新型冠状病毒颠覆了人们的日常生活,但许多组织的IT业务都表现出了惊人的韧性。原因是:数据中心的自动化和远程操作技术在没有直接人力参与的情况下保持了正常运转。

Nutanix首席信息官温迪·m·法伊弗(Wendy M. Pfeiffer)说:“疫情期间,当我们转向在家工作时,我们的全球数据中心服务没有中断。”她指出,Nutanix在一年前将其三个主要数据中心从加州迁往其他州时,已经通过软件定义网络(SDN)实现了远程操作,这使该公司受益匪浅。

Pfeiffer解释说:“我们现在可以远程提供和关闭网络,而不是让现场的网络工程人员经常配置物理交换机和路由器。”

(相关的故事:COVID-19期间依赖远程IT

Nutanix的IT系统架构师Eric Pearce表示,该公司不需要通过在他们的Big Switch Networks SDN(最近被Arista收购)上自动化网络管理任务来单独配置数百个网络交换机。

皮尔斯说:“我们目前正在编写使用大交换机REST API的Python代码。”

Big Switch产品还集成了Nutanix Prism虚拟数据中心管理平台,因此Prism管理员可以在Prism GUI中配置所有的集群网络,而不需要网络团队的参与。

皮尔斯说:“在过去,‘棱镜’系统的管理员必须通过售票系统请求网络变更,并且必须等待网络团队的回应。”“这种大交换机和棱镜的集成为Nutanix管理员带来了自助服务网络。”

减少人为错误

尽管数据中心自动化和远程操作在这个不寻常的时期获得了回报,但它们解决的一个经常性问题是人为错误导致的停机。关于人为错误的作用有多大,研究各不相同,但是正常运行时间研究所估计70%的数据中心故障是由人为错误造成的。

IT业现在正处于转型之中。我们正在升级这些工作。它不是关于比特和字节,而是关于理解工作负载。

Steve McDowell, Moor Insights & Strategy高级分析师

撇开数字不谈,即使是一个人为的错误也会造成严重的后果。例如,在2017年,a英国航空公司(British Airways)停机追踪到了一个工程师他把电源拆了又重新接上了。由此产生的电涌损坏了IT设备,导致数百架航班取消,并导致1.12亿美元的客户退款和赔偿。

这个事件是一个例子,说明为什么远程管理有时比现场更好。

皮尔斯说:“远程管理网络基础设施比指派一个人在现场执行任务更有效。”“如果有人经过货架,它在视觉上可能看起来不错。但我们可以(远程)使用BigSwitch SDN的功能来确定一切是否正确连接,并验证实际的连接。”

修复物理电缆问题仍然是一项必须在现场解决的手工任务。

皮尔斯说:“我们已经创建了一些工具,允许远程和现场的华盛顿工作人员立即核实和审计他们自己的工作,而不需要依赖外部团队。”

AI成为桌上筹码

Moor Insights & Strategy公司存储和数据中心技术高级分析师Steve McDowell表示,人工智能(AI)正在推动远程数据中心和网络的复杂熄灯管理,它可以节省劳动力并增加正常运行时间。

麦克道尔表示:“我们看到所有供应商都在实现基于人工智能的决策协助。”例如,存储设备可以发送与人工智能算法相关的信息,以预测故障。

麦克道尔解释说,在另一种情况下,IT可以在考虑扩容时对数千个虚拟桌面基础设施(VDI)节点的行为进行建模。他补充道:“如果你要交付基础设施自动化工具,人工智能驱动的预测分析工具现在几乎是桌上筹码。”

麦克道尔表示,越来越自动化和远程操作的趋势将改变IT运营经理的工作描述。

他说:“IT业目前正处于转型之中。”“我们正在提升这些工作。更多的是了解工作负载,而不是比特和字节。”

麦克道尔解释说,人工智能工具的使用增加将有助于IT专业人员对应用程序性能进行建模,并使他们能够做出财务决策,决定这些工作应该在哪里运行,无论是在内部还是在云上。

大流行的教训

尽管自动化数据中心经受住了冠状病毒风暴的考验,但这场大流行提供了一场压力测试,将为未来提供教训。

麦克道尔说:“从现在开始的六个月后,IT部门将回顾过去,并询问这是困难还是容易,以及痛苦在哪里。”“我们正在进行一项伟大的实验,它将揭示自动化方面的差距。您将看到对什么有效,什么无效的认识,这将使IT更倾向于软件定义的基础设施。能够感知云的(软件定义的)工具将上升到顶端,因为你需要在云上和云上提供(资源)。”

据Pfeiffer说,Nutanix在这条路上走得很好。

“我们已经在混合云模式下运营。我们在亚马逊和谷歌提供的公共云基础设施上有大量业务。”

当冠状病毒导致需要使用该公司Citrix VDI实现的远程工作员工数量突然激增时,这种混合模型就派上了用场。

Pfeiffer说:“我们在其中一个数据中心运行了一个重要的Citrix农场,它支持大约2500个远程会话。”“然而,随着越来越多的工程师开始在家工作,容量已经达到极限,我们没有在数据中心采购和配置额外的服务器,而是在AWS中配置了额外的VDI容量,以扩展我们的Nutanix Frame VDI农场。”

“今天,我们在使用Nutanix Frame的[Amazon Web Services]和在我们的数据中心使用在Nutanix [Acropolis Hypervisor]上运行认证的Citrix运行数千个VDI会话。这种混合模式是可能的,因为这两个环境共享我们的混合操作系统(Acropolis Hypervisor和Acropolis操作系统)的底层基础,不需要实际动手配置,”Pfeiffer说。

放眼全球,无需水晶球就能看到更智能、更强大的远程数据中心运营管理就在前方。

皮尔斯说:“你不能进入数据中心并不重要,不管数据中心是在你的大楼里还是在千里之外,管理流程都是一样的。”

展望未来,他说,IT团队应该从一开始就以这种方式设置事情。

斯坦·吉布森是一位有36年科技记者经验的特约作家。

©2020 Nutanix, Inc.保留所有权利。如需其他法律信息,请去这里

相关文章

hybrid-multicloud-interoperability-in-cloud-computing
技术

混合多云互操作性的竞赛

Red Hat的Ron Pacheco解释了与Nutanix的新合作关系是如何因客户需要构建和管理跨私有和公共IT基础设施的应用程序而引发的。

Baidu