最近朋友圈有人收到服务器更新的消息,在某云微博下面,也有不少网友反馈,云服务器宕机。接着就在圈里到处传,有人担心自己的网站服务器受影响会中断,无法正常登陆。
服务器宕机是指服务器因为某些原因而导致服务器无法运转,造成网络无法正常使用。对于网站来说,服务器宕机所造成影响很大,它会造成访客无法访问网站。
服务器出现宕机的常见原因有:
在运行环境方面,最普遍的问题是磁盘空间耗尽。
在性能方面,最普遍原因是运行很烂的SQL,但不排除由服务器Bug或错误的行为导致。糟糕的Schema和索引设计是第二大影响性能的方面。
一致性方面通常由于主备数据不一致导致。
数据丢失方面通常由于Drop Table的错误操作导致,并总是伴随着缺少可用备份的问题。
单独服务器一旦中断造成的影响有:
1)对贸易企业来说,特别是有交易的平台来说服务器中断就是现金流的中断;
2)对本地监控有秒级要求的企业来说,油温油压脱离监控,一旦超温超压的情况而没被监控到,发生重大人身财产损失可能极大;
3)对远程监控领域来说,会造成监控数据无法获取,无记录。通常来说服务升级会在15分钟左右完成,期间服务器会重启并且用户无法操作,当天快照可能失效(数据自动备份功能将会没有当天的记录)。对于长时间未重启或升级过内核、驱动但未重启过的,当次重启可能会有文件系统检查、相关配置改动生效启动失败等问题。中断时间越长,数据不连续对分析来讲是无意义的,中断2-3天是不能接受的。
4)IO性能下降:迁移后由于底层还需要追加数据,所以IO性能会有所下降,同时快照和磁盘功能也将关闭。一旦数据追加完毕后,IO性能、快照和磁盘功能都将自动恢复,通常100GB的数据需要4个小时左右。
企业采用单独服务器,容易产生不稳定性因素,因而选用一个武装到高端的云服务器是一个监控系统实现稳定运行的根本保障。
稳定原因:集群服务器VS单独服务器 完胜
TAOKE的服务器采用的是阿里云的集群服务器组,多热机执备,自动切换,24小时永远在线。监控企业的平台若采用单台单功能服务器,情况就不是永远在线,断了就是断了,用户无法访问,无法满足不间断的要求。所谓双热机热备,就是将功能服务器设置成互为备份的两台服务器,两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据。
TAOKE集群服务器方案的优点:
1、宽域强大的可应用性与更高的可扩展性
2、灵活的负载均衡与及时有效的错误恢复
3、实时心跳监测与快速高效的漂移IP
未完待续。。。。