首页 CICS内控学习文章正文

CICS内控学习:业务中断的风险暴露

CICS内控学习 2022年11月28日 10:59 376 内控网

国际注册内部控制师CICS内控知识学习 


 

  77.png


一、业务中断的风险暴露

 

随着信息化融入到组织的日常操作中,业务中断日渐成为一个更大的风险暴露。例如,如果航空公司的在线预订系统停止运行任何一段时间,预订机票业务将受到严重干扰。人们至多可以维护预订需求的列表,但是如果预订系统停机,则不能进行一系列的票务处理。

 

互联网化、信息化将成为业务处理更加不可或缺的组成部分。“未来办公室”的讨论使我们相信大多数业务功能将在信息化工具辅助下完成。因此,虽然业务中断在过去并未引起重大关注,但在将来可能会引起更大的关注。如果系统在IT方面没有得到足够的“备份”,那么在相关财务报告方面,风险暴露可能会持续上升。

 

业务中断包括造成计算机系统无法运行的任何事件。当系统无法运行时,这个时间段可能持续几分钟到好几个月。然而,不同组织而言,业务中断的严重性可能会完全不同。例如,某些组织的系统瘫痪几个小时,对业务来说,可能仅会产生微乎其微的影响,但是,对有些组织来说,几个小时的停机就是一场灾难。

 

评估人员要对造成业务中断原因的控制措施进行评估,其难度更大。。在大多数其他的风险暴露中,控制设计师处理的事情,其概率只能以一定程度的精度预测。导致业务中断的因素更难以预测,因此,也更难以评估其控制措施的充分性。

 

业务中断的风险暴露与三种应用系统活动密切相关:即传输、处理和存储

 

传输活动中的风险暴露取决于传输的距离和所涉及的手段。如果传输距离短,中断可能不太严重。例如,如果通过邮件发送信息并且两个点之间仅相隔几英里,传输中断会发生邮件报警,则可以制定出相应的替代方案。然而,如果距离较远或传输依赖于电子硬件,则传输问题将会导致业务中断。传输中断的原因包括:

 ● 通信线路故障;

 ● 通信设备故障;

 ● 发射设施的拆除或遭受其他破坏。

 

在业务中断的情况下,处理活动可能难以替换。因此,一些组织使用备份处理单元。例如,需要计算机处理维持交易的系统,通常在一个系统不能操作的情况下,会启动另一个备份系统,每个系统都有能力处理日常交易。处理中断的原因类型包括:

 ● 设备故障;

 ● 没有立即修复的系统软件错误;

 ● 处理过载到无法完成工作的点。

 

存储活动发生业务中断的原因包括:

 ● 计算机或人工存储管理系统发生错误

 ● 存储介质故障;

 ● 存储介质丢失;

 ● 操作员误操作破坏了存储。

 

计算机化应用程序的其他三种活动对业务中断只有最小的影响。这些活动通常具有避免业务中断的替代手段,例如,多种输入记录设备。为了继续业务的运行,这三种活动只需粗略的检查,设计者就能保证,高依赖度无需放置于这三种活动之一。

 

 

二、业务中断案例

 

1.Facebook发生全球宕机事故


78.png


时间:2019.3.14

原因:服务器宕机

持续时间:24小时

影响范围:Facebook史上最长宕机事件 App无法登陆,官方网站页面无法打开,服务几近中断。第三方监测机构的跟踪显示,全球几乎主要的Facebook用户区域都出现了宕机现象。

警示:即便是拥有最优秀计算机科学家、尖端技术的世界最强大互联网公司,也会受到人为失误的破坏。

来源:

https://www.neikong.com/org/2370_zx_110272

 

2.苹果App Store出现大面积无法访问故障


 79.png


时间:2018.12.26

原因:服务器宕机

持续时间:一小时

影响范围:大面积无法访问

警示:加强对突发宕机的容灾方案建设

来源:

https://www.neikong.com/org/2370_zx_110278

 

 

3.亚马逊大规模故障,导致销售陷入瘫痪


 80.png


时间:2018.07.16

原因:网站和移动端瘫痪

持续时间:45分钟

影响范围:在美国当地时间7月16日,亚马逊美国站在其为期36小时的会员日促销活动拉开帷幕之际,出现意外,亚马逊美国站的网站和App竟然崩溃了!很多消费者反映无法通过网站和App进行购物,而替代显示的是一些狗狗的照片。此次故障持续了近一个小时,消费者无法顺利完成购物过程,或打乱了消费者购物的情绪,进而也会给不少美国站的卖家带来一定的负面影响。

警示:加强业务连续性的建设,会员日促销活动出现网站崩溃,影响消费者购物情绪。

 

 

4.谷歌云因自动重启机制失灵,导致网络和 ComputeEngine 宕机


 81.png


时间:2018.2.19

原因:谷歌云自动重启失灵

持续时间:93分钟

影响范围:谷歌云的us-central1和europe-west3这两个可用区中的计算引擎(Compute Engine)停运了93分钟,根本原因出在了自动化失灵上。谷歌将那次停运归咎于“网络编程失效”,表示Autoscaler(自动扩展器)服务因此没有正常运行,因而无法扩展实例组。该软件失效意味着,新的虚拟机或刚迁移的虚拟机无法与其他可用区中的虚拟机进行联系。

警示:自动化和人工占比仍需进一步调整

来源:

https://www.neikong.com/org/2370_zx_110280

来源:国际内部控制协会ICI中国总部  健庭






近期课程安排:

《国际注册内部控制师CICS资格认证》面授及网络课程学习班:

报名链接:http://www.neikong.com/s/pc/#/course/detail/1527212/1473841/info

联系电话:010-68004176、68004186

联 系 人:孙老师、邱老师

报名咨询二维码 :

000.png

内控网—国际注册内部控制师官方网站—内控®、风控®、首席内控官®、风控在线®、内控网®、内部控制
  • 出版物经营许可证: 京出发京零字第西200036号
  • 内控网®、内控®、风控®、首席内控官®、风控在线®
  • Copyright© 中经安信息科技(北京)有限公司 版权所有 京ICP备08102702号-6
  • 京公网安备110102004017 京B2-20120020