从字节跳动删库来看 如何防止再次发生?

在头条删库上了头条新闻。

outputo-20210624-150950-934-vwkf.png

6月24早晨,脉脉app上面有网民曝料——字节跳动的见习生删除了公司全部GB级别以内的机器学习算法实体模型。

GB级别以内的机器学习算法实体模型也就是lite(TensorFlowLite)实体模型,而且鉴于见习生删掉的是父文件目录且加了skiptrash操作方法,被删掉实体模型无法修复。因此当天全公司通报批评,而且纳入P0安全事故等级(重大事故)。

此刻,小编逐渐考虑到好多个情况:

1、怎么会发生这类删库行为?

(1)见习生为何打算删文件目录。据悉见习生是在清除HDFS上的文件目录,看到1个文件目录最近更新时长3月份,觉得这也是不需要的1个文件目录。

(2)见习生删文件目录行为前是不是咨询过上级领导。据悉那时候见习生做过咨询行为,但仍然执行了删掉操作方法,这也牵涉到内部有关人的把控不紧。

(3)见习生为何有着删文件目录的管理权限。管理权限划分逻辑是不是存有不认真细致、职工发生不合理操作方法时为什么没有提示,这也是安全防范措施和内部工作流程不合格的结果。

2、见习生怎么处理?

有网民表明:“只需并不是主观故意的”就不可能被辞退。

与此同时,我们也邀约了娄鹤律所介绍对本次事情过错推定原则的观点:从以上的信息内容来说,本次安全事故主要是公司的内部控制情况:如见习生的管理权限包含该类删掉是不是合理?无法修复表明公司并没有其他备份数据?操作步骤是怎么规定的?而见习生较多是存有过错,相比于追究责任见习生,更重要的是追责内部员工的渎职和公司安全工作存在的不足。

管理权限

管理权限始终是公司须要连续不断优化的安全工作,在微盟删库安全事故大事录中,FreeBuf也介绍过,管理权限是业务流程风险防控的重要方法。普遍的操作方法包含:

管理权限赋予

认证重要分成工单申请办理、动态认证、静态数据认证。

工单申请办理即按照内部系统向上级领导提交工单申请办理,确保操作方法可追溯性,有审核;静态数据认证则是按照角色工作要求开展策略配制,从更小的粗粒度来赋予管理权限,且通常是低管理权限账户;动态认证则是现阶段更时兴及其更灵便的方法,根据角色、设备种类、地址等的转变 ,动态赋予对象不一样的管理权限。

网站数据库管理权限

1)降到最低管理权限原则

2)分库分表

网站数据库主从关系及备份数据

1)主从关系:当发生系统故障时可以要求系统故障转移,符合高可用性

2)备份数据:

即时备份数据:在线备份数据网站数据库要求读写分离,用以数据修复

离线备份数据:平时跨地区离线备份数据,用以数据信息灾难修复

备份数据数据权限把控

1)设置备份数据数据信息的操作方法管理权限策略,限制高风险比较敏感操作方法,如drop、rm等

2)设置备份数据数据信息的浏览控制策略,要不然易造成另一种的数据泄漏情况

命令把控和审计工作

1)服务器系统的比较敏感/重要命令的限制和监测,并对操作方法命令过去要求采集和远程储存深入分析

2)运维审计,对网站数据库数据流量或日志审计,设置告警信息通告制度

管理业务流程优化改善

1)网上更改的工作流程审核,申请办理更改时间段和操作方法关键点,效率会慢一点,但提高了安全性

2)系统性的风险分析,鉴别与量化分析安全风险,要求安全风险处理,减少安全风险

3)BCP(业务连续性方案)和DRP(灾难修复方案)的制订、评定和规律性实战演练。做到相应规模化体量的公司,是必须认认真真考虑到这两个方案。

分享: