数据规范化与企业数据安全
企业在运作过程中,会产生各种各样的数据,这些数据通常以电子文件的方式保存在企业服务器上,能够反映企业运行各个层面的真实情况,因此,企业管理者越来越重视企业数据的安全问题。
一般来说,保护企业数据安全是从这样几个方面入手:一是保障数据不被损毁,包括由数据存储器物理损坏造成的硬性损毁和由软件故障或人为失误等造成的软性损毁,这实际上是一个数据有和无的问题;二是防止数据泄露,包括由外而内(通常由入侵造成)无授权的信息访问和由内而外,企业数据的非正常外流,这实际上是一个敌与我的问题;三是确保企业数据的实际价值,包括数据的真实性、及时性、针对性等等,这实际上是一个对与错的问题。
前两个方面由于多年来一直被各界强调,已经成为企业信息安全首要考虑的问题。随着近年来企业对自身数据处理及挖掘的能力不断提高,使企业的信息管理者们把更多目光投到保证企业数据实际价值的领域中来。
企业数据实际价值影响企业数据安全
企业投入大量资源,对企业数据进行分析,将分析的结果作为企业决策的主要参考依据,而不真实、不及时、不满足决策需要的数据可以视为企业数据中的“假冒伪劣”产品,属于不安全数据,基于这样的数据得出的结论,很难保证正确性。对一家企业而言,错误的信息无异于致命的毒药。在现实情况中,企业数据里必然存在一些不安全数据,要确保数据分析的正确性,就要把不安全数据占全部数据的比例减少到可接受的范围里,最大限度降低不安全数据对企业数据价值的稀释作用。
二、不安全数据产生的原因
根据不安全数据在企业数据分析中的影响,可以分为两种类型:
错误数据。这是一部分与真实情况不符合的数据,产生的原因主要有数据源错误、采集方式错误、输入错误、存储错误、输出错误等等。
垃圾数据。这部分数据虽然符合真实情况,但是不能满足分析的需要,产生的原因主要有数据兼容性差、采集不及时、数据冗余等等。如果在分析数据时提出了新的需求,这部分数据有可能“变废为宝”,为企业服务。
消除不安全数据的方法
不安全数据产生的原因很多,但是企业数据处理的过程基本是一致的,可以表述为这样的顺序:产生、选择、采集、输入、存储、分析、输出。从这个过程看,保证信息在过程中的准确快速流动,是消除不安全数据的关键,这就要求企业数据必须规范化。
数据规范化主要包括以下几个方面:
1、数据元素标准化
数据元素是数据处理的最小单位,数据元素标准化是数据规范化的基础。这里需要在企业数据库建立之前对数据进行分解,例如,企业要建立一个产品销售数据库,将这个数据库分解,就可以得到一个客户数据表;将客户数据表分解,就得到客户名称、性别、电话、地区、所属企业、职位、信用评级等等基本元素,这些元素就是构建起企业数据库的基础。
数据元素标准化需要一个规范说明表,用来规定数据元素的命名方式,规定其内涵及外延,阐述数据元素的作用及表现方式等等。规范说明表就是企业数据的“职位说明书”,能够减少数据元素的种类,降低企业数据的复杂性和出错概率。
2、数据库结构标准化
如果说数据元素是货物,那么数据库就是存储货物的柜子,而数据库结构标准化就是定义数据库,个柜子里抽屉的布局。数据库结构直接影响到企业数据的权限管理、数据库的兼容性与性能、数据管理及再挖掘的便利性等等。
数据库结构的标准化带来的直接好处就是企业数据库性能提高,增强数据库的可靠性,减少出错时间,这样就极大减少了冗余数据。;另一方面,结构良好的数据库兼容性好,容易迁移和升级,在改造数据库或关联其他数据库时的优势尤为明显。
3、数据存储标准化。
在企业数据电子化趋势加快的今天,企业数据存储除要求分类标准化外,还具有了一些新的要求:
编码标准化。电子数据信息都用一定的编码格式保存,常见的有GB2312、UTF-8、BIG5、ISO-8859-1等等,在实际的使用中,可以根据企业数据的阅读对象决定使用编码。例如,如果企业数据的阅读者有中文用户、英文用户、日文用户还有其他语言用户时,推荐使用UTF-8,该编码在各种操作系统中都可以正常显示;如果数据阅读者只有中文用户,可以采用GB2312,降低数据的存储空间。
存储格式标准化。企业数据的电子信息一般有特定的软件产生,这些软件又具有自身特定的格式,如微软的Office系列产生的格式有doc、xls、ppt等等。由特定软件产生的电子文件要求阅读者安装有相应的软件,对于未安装该软件的用户是一种阅读障碍,使有用的信息变成了垃圾数据。因此,存储格式的标准化应尽量采用常见和费用较低的格式。
存储标准化还包括存储设备标准化、存储平台标准化等等,目的都是为了达到一处存储,到处可读的效果。
4、输入输出标准化
数据的输入输出标准化是为了保证数据的可读性,两者在一定程度上相似,需要遵循以下原则:
最简化原则,尽可能减少数据的输入输出量和步骤。
步步校验原则,在每一个步骤都加入校验过程,降低出错可能性,宝马汽车生产线就是步步校验原则的最好案例。
稳定原则,这里的稳定是指设备和人员。