数据结构论坛

首页 » 分类 » 分类 » 企业数智化的七宗罪
TUhjnbcbe - 2023/8/11 21:23:00
北京皮肤病医院好 http://pf.39.net/bdfyy/bdfal/150702/4648924.html

中国企业的数字化转型升级已经好多年了,但还存在很多不尽如人意的地方。在智能化的同时,企业数字化永远还在路上,是进行时,不是完成时,还需要解决一系列的问题。

本篇文章,将聚焦阻碍数智化转型升级的7个问题。

01

对数据的认知明显滞后于技术的发展

要把一件事情做好,首先就要对这个事情有清醒的认知,知道这个事情的核心要素、关键节点,然后才能制定合理的行动计划。数据已经成为一种生产要素,整个社会积累的数据量呈爆炸式增长,数据“入侵”我们生活的方方面面,但是我们对于数据的认知还停留在初级阶段,这会带来一系列的问题。

主要表现在三个层次:

第一,政府机构对数据的认知不足

整个社会正在加速数智化转型升级,数据也逐渐成为一种重要的社会资源。对于社会资源的管理、分配,是政府的重要职责。目前来看,政府对于数据的认知还比较滞后,并不比市场高明多少。关于数据的立法不完备,用户数据隐私保护不足,对侵犯用户隐私的惩处力度,多数情况下还是不够的,黑灰产、电信诈骗、电话骚扰等问题没能得到有效治理。

第二,企业管理层对数据的认知不足

目前大部分企业都日益重视数据的价值,但是他们的认知基本都还停留在收集数据、存储管理数据的层面,对于如何把数据用起来的认知则远远不够。管理层对数据认知的滞后,会导致企业没有清晰的数据战略,对数据平台、数据技术的资源投入不足。企业往往依赖数据智能厂商提供的产品来实现部分业务的数智化,各个板块的协同不足,各个部门的信息孤岛现象明显。整个企业的数智化没有完整的规划,遇到问题之后容易动摇对数智化转型的信念。

第三,普通员工对数据的认知不足

人类与动物最主要的区别就是可以使用工具。对不同工具的掌握是划分人类时代的主要依据。进入数智化时代,就要掌握数据智能工具。普通员工在日常工作中,要充分认识数据的价值,主动学习新的数据智能工具,将其应用于日常工作中,提升工作效率。当大部分人都能很好掌握数据智能工具的时候,整个社会才算进入了数智化时代。目前,只有少部分人能够掌握数据智能工具,这严重阻碍了整个社会的数智化进程。

02

账户体系不健全,数据系统打不通

单看企业数智化,目前最大的痛点莫过于不同系统的割裂。即使是同一个企业,不同业务系统的数据,很多时候也不能打通。这会带来两个问题:一方面,管理层无法获得企业整体情况的统一认知;另一方面,各种各样的数据系统已经成为企业业务流程的重要载体,如果系统不能打通,会严重阻碍不同部门之间的业务协作。在高度数智化的企业中,业务流与数据流是同时进行的,当数据流受阻,业务流也就不那么顺畅。

造成这一局面的原因有哪些呢?

第一,账户体系不健全

数据的起点是账户,账户是人在数据系统里的“镜像”,人在现实世界的行为,在数据系统中就是对应账户的数据。

如果以账户的角度看数据,企业的数据可以分为三类:账户属性数据,包括员工的姓名、性别、工号、岗位职级等基本情况;账户行为轨迹数据,是这个账户对应员工的业务流程行为,在线上系统的数据痕迹;多个账户的互动数据,是多个员工的业务协作数据。

几乎所有的数据都与账户相关,要解决数据系统割裂的问题,要从账户体系这一源头上来解决。事实上,数据系统不能融合,一个主要原因就是没有建立起统一规范的账户系统。如果在不同系统中,同一个员工有不同的账户,这些账户的代码、属性等指标还存在差异。同样一个员工,A系统把他当做“张三”,B系统则把他当做“李四”。这样,不同系统的数据当然不能融合。

账户不能没有,也不能太多。如果随便建立不规范的账户,多个系统有多个账户,不同账户标准还不统一,这会带来严重的数据混乱。可以说,如果建立起统一规范的账户体系,数据孤岛问题就解决了一大半。

第二,不同数据智能厂商的技术标准不统一

一个企业往往会采购多个数据智能服务商的产品,比如用A厂商的ERP系统,B厂商的HR系统,C厂商的CRM系统,D厂商的财务系统,E厂商的数据中台产品,F厂商的BI产品。不同厂商的产品,其系统接口、数据结构往往不同,导致不同系统也很难打通。在数据平台上,大型厂商都想以我为主制定标准,都想别人来适配自己的标准,而不想主动去适配别人的标准,业界标准不统一,不同厂商的数据产品融合度低。

相对于本地化部署,云部署方式有助于形成统一的标准体系,实现不同数据产品的融合。尤其是基于云原生开发的数据智能产品,在接口标准化方面,比原来的软件产品更具优势。

第三,数据系统中的“部门墙”

一个企业中各个部门的系统无法打通,除了技术上的原因外,还有一个原因就是部门利益。在中大型企业当中,除了企业的整体利益外,往往还存在部门利益。数据作为一种新的生产要素,其价值越来越大,已经成为部门利益的一个载体。因此,部门利益的隔阂在数据系统上也会有所反应。企业的某些部门,基于自身利益考虑,可能不想与其他部门打通,也不想把自己完全“暴露”在上级部门面前,因此在推动系统融合和数据跨部门流动方面,往往态度消极。

03

产业链条上的数据开放不足

除了企业内部的数据流动外,企业之间,尤其是同一个产业链条的上下游企业之间,也是需要数据流动的。基于数据流动和数据共享,可以有效避免上下游之间的供需错配:下游企业可以更全面、准确、及时的掌握上游企业的生产供给、库存、价格等情况,有助于其合理安排采购;同样的,上游企业能更好掌握下游需求情况,能更好的安排生产,优化库存。

当然,企业向外部开放数据,会存在诸多顾虑,最核心的就对数据安全的担忧。因此,要实现不同企业相互开放数据,需要搞清楚数据开放的边界,既能加强供应链协同,又不至于泄露商业秘密。此外,还要弄清楚把数据开放给谁,开放数据的同时能获得哪些数据,如何保障数据的安全等。

总之,要实现数据在供应链企业之间的共享,需要建立一系列的机制,共建信任体系,这还有很长的路要走。

04

数据流动与数据安全的矛盾

数据的开放和流动,能够增加数据的价值,而这又会带来数据安全的担忧。如何解决这一问题呢?

关于数据安全保护,我们需要换一个思路:以权限控制的“软安全”来代替硬件、系统断开的“硬安全”。

这句话怎么理解呢?

一直以来,在硬件和系统上断开,被当做一个重要的安全手段。一个典型的做法就是企业自建数据中心,并构建防火墙,甚至断开与外界网络的连接。外界无法访问内网,自然就大大增强了数据的安全性。事实上,这种“与世隔绝”的方法,并不能完全保障数据安全,内部人依然可以通过其他方式“将数据带出去”。更重要的是,这种“自废武功”式的数据保护方法,阻断了企业与外部的数据联系。在数智化社会,这些企业就像一个个的信息孤岛,会严重阻碍业务开展。数据系统的打通是一个系统工程,并非朝夕之功,临时抱佛脚是不行的。

更为合理的方案是:除了核心数据外,企业应尽可能的开放其业务系统,尤其是向有频繁业务往来的伙伴开放业务系统,基于业务需求共享部分数据。在系统打通的基础上,通过加强身份认证和权限控制来保障数据安全。即使外部人可以很方便地接入企业的业务系统,但非授权人员也无法访问企业数据。系统连接很麻烦,但是开通权限却很方便。只要确认了访问者的身份,可以在一秒钟内开通权限,实现数据流通和共享。而要打通原来孤立的系统,则要耗费很长的时间。

我们以城市供水系统为例来进行说明,原来的方式类似自来水厂没有通向各家各户的供水管道系统,居民要用水,得从头开始建立整个系统。现在的方式是,构建起完善的供水管道网络,但是却把阀门关了。只有付了水费的用户,才打开其供水阀门。自来水厂是通过控制阀门的方式来防止没付钱的用户偷偷用水,而不是不给用户修供水管道。

同样的道理,数据安全的重心,是要夯实身份认证和权限控制体系,在技术上提升抵抗黑客攻击的能力。数据就像是一个人放在家里的财产,保护财产的方法是锁好门,而不是断开通往你家的路。因为路断开了,你不能拿着钱上街买东西,那放在家里的钱也就没有价值。

05

云厂商与企业之间的信任缺失

数据和业务上云,是企业数智化转型升级的重要内容。上云,意味着企业要把自己的数据存放在云厂商的数据中心。目前来看,很多企业对云厂商还是无法完全信任的,对数据上云心怀疑虑。

与美国相比,中国云计算市场有一个很明显的特点,就是私有云大行其道。在信息化时代,美国市场主流是标准化软件产品,中国则是定制化软件。在云时代,这一风格似乎要延续下来:美国以公有云为主,中国大力发展私有云。某种程度上,私有云就是软件定制化的翻版,在产品标准化、系统打通等方面天然就存在问题。云计算的核心价值不是通过虚拟化节约硬件成本,而是整个应用生态的变革。如果严重依赖私有云,对公有云信任不足,在接下来的数智化竞争中很可能会栽跟头。

要解决云厂商与企业之间的信任问题,需要两方面的共同努力。

第一,云厂商要担负起“信托责任”

云厂商要对企业存放在的数据有足够的敬畏,在技术和管理流程上,尽全力降低数据泄露的风险。企业存放在云厂商那的数据,本质上是客户企业的财产,云厂商虽然“近水楼台”,但也绝对不可以随意触碰。

更重要的是,要建立客户企业数据损失的补偿机制。目前来看,云厂商造成客户企业的数据泄露,受损失的企业并没有得到多少补偿,或者补偿与损失差距太大,这是不合理的。一旦发生数据泄露,云厂商应该要足额赔偿客户损失,这样做有两个好处:一方面,可以打消企业数据上云的顾虑;另一方,对巨额赔偿的畏惧是促使云厂商提升数据安全防护能力的动力。如果客户数据泄露,云厂商本身却几乎没什么损失,那他是没有动力在数据保护上花费过多精力的。

合理的赔偿机制,需要一个基础,那就是数据价值评估。得先确定客户损失的数据值多少钱,才能确定具体的赔偿金额。不然,就是公说公有理婆说婆有理。数据价值评估是业界的一大难题,现在连理论雏形都没有,更不要说实践了。

第二,企业要转变数据资产保护的思路

数据也是一种资产,如何保护这种资产呢,我们可以通过另外一种资产来类比分析——货币。相对于数据资产,人们对于货币这种资产形式更为熟悉。

当银行系统不完善的时候,人们都是把钱存放家里。有钱人家往往在家放置保险箱,甚至建立小金库。现在已经很少有人这么做的(除了贪污、犯罪等非法所得),核心原因就是银行系统已经足够完善,在安全性、便捷性、成本等方面,都有很大的优势。

企业自建机房存储数据,就类似于把“钱”放在家里;数据上云,就类似于把“钱”存在银行。相对于企业自建的数据中心,云厂商数据中心的技术实力更强,能更好的保障数据安全,就像银行的金库肯定比家里的保险箱更安全;把钱存在银行,可以通过转账的方式来进行交易,这比线下的“一手交钱一手交货”方式更加便捷。同样的,把数据存在云端,更有利于数据系统的融合,以及数据的共享、流通。企业要慢慢转变观念,敢于让数据上云,就像当初敢于把钱交给银行一样。

06

对即将到来的“数据洪峰”准备不足

随着万物互联时代的到来,人类社会将面临一场规模浩大的“数据洪峰”,产生的数据量大大超过以前。

根据IDC预测,全球数据流量将从年的33ZB增长至年的ZB。数据的高速增长,很重要的原因就是企业加速上云,大量本地数据上传到云端。根据思科预测,到年全球云流量将达到19.5ZB,相对于年的6ZB增长3倍,年复合增长率达到27%。至年,储存在数据中心的数据,相对于年将增长4.6倍至1.3ZB,年度复合增长率达36%。相对于数据的传输和存储,由物联网产生的的数据量更为庞大。依据思科的数据,由于物联网的推动,年全球生产的数据总量将达到ZB,而年为ZB。

大量的物联网数据,需要进行计算、存储、传输。而我们目前的计算体系,能否抗住这一波数据洪峰的冲击,还要打上一个大大的问号。

在数据的计算、存储、传输这三个方面,从技术进步角度,传输>计算>存储。

传输:目前我们正在经历一场数据传输的升级换代,4G升级到5G网络,再加上光传输技术对核心网的升级,整个网络能够传输的数据量提升了一个数量级。但是,即使5G网络建设完成,面对海量的物联网数据依然会略感吃力;另一方面,5G网络的建设进展其实并不快。依据工信部的数据,我国累计建成5G基站81.9万个,已经是世界第一了。需要指出的是,与其他国家相比中国进展很快,但与5G产业本身的需要相比,这个速度其实并不算快。5G基站由于通信频率更高,一个基站覆盖的面积相比4G基站要小很多。要建成比较成熟的5G网络,5G基站数量至少是4G基站的两倍,这还不包括大量室内的微基站、皮基站。中国目前的4G基站超过万个,那么5G基站至少应该在万以上。截止到目前,不到万的基站数量,其实算不上多。可以预见,随着企业数据和业务上云,本地端和云端的数据传输将呈现爆发式增长。如果5G网络迟迟不能到位,那必然会影响企业上云的进程。

计算:更多的数据,就会有更大的计算需求,也就需要提升计算的供给能力。目前来看,提升算力的途径包括:发展GPU、FPGA、ASIC、TPU等异构芯片。目前异构芯片是提升算力的重要方向,尤其是针对图形、图像等数据类型,以GPU为核心的异构芯片可以大大提升算力水平;提升芯片制程,从7nm提升到5nm、3nm、1nm,榨干摩尔定律的最后一滴油水。目前台积电、三星已经突破了3nm制程,量产了5nm制程。当芯片制造工艺推进到1nm的时候,量子效应就会阻碍工艺的进一步提升,摩尔定律也就走到头了;云计算,通过算力资源的弹性配置,提升资源利用率。需要指出的是,云计算只是算力的“搬运工”,本身并不生产算力,而是优化算力资源的使用效率。随着异构算力、芯片制程、云计算这三个方面的协同发展,人类还可以较大服务的提升算力,但算力提升的幅度是否能够跟上数据增长的速度,还有待验证。

存储:与传输和计算相比,数据存储面临的问题最为严重。存储技术的进展缓慢,面对即将到来的物联网数据洪峰,目前的存储能力远远无法满足要求。一方面,存储硬件需要更新换代,亟需研发出更大空间的存储芯片,降低数据存储成本;另一方面,数据库、数据仓库、数据湖这类存储软件产品,也需要升级换代。以数据库为例,虽然分布式数据库提升了海量数据存储能力,但依然无法满足需求。

综上,我们目前的计算体系虽然也在快速演进,但相对于数据的增长速度已经比较滞后了。某种程度上,技术的发展正与数据的增长进行一场军备竞赛。如果没能在计算、传输、存储等方面做好准备,整个计算体系将很难承受住上千ZB级别数据的冲击。

07

异构数据的处理能力严重不足

企业数智化的核心是把数据用起来。要用数据,首先得理解数据。但是,现在我们对于数据的理解能力还相当有限。目前能给有效处理的,主要是数据库中的结构化数据。对于更大量的非结构化数据,就像宇宙中的暗物质和暗能量一样,占比更大,但却超出了我们的认知和处理范围。

比较典型的结构化数据包括图像、视频、语音,以及各种文本。其中图像、视频的数据量最大,这些数据只是存放在在数据库中,还不能理解这些数据的含义。遍布城市的安防摄像头,每天会拍摄大量视频,但要理解这些视频里都发生了,需要强大的视频分析技术,并且要耗费大量的算力。可以说,目前绝大多数视频、图像数据,都只是安静的躺在数据库里,并没有真正利用起来。

相对于图像、视频数据,文本的数据量要小很多,但其价值却更大。目前,我们对文本数据的分析也处于初级阶段。要全面掌握企业经营情况,只分析财务、销售数据是远远不够的,还有大量的有用信息散落在各个业务流程中:员工的工作计划、工作总结,工作群里的沟通信息,客户投诉的信息,这些信息大多以文字、文本的形式保存在系统中,可以通过NLP、知识图谱等技术,从这些文本数据中挖掘出有用信息,了解员工的工作状态,客户对企业产品的看法,工作流程中普遍存在的问题等。

理想情况下,在完成非结构数据挖掘的基础上,还需要将财务等结构化数据与图像、视频、文本等非结构化数据进行融合分析,从各个角度掌握企业的整体态势。目前对于非结构化数据的处理能力还很弱,更不要说将结构化和非结构化数据进行综合分析。

以上七个方面,是目前数智化转型升级中普遍面临的问题。这些问题,有些是技术问题,比如账户体系、数据系统打通,异构数据处理,计算、存储、传输体系的升级等;有些则是思想意识和机制的问题,比如数据认知不足,不愿意开放共享数据,对数据上云心存疑虑等。

经过多年的发展,数智化已经进入了“深水区”。要想继续向前推进,就要着力解决上面提到的一系列问题。怕什么真理无穷,进一寸有一寸的欢喜。虽然要实现全面的数智化,还有很长的路要走,但只要不断解决问题,就可以持续进步。

文:凝视深空/数据猿

原文标题:企业数智化的“七宗罪”

1
查看完整版本: 企业数智化的七宗罪