企业数智化的七宗罪 - 数据 - Powered by Discuz!NT Archiver

TUhjnbcbe - 2023/8/11 21:23:00

北京皮肤病医院好 http://pf.39.net/bdfyy/bdfal/150702/4648924.html

中国企业的数字化转型升级已经好多年了，但还存在很多不尽如人意的地方。在智能化的同时，企业数字化永远还在路上，是进行时，不是完成时，还需要解决一系列的问题。

本篇文章，将聚焦阻碍数智化转型升级的7个问题。

对数据的认知明显滞后于技术的发展

要把一件事情做好，首先就要对这个事情有清醒的认知，知道这个事情的核心要素、关键节点，然后才能制定合理的行动计划。数据已经成为一种生产要素，整个社会积累的数据量呈爆炸式增长，数据“入侵”我们生活的方方面面，但是我们对于数据的认知还停留在初级阶段，这会带来一系列的问题。

主要表现在三个层次：

第一，政府机构对数据的认知不足

整个社会正在加速数智化转型升级，数据也逐渐成为一种重要的社会资源。对于社会资源的管理、分配，是政府的重要职责。目前来看，政府对于数据的认知还比较滞后，并不比市场高明多少。关于数据的立法不完备，用户数据隐私保护不足，对侵犯用户隐私的惩处力度，多数情况下还是不够的，黑灰产、电信诈骗、电话骚扰等问题没能得到有效治理。

第二，企业管理层对数据的认知不足

目前大部分企业都日益重视数据的价值，但是他们的认知基本都还停留在收集数据、存储管理数据的层面，对于如何把数据用起来的认知则远远不够。管理层对数据认知的滞后，会导致企业没有清晰的数据战略，对数据平台、数据技术的资源投入不足。企业往往依赖数据智能厂商提供的产品来实现部分业务的数智化，各个板块的协同不足，各个部门的信息孤岛现象明显。整个企业的数智化没有完整的规划，遇到问题之后容易动摇对数智化转型的信念。

第三，普通员工对数据的认知不足

人类与动物最主要的区别就是可以使用工具。对不同工具的掌握是划分人类时代的主要依据。进入数智化时代，就要掌握数据智能工具。普通员工在日常工作中，要充分认识数据的价值，主动学习新的数据智能工具，将其应用于日常工作中，提升工作效率。当大部分人都能很好掌握数据智能工具的时候，整个社会才算进入了数智化时代。目前，只有少部分人能够掌握数据智能工具，这严重阻碍了整个社会的数智化进程。

账户体系不健全，数据系统打不通

单看企业数智化，目前最大的痛点莫过于不同系统的割裂。即使是同一个企业，不同业务系统的数据，很多时候也不能打通。这会带来两个问题：一方面，管理层无法获得企业整体情况的统一认知；另一方面，各种各样的数据系统已经成为企业业务流程的重要载体，如果系统不能打通，会严重阻碍不同部门之间的业务协作。在高度数智化的企业中，业务流与数据流是同时进行的，当数据流受阻，业务流也就不那么顺畅。

造成这一局面的原因有哪些呢？

第一，账户体系不健全

数据的起点是账户，账户是人在数据系统里的“镜像”，人在现实世界的行为，在数据系统中就是对应账户的数据。

如果以账户的角度看数据，企业的数据可以分为三类：账户属性数据，包括员工的姓名、性别、工号、岗位职级等基本情况；账户行为轨迹数据，是这个账户对应员工的业务流程行为，在线上系统的数据痕迹；多个账户的互动数据，是多个员工的业务协作数据。

几乎所有的数据都与账户相关，要解决数据系统割裂的问题，要从账户体系这一源头上来解决。事实上，数据系统不能融合，一个主要原因就是没有建立起统一规范的账户系统。如果在不同系统中，同一个员工有不同的账户，这些账户的代码、属性等指标还存在差异。同样一个员工，A系统把他当做“张三”，B系统则把他当做“李四”。这样，不同系统的数据当然不能融合。

账户不能没有，也不能太多。如果随便建立不规范的账户，多个系统有多个账户，不同账户标准还不统一，这会带来严重的数据混乱。可以说，如果建立起统一规范的账户体系，数据孤岛问题就解决了一大半。

第二，不同数据智能厂商的技术标准不统一

一个企业往往会采购多个数据智能服务商的产品，比如用A厂商的ERP系统，B厂商的HR系统，C厂商的CRM系统，D厂商的财务系统，E厂商的数据中台产品，F厂商的BI产品。不同厂商的产品，其系统接口、数据结构往往不同，导致不同系统也很难打通。在数据平台上，大型厂商都想以我为主制定标准，都想别人来适配自己的标准，而不想主动去适配别人的标准，业界标准不统一，不同厂商的数据产品融合度低。

相对于本地化部署，云部署方式有助于形成统一的标准体系，实现不同数据产品的融合。尤其是基于云原生开发的数据智能产品，在接口标准化方面，比原来的软件产品更具优势。

第三，数据系统中的“部门墙”

一个企业中各个部门的系统无法打通，除了技术上的原因外，还有一个原因就是部门利益。在中大型企业当中，除了企业的整体利益外，往往还存在部门利益。数据作为一种新的生产要素，其价值越来越大，已经成为部门利益的一个载体。因此，部门利益的隔阂在数据系统上也会有所反应。企业的某些部门，基于自身利益考虑，可能不想与其他部门打通，也不想把自己完全“暴露”在上级部门面前，因此在推动系统融合和数据跨部门流动方面，往往态度消极。

产业链条上的数据开放不足

除了企业内部的数据流动外，企业之间，尤其是同一个产业链条的上下游企业之间，也是需要数据流动的。基于数据流动和数据共享，可以有效避免上下游之间的供需错配：下游企业可以更全面、准确、及时的掌握上游企业的生产供给、库存、价格等情况，有助于其合理安排采购；同样的，上游企业能更好掌握下游需求情况，能更好的安排生产，优化库存。

当然，企业向外部开放数据，会存在诸多顾虑，最核心的就对数据安全的担忧。因此，要实现不同企业相互开放数据，需要搞清楚数据开放的边界，既能加强供应链协同，又不至于泄露商业秘密。此外，还要弄清楚把数据开放给谁，开放数据的同时能获得哪些数据，如何保障数据的安全等。

总之，要实现数据在供应链企业之间的共享，需要建立一系列的机制，共建信任体系，这还有很长的路要走。

数据流动与数据安全的矛盾

数据的开放和流动，能够增加数据的价值，而这又会带来数据安全的担忧。如何解决这一问题呢？

关于数据安全保护，我们需要换一个思路：以权限控制的“软安全”来代替硬件、系统断开的“硬安全”。

这句话怎么理解呢？

一直以来，在硬件和系统上断开，被当做一个重要的安全手段。一个典型的做法就是企业自建数据中心，并构建防火墙，甚至断开与外界网络的连接。外界无法访问内网，自然就大大增强了数据的安全性。事实上，这种“与世隔绝”的方法，并不能完全保障数据安全，内部人依然可以通过其他方式“将数据带出去”。更重要的是，这种“自废武功”式的数据保护方法，阻断了企业与外部的数据联系。在数智化社会，这些企业就像一个个的信息孤岛，会严重阻碍业务开展。数据系统的打通是一个系统工程，并非朝夕之功，临时抱佛脚是不行的。

更为合理的方案是：除了核心数据外，企业应尽可能的开放其业务系统，尤其是向有频繁业务往来的伙伴开放业务系统，基于业务需求共享部分数据。在系统打通的基础上，通过加强身份认证和权限控制来保障数据安全。即使外部人可以很方便地接入企业的业务系统，但非授权人员也无法访问企业数据。系统连接很麻烦，但是开通权限却很方便。只要确认了访问者的身份，可以在一秒钟内开通权限，实现数据流通和共享。而要打通原来孤立的系统，则要耗费很长的时间。

我们以城市供水系统为例来进行说明，原来的方式类似自来水厂没有通向各家各户的供水管道系统，居民要用水，得从头开始建立整个系统。现在的方式是，构建起完善的供水管道网络，但是却把阀门关了。只有付了水费的用户，才打开其供水阀门。自来水厂是通过控制阀门的方式来防止没付钱的用户偷偷用水，而不是不给用户修供水管道。

同样的道理，数据安全的重心，是要夯实身份认证和权限控制体系，在技术上提升抵抗黑客攻击的能力。数据就像是一个人放在家里的财产，保护财产的方法是锁好门，而不是断开通往你家的路。因为路断开了，你不能拿着钱上街买东西，那放在家里的钱也就没有价值。

云厂商与企业之间的信任缺失

数据和业务上云，是企业数智化转型升级的重要内容。上云，意味着企业要把自己的数据存放在云厂商的数据中心。目前来看，很多企业对云厂商还是无法完全信任的，对数据上云心怀疑虑。

与美国相比，中国云计算市场有一个很明显的特点，就是私有云大行其道。在信息化时代，美国市场主流是标准化软件产品，中国则是定制化软件。在云时代，这一风格似乎要延续下来：美国以公有云为主，中国大力发展私有云。某种程度上，私有云就是软件定制化的翻版，在产品标准化、系统打通等方面天然就存在问题。云计算的核心价值不是通过虚拟化节约硬件成本，而是整个应用生态的变革。如果严重依赖私有云，对公有云信任不足，在接下来的数智化竞争中很可能会栽跟头。

要解决云厂商与企业之间的信任问题，需要两方面的共同努力。

第一，云厂商要担负起“信托责任”

云厂商要对企业存放在的数据有足够的敬畏，在技术和管理流程上，尽全力降低数据泄露的风险。企业存放在云厂商那的数据，本质上是客户企业的财产，云厂商虽然“近水楼台”，但也绝对不可以随意触碰。

更重要的是，要建立客户企业数据损失的补偿机制。目前来看，云厂商造成客户企业的数据泄露，受损失的企业并没有得到多少补偿，或者补偿与损失差距太大，这是不合理的。一旦发生数据泄露，云厂商应该要足额赔偿客户损失，这样做有两个好处：一方面，可以打消企业数据上云的顾虑；另一方，对巨额赔偿的畏惧是促使云厂商提升数据安全防护能力的动力。如果客户数据泄露，云厂商本身却几乎没什么损失，那他是没有动力在数据保护上花费过多精力的。

合理的赔偿机制，需要一个基础，那就是数据价值评估。得先确定客户损失的数据值多少钱，才能确定具体的赔偿金额。不然，就是公说公有理婆说婆有理。数据价值评估是业界的一大难题，现在连理论雏形都没有，更不要说实践了。

第二，企业要转变数据资产保护的思路

数据也是一种资产，如何保护这种资产呢，我们可以通过另外一种资产来类比分析——货币。相对于数据资产，人们对于货币这种资产形式更为熟悉。

当银行系统不完善的时候，人们都是把钱存放家里。有钱人家往往在家放置保险箱，甚至建立小金库。现在已经很少有人这么做的（除了贪污、犯罪等非法所得），核心原因就是银行系统已经足够完善，在安全性、便捷性、成本等方面，都有很大的优势。

企业自建机房存储数据，就类似于把“钱”放在家里；数据上云，就类似于把“钱”存在银行。相对于企业自建的数据中心，云厂商数据中心的技术实力更强，能更好的保障数据安全，就像银行的金库肯定比家里的保险箱更安全；把钱存在银行，可以通过转账的方式来进行交易，这比线下的“一手交钱一手交货”方式更加便捷。同样的，把数据存在云端，更有利于数据系统的融合，以及数据的共享、流通。企业要慢慢转变观念，敢于让数据上云，就像当初敢于把钱交给银行一样。

对即将到来的“数据洪峰”准备不足

随着万物互联时代的到来，人类社会将面临一场规模浩大的“数据洪峰”，产生的数据量大大超过以前。

根据IDC预测，全球数据流量将从年的33ZB增长至年的ZB。数据的高速增长，很重要的原因就是企业加速上云，大量本地数据上传到云端。根据思科预测，到年全球云流量将达到19.5ZB,相对于年的6ZB增长3倍，年复合增长率达到27%。至年，储存在数据中心的数据，相对于年将增长4.6倍至1.3ZB，年度复合增长率达36%。相对于数据的传输和存储，由物联网产生的的数据量更为庞大。依据思科的数据，由于物联网的推动，年全球生产的数据总量将达到ZB，而年为ZB。

大量的物联网数据，需要进行计算、存储、传输。而我们目前的计算体系，能否抗住这一波数据洪峰的冲击，还要打上一个大大的问号。

在数据的计算、存储、传输这三个方面，从技术进步角度，传输＞计算＞存储。

传输：目前我们正在经历一场数据传输的升级换代，4G升级到5G网络，再加上光传输技术对核心网的升级，整个网络能够传输的数据量提升了一个数量级。但是，即使5G网络建设完成，面对海量的物联网数据依然会略感吃力；另一方面，5G网络的建设进展其实并不快。依据工信部的数据，我国累计建成5G基站81.9万个，已经是世界第一了。需要指出的是，与其他国家相比中国进展很快，但与5G产业本身的需要相比，这个速度其实并不算快。5G基站由于通信频率更高，一个基站覆盖的面积相比4G基站要小很多。要建成比较成熟的5G网络，5G基站数量至少是4G基站的两倍，这还不包括大量室内的微基站、皮基站。中国目前的4G基站超过万个，那么5G基站至少应该在万以上。截止到目前，不到万的基站数量，其实算不上多。可以预见，随着企业数据和业务上云，本地端和云端的数据传输将呈现爆发式增长。如果5G网络迟迟不能到位，那必然会影响企业上云的进程。

计算：更多的数据，就会有更大的计算需求，也就需要提升计算的供给能力。目前来看，提升算力的途径包括：发展GPU、FPGA、ASIC、TPU等异构芯片。目前异构芯片是提升算力的重要方向，尤其是针对图形、图像等数据类型，以GPU为核心的异构芯片可以大大提升算力水平；提升芯片制程，从7nm提升到5nm、3nm、1nm，榨干摩尔定律的最后一滴油水。目前台积电、三星已经突破了3nm制程，量产了5nm制程。当芯片制造工艺推进到1nm的时候，量子效应就会阻碍工艺的进一步提升，摩尔定律也就走到头了；云计算，通过算力资源的弹性配置，提升资源利用率。需要指出的是，云计算只是算力的“搬运工”，本身并不生产算力，而是优化算力资源的使用效率。随着异构算力、芯片制程、云计算这三个方面的协同发展，人类还可以较大服务的提升算力，但算力提升的幅度是否能够跟上数据增长的速度，还有待验证。

存储：与传输和计算相比，数据存储面临的问题最为严重。存储技术的进展缓慢，面对即将到来的物联网数据洪峰，目前的存储能力远远无法满足要求。一方面，存储硬件需要更新换代，亟需研发出更大空间的存储芯片，降低数据存储成本；另一方面，数据库、数据仓库、数据湖这类存储软件产品，也需要升级换代。以数据库为例，虽然分布式数据库提升了海量数据存储能力，但依然无法满足需求。

综上，我们目前的计算体系虽然也在快速演进，但相对于数据的增长速度已经比较滞后了。某种程度上，技术的发展正与数据的增长进行一场军备竞赛。如果没能在计算、传输、存储等方面做好准备，整个计算体系将很难承受住上千ZB级别数据的冲击。

异构数据的处理能力严重不足

企业数智化的核心是把数据用起来。要用数据，首先得理解数据。但是，现在我们对于数据的理解能力还相当有限。目前能给有效处理的，主要是数据库中的结构化数据。对于更大量的非结构化数据，就像宇宙中的暗物质和暗能量一样，占比更大，但却超出了我们的认知和处理范围。

比较典型的结构化数据包括图像、视频、语音，以及各种文本。其中图像、视频的数据量最大，这些数据只是存放在在数据库中，还不能理解这些数据的含义。遍布城市的安防摄像头，每天会拍摄大量视频，但要理解这些视频里都发生了，需要强大的视频分析技术，并且要耗费大量的算力。可以说，目前绝大多数视频、图像数据，都只是安静的躺在数据库里，并没有真正利用起来。

相对于图像、视频数据，文本的数据量要小很多，但其价值却更大。目前，我们对文本数据的分析也处于初级阶段。要全面掌握企业经营情况，只分析财务、销售数据是远远不够的，还有大量的有用信息散落在各个业务流程中：员工的工作计划、工作总结，工作群里的沟通信息，客户投诉的信息，这些信息大多以文字、文本的形式保存在系统中，可以通过NLP、知识图谱等技术，从这些文本数据中挖掘出有用信息，了解员工的工作状态，客户对企业产品的看法，工作流程中普遍存在的问题等。

理想情况下，在完成非结构数据挖掘的基础上，还需要将财务等结构化数据与图像、视频、文本等非结构化数据进行融合分析，从各个角度掌握企业的整体态势。目前对于非结构化数据的处理能力还很弱，更不要说将结构化和非结构化数据进行综合分析。

以上七个方面，是目前数智化转型升级中普遍面临的问题。这些问题，有些是技术问题，比如账户体系、数据系统打通，异构数据处理，计算、存储、传输体系的升级等；有些则是思想意识和机制的问题，比如数据认知不足，不愿意开放共享数据，对数据上云心存疑虑等。

经过多年的发展，数智化已经进入了“深水区”。要想继续向前推进，就要着力解决上面提到的一系列问题。怕什么真理无穷，进一寸有一寸的欢喜。虽然要实现全面的数智化，还有很长的路要走，但只要不断解决问题，就可以持续进步。

文：凝视深空/数据猿

原文标题：企业数智化的“七宗罪”

数据结构论坛