数据结构论坛

首页 » 分类 » 定义 » 大数据和创构认识论人民资讯
TUhjnbcbe - 2024/4/5 8:08:00
北京白癜风最好的医院在那里 https://jbk.39.net/yiyuanzaixian/bjzkbdfyy/xcxbdf/

「本文来源:光明网」

作者:王天恩(上海大学马克思主义学院、社会科学学部教授,博士生导师)

内容提要:新一代人工智能的发展,在更深层次展示了大数据的重要性。正是在大数据基础上,汇聚了信息科技发展过程中生发的新认识论旨趣。从电子计算机到智能算法的哲学研究,新的认识论旨趣相继出现,不仅在计算机哲学研究中有程式认识论,而且在智能算法的哲学研究中提出了算法认识论,这些都是不同于面对既存自然世界认识的认识论旨趣,属于相对于描述认识论研究的创构认识论探索。创构认识论旨趣源自创构活动,创构是信息创生意义上的整体建构,而创生是无中生有的创造。基于大数据的创构活动展示了从认识世界和改变世界到创构世界的发展,其中不仅意味着从描述性认识到创构性认识,而且意味着从描述认识论到创构认识论的镜像扩展。

电子计算机的诞生,使认识论旨趣开始发生重要分化。基于计算机程序,人们提出了程式认识论(proceduralepistemology);根据算法的发展,关于算法的哲学研究又提出了算法认识论(epistemologyofthealgorithm)。而作为创构活动的更高层次基础,大数据使程式认识论和算法认识论等共同认识论旨趣汇聚成同一发展进路,呈现出相对于描述认识论的创构认识论路径。

一、大数据作为创构的基础

信息科技的发展,使具有创生性和整体性的创构概念应运而生。[1]29创构不同于一般意义上的创造,它具有整体性,而且这种整体性趋向造世规模,这是以大数据和人工智能为标志的信息文明发展趋势;创构也不同于一般的建构,它具有创生性,创生是无中生有的创造,这与信息的本性密切相关。作为信宿和信源间的感受性关系,[2]信息与物能的根本不同,在于物能是守恒的,而信息却可以在物能基础上创生。创构意味着的整体性创生,只有在大数据基础上才成为可能。大数据基础上的创构不仅是一个物数据化和数据物化的过程,而且是数据通过虚拟技术等手段对象化的过程。

人类文明伊始,我们面对自然界,就开始形成数据,甚至屈指数数、结绳记事和石子进位等就已经是物数据化的最原始方式,只是在漫长的人类文明发展史上,人们得到的都是小数据、样本数据。但是,即使再原始的数据,也意味着一个物数据化的过程。与物数据化过程相对应,人类实践中也早就有数据物化的过程,按照蓝图(不管是思维中的还是图纸上的)修建桥梁,根据图纸设计建造房屋等,就是最日常的早期典型例子。工程领域和所有物能性创造发明,都是与单纯描述不同的创建和构造活动,只是在大数据的基础上,具有创生性的信息具有越来越重要的地位,特别是3D打印的出现,数据物化及其与物数据化所构成的重要关系和机制才得以清晰呈现。事实上,物数据化和数据物化这两个过程可以构成一个双向循环,只是这个双向循环唯有在大数据基础上才能看得更清楚:一方面,我们朝着量化世界的目标走得越深入,物数据化和数据物化的双向循环就越完整;另一方面,这个重要双向循环越是完整,大数据就离我们越近,越具有整全性。

大数据通常被看作规模大到传统数据库技术不能处理的数据集合,这是大数据的技术定义。但大数据不是一种单纯的技术,而是基于信息的存在。作为一个重要的基本事实,信息存在的重要性随着大数据的发展越来越凸显。在信息文明时代,信息存在具有与物能存在一样的存在论意蕴。

信息科技特别是大数据的发展越来越清晰地表明,关于信息的研究,成了当代最基本的重要课题。由于信息成了必须在科学和哲学一体化发展中才能理解到位的复杂问题,关于信息的界定学界先后提出了一百多个定义,但仍未达成共识。而在一百多个信息的定义中,维纳的信息阐释,成了信息科学和哲学一体化研究的出发点。维纳将信息和物能并列,认为“信息就是信息,不是物质或能量”。[3]与物能并列的信息,不仅具有与物能同样的存在论意义,而且具有物能存在所不具有的本性。正是由于信息,大数据成了人类信息文明的基础。[4]作为信息文明的基础,大数据具有决定信息文明不同于物能文明的重要特性:规模整全性、实时流动性、结构开放性和价值生产性。

大数据的规模整全性指的是大数据的“大”不是纯粹的量的概念,这个“大”的意味是全。大数据的“大”之所以远不仅仅是一个量的大小问题,是因为单纯的数据量大并不构成大数据与小数据的原则性区别。大数据与小数据的根本不同,在于其基本特征是趋向规模整全。大数据不仅意味着数据大,而且意味着维度全。大数据之所以维度全,就是因为大数据的获取只有最基本因而也是最少的在先预设。

所有数据的获取都有在先预设,关键是在先预设的层次。在先预设的层次一方面取决于取样所设置目标的具体程度,另一方面取决于基本理论预设的层次。样本数据的获取都具有科学理论层次的在先设定,而大数据由于不必有像取样那样的具体预设,其在先预设一般都将基础确定于存在论层次,这是最基本的哲学层次。在先预设越基本,预设就越少,数据相应维度越全。虽然不存在完全意义上的全数据,就像不存在十全十美的事物,但以人类使用为标准,则可以就使用需要把大数据看作是趋向于全数据的存在。由此,在信息文明层次,大数据可以进一步看作不仅在规模上大到而且在维度上全到就使用需要而言的全数据。正是在这个意义上说,大数据与小数据的根本区别,就在于大数据不是根据预先设定的具体目的,由抽样形成的干枯数据标本,而是活的实时数据。抽样形成的数据,就像动植物标本,是干枯失活的。一张平面照片,角度和动作等都是固定的。而作为动态反映事物相互作用过程的数据流,大数据则具有与现实过程同步关联的实时性。

实时性是大数据的另一个重要特性,这与技术设备的数据处理速度密切相关。对于人类来说,作为人类信息文明的基础,大数据的存在不仅取决于数据本身,而且取决于技术设备的数据处理速度,因为数据处理速度决定了实时数据流状态。在这个意义上,大数据涉及其与人类使用的关系,涉及大数据的人类使用。这是信息与物能甚至与人类直接相关的重要体现,也是人与世界联系更为密切的方面。样本数据在取样后就从现实世界割离开来,从而与现实进程没有了实时关联,而大数据则是实时数据流。在小数据时代,人们只是获取标本;而在大数据时代,我们所获得的则是一个生成的数据基础。正是高速流动的数据,为大数据提供了趋向与现实生活同步的过程性。数据流速是个至关重要的维度,它造就大数据的实时流动性。这种不是凝固而是自然生成的数据流,随着信息文明的发展,不仅越来越成为人类生存的直接基础,而且是一个面向人类发展不断扩大开放的世界。

作为人类新的生存和发展基础,大数据还具有至关重要的结构开放性。大数据的结构开放性源自实时数据采集只有最基本的预设,正是这一特征使大数据构成信息文明的创构基础。随着信息科技的发展,大数据远不只是最初的文本,而是越来越多来自商业过程、机器、网络特别是像智能手机等移动设备那样的人和物、人和人乃至物和物的互动,包括电子邮件、照片、音频、视频和监视设备等。大数据来源和类型的多样性,所带来的不是我们在数据库时代所理解的结构化数据、半结构化数据和非结构化数据,而是结构开放的数据,这意味着数据结构的开放性。人类关于数据结构的认识,不是完全决定于数据本身,而是涉及大数据相关关系的理解。由于大数据的特点之一是数据太多但信息不足,大数据“难”在理解,因而数据挖掘与人的理解能力密切相关。正因为如此,大数据对于人类的关系和意义才那么复杂丰富,价值才那么与众不同。

大数据的规模整全性、实时流动性和结构开放性,意味着大数据具有价值生产性,它构成信息文明的意义生产基础。作为大数据的技术理解,相对于取样数据价值密度低,数据挖掘是沙里淘金,但在哲学层次可以看到,大数据的意义与人的需要的关联性,决定了大数据的价值取决于价值生产,取决于人对大数据相关关系的理解,取决于人对大数据所反映的自身需要及其发展的理解,甚至取决于人对自身发展的选择。也正是这些,决定了大数据具有与人及其需要的重要关联,即大数据与人及其需要的发展内在相关的价值生产性。[5]正是大数据的价值生产性,构成了大数据之于人类的特殊存在论意义。

大数据的规模整全性,对于既存具体事物的认识以及全新事物的创构,均具有量化的整体观照功能。大数据的结构开放性,为创构全新事物敞开了一个无限的可能性空间。大数据的实时流动性,则为创构全新事物、把握人类需要及其发展提供了现实的可能性和具体手段。正是规模整全性、实时流动性和结构开放性,造就了大数据特有的价值生产性,为创构全新事物奠定了价值基础。大数据价值的关键,就在它取决于人类对这一关系的把握:大数据相关关系组合与人的需要及其发展之间的关系。大数据时代一个新的存在论基础,就是大数据相关关系。

大数据相关关系给人类提供了一个前所未有的平台,使之得以根据需要及其发展并基于相关关系而创构出新的硬件和软件,这就是创构世界的重要进程。在创构世界的过程中,其关键不再局限于人使用的工具和所处的环境,而是人本身的信息化,人越来越以信息的方式存在。[6]人本身和周遭世界的创构,必定生成一个新的世界层次,一个真正意义上的属人世界。这样在哲学层面就有了一个新的发展:从改变世界到创构世界。传统哲学主要强调人类能够认识世界,马克思特别强调人类能够改变世界。“哲学家们只是用不同的方式解释世界,问题在于改变世界。”[7]关于马克思这一观点的内在逻辑,我们可以作进一步展开:在信息文明时代,改变世界已经发展到创构的规模,或者说,我们今天不仅是在认识和改变世界,而且是在此基础上创构世界。

从解释世界和改变世界到创构世界,这一发展的重要基础正是不同于物能的信息,不同于大自然的大数据。大自然是既存的天然基础,大数据是创生的创构基础。由于信息具有物能所没有的创生本性,大数据相关关系蕴含着创构世界比特层次的无限可能性空间。创构世界一方面在既存自然世界的基础上,另一方面又不是直接对既存物能存在的改造,而是基于物能存在的信息性创生,由此所发生的新的物能改造只是信息物化的结果。正是信息性创生,使大数据基础上的创构活动既不同于人类一直就有的物能建造,也不同于对既存对象的描述。

由于大数据基础上的信息创生活动涉及新的世界层次的创构,因此我们可以达到一个新的更高整体层次。由此整体层次回顾哲学发展史,就不仅能更到位地理解已有事实,而且能看到新的事实。

从人类发展史来看,人类有两类基本的活动:一是探索自然存在的既存事物;二是创造自然存在的世界从来没有过的全新事物。这两种不同的活动意味着两种不同的认识:对既存事物或世界存在规律的认识和对创造新事物及其规律的认识。前者主要是描述性质的,是一种描述活动;而后者的发展则经历了两个根本不同的阶段。在数字化之前,由于对象主要是守恒的物能,活动是创造性质的;而在数字化技术诞生之后,由于对象主要是创生性的信息,活动提升到创构性质的,从而发展为一种与描述相对的创构活动。

描述是对既存对象的符号、语词等的摹写,创构是从未存在的感性对象的创设。之所以称之为感性对象,一方面是为了区别于观念及其体系,另一方面也是为了不仅指由原子构成的新硬件等物能存在;而且包括由比特(bit)构成的信息存在;前者主要是物能对象,后者主要是信息对象。由于物能和信息的不同,两者之间具有原则区别:一方面,基于物能的建构只能在改变的意义上进行,而基于信息的创构却可以在创生的意义上进行;另一方面,物能对象作为实体存在诉诸人的感觉,而与此正好相反,数字化的信息性对象则通过诉诸人的感觉给人实体存在感。而模型则居于描述和创构之间,在两者关系和关联机制中具有重要地位:一方面,从发展过程看,模型是从描述到创构的过渡形态;另一方面,模型又处在描述和创构内在关联的环节,属于在两者基础上更高层次发展的结果。

面对既存世界,由于大自然被认为是进化鬼斧神工的杰作,或者被认为是上帝所创,我们只能认识和描述它。在大自然面前,人类自己的物能活动相对只是借助已有之物的小打小闹。而当大数据为人类提供创构的无限空间和可能性后,我们便能利用比特越来越随心所欲地真正开始造物,甚至设计不同于自然世界的生活世界的规律;如果需要,所设计的规律还可以与自然界的物理规律不同甚至完全相反。由此,不仅创构活动普遍兴起,认识也在描述基础上发展到创构,而且从造物上升到造世,从造物哲学发展到造世哲学。[8]无论在认识活动还是实践活动中,人们都逐渐进入造世模式,获得造世眼光。

造物基础上造世眼光的获得,使作为基本活动的描述世界,逐渐同时转向创构世界。而创构世界使作为创构前提的规定空前凸显。我们在描述自然世界时,虽然也涉及描述的前提——思维规定,[9]但我们都自然而然、自觉不自觉地以各种方式把这种思维规定看作对象世界本身固有的规定性。而当我们为自己的创构做出前提性规定时,我们不仅不能也不会否认规定由我们自己做出,这一点,在关于智能算法的研究中可以看得更为清楚。

在智能算法的哲学研究中,美国怀俄明州立大学哲学系计算机博士宾?希尔(RobinK.Hill)教授就数字对规定做了深刻的阐明:“在数学方面,我们对数字的成功和协同使用是一个给定(agiven)——被不予争论地规定(stipulatedwithoutcontroversy)——的基础,供哲学家在其之上进行建构。”[10]58在这里,规定的主观设置性质不容置疑,只是在以人的需要及其发展为根据的同时,必须有程度不同的客观依据。而在我们对自然世界的描述中,作为前提的规定也具有几乎同样的性质。只是在对自然世界的描述中,由于要得到对象的实践回应,也由于由此而来的客观依靠倾向,我们能够把自己做出的思维规定归结为客观规定性。①造物甚至造世的情景使人们意识到,事实上,这两种情况都是创构,只是前者凭靠的主要是客观依据,而后者所根据的则主要是主观需要;前者所依靠的是实践中对象世界的回应,[11]所进行的主要是与外部世界打交道的活动,后者所依靠的则是人的需要,所进行的主要是满足人类需要的意义生产活动。当我们面对自然界的时候,我们的描述只是对创构的客观根据的反映,而创构则是对来自实践的主观需要的反映。创构过程对这种主观需要的反映,在智能算法中表现得最为集中。

算法不仅是创构的基本方式,而且是创构的具体机制。作为创构实现的具体机制,关于算法的深入研究成了越来越重要的新课题。在科学和哲学一体化的层次,希尔给出了算法的深刻定义。在这一更具哲学意蕴的定义中,人工智能算法是“有限、抽象、有效并且符合规律的复合控制结构,在一定的规则条件下完成特定的目的”。[10]57由这一算法定义,可以看到算法的丰富认识论意蕴。智能算法的发展则会使我们在认识领域遇到越来越多具有创构性质的问题:可以设计什么样的智能算法?应当设计什么样的智能算法?——这些都隐含着“是”和“应该”一体化的问题,所反映的正是创构性认识不同于描述性认识的特点,也是反思创构性认识的核心内容。智能算法不仅为创构性认识提供具体机制,而且奠定了创构性认识的更深层次基础。作为信息性创构越来越占据核心地位的机制,智能算法表明人类在创构活动中具有和在描述活动中截然不同的地位。

在人们对自然对象的描述中,不仅同样必须有预设和成见,而且也存在价值负载,但这只是影响我们对自然对象的认识;这种认识通过实践,也可能对自然对象造成重要影响,典型的比如由于认识原因造成的自然生态破坏,但这种影响由于是外在的,因而是有限的,描述的影响不至于直接渗入环境本身。而创构过程则完全不同,预设、成见和价值负载等不仅直接进入创构过程,而且进入甚至决定前提性规定,这就像在自然环境中能影响和决定物能存在,决定所创构环境的性质和特点。创构产物对人类的影响与世界对人的影响,在一定程度上几乎构成了一种对称性的双向循环影响和机制。这不仅关系到理论和实践关系的具体机制,而且使智能算法本身越来越具有伦理的性质。科学理论中的自然法则是自然存在和发展的描述性规律,算法则是创生新的存在的创构性规律。由此,在创构性认识活动中,人类的责任也就全然不同。

描述的前提性预设可以通过前提性反思批判,使之合理化甚至完全更新,这被理解为接近对象真相的过程,人类认识的发展正是这样一个自然过程;在创构过程中,前提性预设的更新甚至合理化,则可以意味着现实工程的推倒重来。创构活动越是靠近造世层次,这种完全推倒重来就越难以想象,甚至越不可能。事实上,这正是有些物种在生物进化过程中被淘汰的根本原因。这两个看上去不同的结果,却具有同样的性质:描述的知识体系或者创构的信息系统都是在特定前提性规定的基础上建立起来的。而创构性的智能算法和描述性的客观摹写又存在很大不同,一个在根本上是客观反映,一个在根本上是主观设置。客观描述是就既存对象而言,而主观创构则是就将要创立的对象而言的。两者最重要的区别之一,就是创构是直接的实践过程,这正凸显了智能算法的实践本性。如果做一个简单的类比性解释,可以认为格式化式重写是与下述转换相对应的概念:创构发展过程和描述发展过程的范式转换。随着这一范式转换的发生,自然而然就不仅有了创构认识论,而且有了基于创构认识论对描述理解的深化而重建的描述认识论,有了在这种意义上相互对应的描述认识论和创构认识论的区分。

关于描述性认识和创构性认识的反思,从而形成两种不同的认识论,这在计算机程序创构性质上日益凸显,两种不同的认识分化之初就已经开始。认知科学特别是人工智能算法的发展,则使这一过程完成了某种循环,从而构成了双向循环机制。

由于信息科技和认知科学的发展,在关于认知系统设计的研究中,人们将认识论旨趣初步分成程式认识论和描述认识论。“程式认识论旨在研究如何建立认知系统,而描述认识论则旨在研究如何描述系统运行时的功能。”[12]正是在程式认识论基础上,基于对虚拟技术的反思,人们对这一认识论维度有了更深入的理解,而大数据则给我们提供了进一步深入理解这种认识论的真正基础。在关于认知系统设计的认识中,由于首先是创构一个认知系统,然后再描述其运行功能,因此相应地,程式认识论在先,描述认识论在后。首先是如何建立认知系统的问题,然后才是怎样描述系统运行功能的问题。在这个意义上,描述认识论是关于如何描述系统运行功能的理论,这在认识论上与描述一个既存自然对象等价,只是在以往的认识论研究中,主要是如何描述既存对象,不创构自然世界,因而是更广义的描述认识论。大数据基础上数据物化过程的凸显和虚拟技术的发展,使人类拥有“上帝之手”,从此人类就不仅仅是从事新硬件的创制,不只是造物,而是甚至涉及世界层次的创构。因而与描述认识论相对应,创构认识论更符合数据物化特别是数字化(比特)虚拟技术条件下,大数据出现之后信息时代的认识性质。

在关于工程的哲学反思中,早就有诸如工程哲学等的探索,这已经是创构认识论的研究,但这些主要是对物能基础上的创构的反思,只有在大数据特别是人工智能的发展中,才在信息(比特)的基础上有了真正意义上的创构认识论。

随着智能算法的发展及其哲学研究的深入,算法认识论的提出使创构认识论有了更完整的基础。希尔在上述算法定义的基础上,进一步明确提出了算法认识论(theepistemologyofthealgorithm)概念:“哲学的考虑促使我们提出算法认识论,特别是在不同于其他学科算法的学习中,也许可以运用实验哲学来确定计算机科学界内外人们对算法的看法。”[10]57作为算法的更深层次认识论研究,算法认识论为创构认识论奠定了更雄厚的基础。

算法认识论不仅进一步凸显了信息性质创构创生性的更深刻意蕴,而且使创构认识论旨趣进一步凸显。因此,认识论旨趣可以真正从描述认识论发展到创构认识论,由此就有了描述认识论和创构认识论的分化。

描述认识论是研究人类认识中以符号、语词和模型等摹写既存对象的性质、结构、前提和基础、发生和发展过程及其规律等的理论;而创构认识论则是研究人类认识中创设从未存在过的感性对象甚至世界层次的性质、结构、前提和基础以及发生和发展过程及其规律等的理论。[1]38由两种不同认识论旨趣所形成的两种不同的认识论研究,既具有截然不同的性质和特点,又具有共同构成更高层次哲学认识论的相互性关系。

在描述认识论研究中,出发点是与对象相符合,描述被认为主要是尽可能真实、精确地反映既存对象的活动或结果,因此在人们看来,描述认识论更具求真的特质,其主要特征是追求客观真实,其目的则是用思想重建既存对象。描述以是否符合对象即更加以真实性为衡量标准,主要基于客观存在和过程及其因果关系,不仅反映“是什么”,而且回答“为什么”的问题。而在大数据基础上,创构则主要根据人类需要及其发展,创设满足人类既存需要,甚至开发人类新的需要并满足这种新需要的感性对象,典型的是新信息对象的创生以及通过信息物化而有的新物能对象的创设。因此,相对于描述认识论而言,在创构认识论中,“真”为存在论前提,在此基础上更具求善求美的特质,其主旨是意义生产,主要特征是创生和开发价值。由于创构的直接目的是根据人的需要及其发展,创设从未存在的可感对象从而满足人类需要,因此,创构认识论以创构物使用的合理性和有效性为认识的根本衡量标准,主要基于面向预想中的可能结果,创设和调控因素体系,根据新探索出来的“为什么”,创构新的“是什么”。[1]37-38创构认识论的性质和特点,在算法尤其是智能算法中表现得更为典型。

随着智能算法的发展,在算法层面可以看到更典型的创生和创构性质,从而在更深层次导向创构认识论,这使作为创构前提性预设的规定及其设置和更新发展空前凸显。与创构性认识和描述性认识性质的不同相对应,创构认识论和描述认识论的根本区别,就在于描述认识论的前提性规定是对既定和在先存在对象的某种反映,因而本体论就成了比它更基础的研究;而在创构认识论中,由于创构活动以创构对象为目的,因而本身就包含前提性规定的预设,创构对象的基本规定也是认识论研究的对象,这就具有和描述认识论完全不同的性质。在描述认识论研究中,毫无疑问也有知识体系的前提性预设,但这是认识论或知识论意义上的前提性预设;而在创构认识论研究中,前提性规定预设却是存在论意义上的。也就是说,创构认识论具有与存在论一体化的趋向。正因为如此,创构认识论意味着整个认识论整体层次的提升。

在对人类认识活动的反思所形成的整个认识论中,描述认识论所

1
查看完整版本: 大数据和创构认识论人民资讯