从哲学角度看人生挫折问题 数据 大数据及其本质是什么

51CTO旗下网站
数据、大数据及其本质是什么?
最近几年,数据问题进入哲学视野。对于哲学家们探索的数据本质特征,我们可以从以下几个方面来把握。
作者:来源:爱数据网| 10:51
最近几年,数据问题进入哲学视野。对于哲学家们探索的数据本质特征,我们可以从以下几个方面来把握。
数据与大数据
技术进步,主要是计算机、网络和各种类型的传感器以及云技术、分布式计算与存储等海量存储技术的广泛应用和运算能力极速进步,使得数据概念被大数据概念取代。数据量增加速度之快,大致可以这样描述:最近两年生成的数据量,相当于此前一切时代人类所生产的数据量的总和。
大数据指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。大数据的特征,除了巨大、快速、多样多变之外,没有其他。因此,大数据本质上还是数据。
在大数据的上述特征中,其多样多变性值得特别关注。它表现为所生成数据格式的多样,如文字、图片、视频等各有多种不同的格式,取决于生成数据的技术与设备,却反映出数据生产的时代性以及数据处理的能力与条件,也反映出被描摹自然和社会的多姿多彩。另外,随着技术发展和数据量急剧增长,新的数据格式还会层出不穷,多变和多样特征更加突出。
大数据既是一个技术概念,又是一个商业概念,它的出现,有其特定背景,即it领域的商业和渲染新技术的考量。大数据包揽了人类获取数据的所有途径,提示哲学研究一个全新时代的到来,这个时代的先声,很久远之前就已经响起,那时,它仅仅被称作数据。在我们的讨论中,主要考虑数据与哲学的关联。
数据与认识
这里的认识,指的是人的认识,是人对外部世界的认识。
大数据的出现和引起关注,使得一个事实得到确认,这就是,数据覆盖了人类对于外部世界的感知。感官及其所获得的经验退居到显示屏之后,退居到各种类型的技术装置之后,这些装置将自然和外部世界的映像&转译&成人类感官可以接受的图像、声音甚至触觉和嗅觉味觉。这既是技术发展的必然,又是始料未及的情况。如果说,此前,哲学还试图在技术系统生成的数据之外寻找世界的直观映像,到了大数据时代,这种人类的直接感知即使没有被完全取代,也失去了其传统意义上的优势。一言以蔽之,哲学,需要从数据中寻求对世界的认识,舍此即失去认识的来源。
这似乎是一个惊人的变故,其实不然。在影响人类认识的议题上,大数据带来的变化,只是数量和范围上的,并非根本意义上的改变。事实上,回顾历史,我们发现,我们的对外部世界的感知,从来都是依赖于某些技术装置的,也就是说,人的认识,其实是通过数据获得的。
最早的技术装置,可能是直尺,它用于测量长度,例如田亩;更早的述说技术装备,也许是绳结,它用来述说一件重要的事件。在我国,从河北泥河湾先民打造石器,到安阳殷墟龟甲上刻画的文字,都可以看作是某种&数据&,表达着人类对外部世界的某种认知。而面对着所有这些早期的承载数据的技术装备,人们获得对外部世界的某种最早的抽象认识。古代人先后发明过算筹、斗和称、漏刻、浑象仪、量角器等等,无不是用来产生认知外部世界的数据,人们也发明笔、纸张、雕版印刷术,也是用来记录和生产数据。依托所有这些,数据成为人们认识的依据,思考的源泉,表达的工具。
近代以来,西方的技术和科学异军突起,望远镜、显微镜、六分仪、光谱仪、质谱仪乃至加速器、射电望远镜相继出现,成为人类认识外部世界的有力工具。这些技术装备产生的数据成为近现代思想的新的依托。到了当代,伴随着电子计算机的强大数据处理能力的出现,各种延伸和阔展人类感官感知能力的器皿设备层出不穷,终于完全或接近于完全取代人类对外部世界的直接感知,通过把数据呈现给人类,成为人类认识的来源。这就是大数据的时代。
关键点在于,我们所知的世界,全部是数据表达的,其中一部分获得理解和解释,更多的只是数据,没有得到解释甚至没有得到关注,它只是像自在自然那样在那里,等待人们去搜索发现它,解释它,运用它。
数据与本体
根据上述认识,似乎可以通过观察数据的形成和生产,来理解哲学与科学的在解释客观自然议题上彼此消长。
在近代科学初兴时期,它并没有从传统哲学中分离出来,它被冠之以自然哲学。与之相并行不悖的,有哲学本体论和形而上学。后两者都是试图以某些观念描述和解释外部自然,寻求事物的本质,并在哲学领域合法存在。伽利略、牛顿等人推崇的使用先进观测和实验手段观察与调控自然,用数学述说自然过程。当这一切成为风气之后,哲学本体论逐渐衰退,哲学似乎放弃了对客观世界的描蓦和解释,让位于自然科学。
最后一位试图运用科学数据来解释自然的哲学家是康德,他研习了牛顿的运动力学和天体力学,提出宇宙演化学说。然而,拉普拉斯在康德基础上,用物理理论和数学表述了星云说,在无限时空中的恒星和星系演化学说。拉普拉斯之后,科学之描摹自然优越于传统哲学得到公认。
一般认为,在经典科学时代,哲学与科学在描摹自然方面的差异,在于是否运用数据和使用数学方法。今天我们发现,这并非全部问题所在。经典时代,直至大数据崛起的今天,自然科学的确在使用各种技术装备获得的数据方面占据优势地位,哲学则固守传统的概念分析和一般推理方法,这还是指的好的哲学。这与其说是哲学落后于科学,勿宁说人类获得数据的能力尚有不逮,给传统哲学留有施展余地。
大数据的出现,包围了人类认知世界的所有方面,情况发生变化。在科学界开始讨论并实施&计算一切&的时候,同时也给哲学重新回到讨论本体打开方便之门。这里发生的变化是,数据成为认知的源泉,思维的质料;我们对世界的解释转变为对数据的解读,舍此无他。大数据的出现,使得我们发现,我们所知的称作外部世界的东西,是通过数据来呈现的,当我们寻求世界的本质和意义时,我们实际上是在数据中徜徉;当我们觉得有所发现有所体悟时,实际上是自觉找到了一些数据之间的关联。
数据的物理学气质
所谓物理学气质,指的是思考事物的本质,从原理层面上对事物的本质进行探究,揭示出事物的基本规律。当前备受热议的数据和大数据是否具有揭示事物基本规律的功能,可能还有待于观察,但是,数据,就其现象而言,似乎已经展示出某种物理学气质,考察这一特性,既有利于认识数据的本质,也有利于深化对物理学的认识。
这里所说的物理学,主要指的是量子力学。
众所周知,量子力学无论在理论上还是在应用上都获得巨大成功,在场论、粒子物理和天体物理学研究上都扮演者基础角色,在固体物理、半导体物理以及超导物理等应用学科上都有极出色表现。量子力学与哲学的联系,比其他任何自然科学领域都要来得紧密,其中最重要的就是认识论问题。
量子力学发现,建立在测不准关系基础上的认识,受到基本物理原理的限制,客观世界原则上不可能真正被观察到,我们只能根据物理测量结果认识世界。而测量本身形成对客观世界的干扰,导致无法真正认清它的本来面目。所以,我们对于世界的认识,唯一来源就是测量的结果,即所谓经验。
量子力学的这一认识原则引发将近一百年的讨论,至今未能平息。
尼尔斯&玻尔认为我们必须接受量子力学给出的认识原则,承认和接受自然作出的安排,量子力学已经很好地描绘了自然;爱因斯坦则不愿接受玻尔的&绥靖哲学&,他觉得一定是量子力学本身的不完备造成,人对自然的认识应该是能够穷尽的,不可能也不应该像量子力学所描绘的那样。
当我们回顾前述数据与大数据的认识论与本体论含义时,就明白,一直以来有关量子力学问题的争论,本质上就是对于数据的意义的争论。显然,爱因斯坦不愿意接受数据给出的结果,以及对于数据的解释,而玻尔则认为数据揭示的自然正是自然本体,无论我们是不是喜欢它。
有趣的是,人们一直在争论量子力学的测量问题,此前却几乎从来没有人意识到测量的结果本身就是数据,而数据已经成为事实上的认识来源。离开数据,我们对于世界一无所知。
在这个大数据时代,当我们认识到,数据正是我们认识世界的源泉,所谓世界其实就是数据构成的,我们也会看到数据本身所具有的物理学气质,正像量子力学所强调的那样,世界隐藏在经验表象背后,我们所能谈论的,只是经验本身。
&【编辑推荐】【责任编辑: TEL:(010)】
大家都在看猜你喜欢
热点头条关注头条关注
24H热文一周话题本月最赞
讲师:5人学习过
讲师:34人学习过
讲师:5人学习过
精选博文论坛热帖下载排行
全书分为基础篇、高级篇和应用篇3个部分,共18章,有重点、分层次地讲解SQL Server 2005的基础知识、高级使用技巧和项目应用方法。第1~10...
订阅51CTO邮刊大数据究竟是什么?------它的语义、特征与本质
当前位置:>
大数据究竟是什么?------它的语义、特征与本质
摘 要:大数据是一个热门词汇,但大数据究竟是什么?目前学术界和产业界都比较模糊。从混乱的语义中做出语义分析,并从基本特征、哲学本质中进一步揭示大数据的涵义,这些工作对大数据技术的发展以及大众对大数据的理解都具有重要的意义。
关键词:大数据、语义、特征、本质
随着大数据时代的来临,大数据(Big Data)这个词近年来成了关注度极高和使用极频繁的一个热词。然而,与这种热度不太对称的是,大众只是跟随使用,对大数据究竟是什么并没有真正的了解。学术界对大数据的涵义也莫衷一是,很难有一个规范的定义。虽然说大数据时代刚刚来临,对大数据的涵义有着不同的理解完全是正常的,但对哲学工作者来说,我们还是有必要对其做一个比较系统的比较和梳理,以便大众更好地把握大数据的内涵和本质。
一、大数据的语义分析
“大数据”(Big Data)成为热词,虽然是最近几年的事情,然而这个词却已经存在了30余年。早在1980年,著名未来学家阿尔文o托夫勒在其风行一时的畅销书《第三次浪潮》中就描绘过未来信息社会的前景并强调了数据在信息社会中的作用。随着信息技术特别是智能信息采集技术、互联网技术的迅速发展,各类数据都呈现出急剧爆发之势,计算机界因此提出了“海量数据”的概念,并突出了数据挖掘的概念和技术,以便从海量的数据中挖掘出需要的数据成了一种专门的技术和学科,为大数据的提出和发展做好了技术的准备。2008年9月,著名的《自然》杂志推出了“大数据”特刊,并在封面中特别突出了“大数据专题”。2009年开始,在互联网领域,“大数据”一词已经成了一个热门的词汇。不过,这个时候的“大数据”概念与现在的“大数据”概念,虽然名字相同,但内涵和本质仍然有着巨大的差别,而且主要局限于计算机行业。
2011年6月,美国著名的麦肯锡咨询公司发表了一份研究报告:《大数据:下一个创新、竞争和生产力的前沿》(Big data: The next frontier for innovation, competition and productivity)。在这份报告中,麦肯锡公司不但重新提出了大数据的概念,而且全面阐述了大数据在未来经济、社会发展中的重要意义,并宣告大数据时代的来临。由此,大数据一词很快越出学术界而成为社会大众的热门词汇,麦肯锡公司也由此成为大数据革命的先驱者。2012年的美国大选中,奥巴马团队成功运用大数据技术战胜对手,并且还将发展大数据上升为国家战略,以政府之名发布了《大数据研究与发展计划》,由此让专业的大数据概念变为家喻户晓的词汇。美国的Google,Facebook,Amazon以及中国的百度、腾讯和阿里巴巴,这些数据时代的造富神话更让大众知晓了大数据所蕴藏的巨大商机和财富,让大数据披上了神话的外衣,并成为世界各国政府和公司追逐的对象。日,《纽约时报》发表了头版文章,宣布大数据时代已经降临。[1]2012年6月,联合国专门发布了大数据发展战略,这是联合国第一次就某一技术问题发布报告。英国学者维克托o舍恩伯格的《大数据时代》一书则对大数据技术及其对工作、生活和思维方式进行了全面的普及,因此大数据及其思维模式在全世界得到了迅速的传播。[2]从国内来说,涂子沛的《大数据:正在到来的数据革命》让国人及时了解到国际兴起的大数据热,让我们与国际同行保持了同步。[3]
大数据究竟是什么意思呢?从字面来说,所谓大数据就是指规模特别巨大的数据集合,因此从本质上来说,它仍然是属于数据库或数据集合,不过是规模变得特别巨大而已,因此麦肯锡公司在上述的咨询报告中将大数据定义为“大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。”[4]
维基百科对大数据这样定义,Big Datais an all-encompassing term for any collection of data sets so large or complex that it becomes difficult to process using traditional data processing applications。[5]中文维基百科则说:“大数据,或称巨量资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内截取、管理、处理,并整理成为人类所能解读的信息。”[6]
世界著名的美国权威研究机构Gartner对大数据给出了这样的定义:“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资源。”[7]6百度百科则基本引用Gartner对大数据的定义,认为大数据,或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。[8]
英国大数据权威维克托则在其畅销书《大数据时代》中这样来定义大数据的:“大数据并非一个确切的概念。最初,这个概念是指需要处理的信息量过大,已经超出了一般电脑在数据处理时所能使用的内存量,因此工程师们必须改进处理数据的工具。”[9]8“大数据是人们获得新认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法”。[9]9
John Wiley图书公司出版的《大数据傻瓜书》对大数据概念是这样解释的:“大数据并不是一项单独的技术,而是新、旧技术的一种组合,它能够帮助公司获取更可行的洞察力。因此,大数据是管理巨大规模独立数据的能力,以便以合适速度、在合适的时间范围内完成实时分析和响应。”[10]
大数据技术引入国内之后,我国学者对大数据的理解也一样五花八门,不过跟国外学者的理解比较类似。最早介入并对大数据进行了比较深入研究的三位院士的观点应该具有一定的代表性和权威性。
邬贺铨院士认为:“大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。”[11]李德毅院士则说:“大数据本身既不是科学,也不是技术,我个人认为,它反映的是网络时代的一种客观存在,各行各业的大数据,规模从TB到PB到EB到ZB,都是以三个数量级的阶梯迅速增长,是用传统工具难以认知的,具有更大挑战的数据。”[12]而李国杰院士则引用维基百科定义:“大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合”,认为“大数据具有数据量大、种类多和速度快等特点,涉及互联网、经济、生物、医学、天文、气象、物理等众多领域。”[13]
我国最早介入大数据普及的学者涂子沛在其《大数据:正在到来的数据革命》中,将大数据定义为:“大数据是指那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。”[3]57由于涂子沛的著作发行量比较大,因此他对大数据的这个界定也具有一定的影响力。
从国内外学者对大数据的界定来看,虽然目前没有统一的定义,但基本上都从数据规模、处理工具、利用价值三个方面来进行界定:1、大数据属于数据的集合,其规模特别巨大;2、用一般数据工具难以处理因而必须引入数据挖掘新工具;3、大数据具有重大的经济、社会价值。
二、大数据的4V特征
我们从大数据的概念中很难把握大数据的属性和本质,因此国内外学者都在大数据概念的基础上继续深入探讨大数据的基本特征,其中最有代表性的是大数据的3V特征或4V特征。所谓大数据的3V或4V特征是指大数据所具有的三个或四个以英文字母V打头的基本特征。所谓的3V是指Volume(体量)、Variety(多样)、Velocity(速度),这三个V是比较公认的,基本上没有争议。[14]而4V是在3V的基础上再加上一个V,而这个V究竟是什么,目前有比较大的争议。有人将Value(价值)作为第四个V,而有人将Veracity(真实)当作第四个V。[7]16笔者曾经将Value当作第四个V[15],但现在则认为Veracity似乎更能代表大数据的第四个基本特征。
1、Volume(数据规模巨大)
大数据给人印象最深的是数据规模巨大,以前也被称为海量,因此大数据的所有定义中必然会涉及大数据的数据规模,而且特别指出其数据规模巨大,这就是大数据的第一个基本特征:数据规模巨大,即Volume。
从埃及开始,人们就学会了丈量土地、记录财产,数据由此产生。埃及、巴比伦、古希腊都用纸草、陶片作为数据记录的工具,因此数据规模极其有限。古代中国也很早就有丈量土地和记录财富的历史,并且用陶片、竹片、绢布等做记录工具,后来有了纸张、印刷术等,各种数据更容易被记录,于是就有了“学富五车”的知识人,以及“汗牛充栋”的图书收藏机构。不过古人引以自豪的事情如今看来只是“小儿科”。如今的大数据,数据的规模究竟有多大呢?虽然没有一个确切的统计数字,但我们可以举例描述其规模。现在一天内在Twitter上发表的微博就达到2亿条,7个TB的容量,50亿个单词量,相当于纽约时报出版60年的单词量。阿里巴巴通过其交易平台积累了巨大的数据,截至2014年3月,阿里已经处理的数据就达到100PB,等于104,857,600个GB的数据量,相当于4万个西雅图中央图书馆,580亿本藏书的数据。[11]腾讯QQ目前拥有8亿用户,4亿移动用户,在数据仓库存储的单机群数量已达到4,400台,总存储数据量经压缩处理以后在100PB左右,并且这一数据还在以日新增200TB到300TB,月增加10%的数据量不断增长,腾讯的数据平台部门正在为1000个PB做准备。
随着大数据时代的来临,各种数据呈爆炸性增长。从人均互联网流量的变化就可以窥见一斑。1998年平均一个网民一个月流量才一个MB,到2000年,达到10MB,到2008年平均一个网民是1,000MB,到2014年是10,000MB。在芯片发展方面,有一个著名的摩尔定律,说的是每18个月,芯片体积要减小一半,价格降一半,而其性能却要翻一倍。在数据的增长速度上,有人也引用摩尔定律,认为大概18个月或2年,世界的数据量就要翻一番。2000年,全世界的数据存储总量大约800,000PB,而预计到2020年,世界的数据存储量将达到35ZB。[14]5以前曾有人提出知识爆炸论而备受争议,而如今的数据暴增已是摆在我们面前的现实。
2、Variety(数据类型多样)
大数据并不仅仅表现在数据量的暴增及数据总规模的庞大无比,最为关键的是,在大数据时代,数据的性质发生了重大变化。在小数据时代,数据的涵义和范围是狭义的。所谓数据,其原意是指“数+据”,即由表示大小、多少的数字,加上表示事物性质的属性,即所谓的计量单位。狭义的数据指的是用某种测量工具对某事物进行测量的结果,而且一定是以数字和测量单位联合表征。但在大数据时代,数据的涵义和属性发生了重大变化,数据的范围几乎无所不包,除了传统的“数+据”之外,似乎能被0和1符号表述,能被计算机处理的都被称为数据。[16]也可以说,大数据时代就是信息时代的延续与深入,是信息时代的新阶段。在大数据时代,数据与信息基本上是同义词,任何信息都可以用数据表述,任何数据都是信息。这样数据的范围得到了巨大的扩展,即从狭义的数字扩展到广义的信息。
传统的数据属于具有结构的关系型数据,也就是说数据与数据之间具有某种相关关系,数据之间形成某种结构,因此被称为结构型数据。例如,我们的身份证都是按照19位的结构模式进行采集和填写数据,手机号码都是11位的数据结构,而人口普查、工业普查或社会调查等数据采集都是事先设计好固定项目的调查表格,按照固定结构填写,否则因无法做出数据处理而被归入无效数据。在大数据时代,除了这种具有预定结构的关系数据之外,更多的是属于半结构和无结构数据。所谓半结构就是有些数据有固定结构,有些数据没有固定结构,而无结构数据则没有任何的固定结构。结构数据是有限的,而半结构和无结构数据却几乎是无限的。例如,文档资料、网络日志、音频、视频、图片、地理位置、社交网络数据、网络搜索点击记录、各种购物记录等等,一切信息都被纳入数据的范围因此带来了大数据的数据类型多样(Variety)的特征,也因此带来了所谓的海量数据规模(Volume)。
3、Velocity(数据快捷高效)
大数据的第三个特征是数据的快捷性(Velocity),指的是数据采集、存储、处理和传输速度快、时效高。小数据时代的数据主要是依靠人工采集而来,例如天文观测数据、科学实验数据、抽样调查数据以及日常测量数据等。这些数据因为依靠人工测量,所以测量速度、频次和数据量都受到一定的限制。此外,这些数据的处理往往也是费钱费力的事情,比如人口普查数据,因为涉及面广,数据量大,每个国家往往只能10年做一次人口普查,而且每次人口普查数据要经过诸多部门和人员多年的统计、处理才能得到所需的数据。人口普查数据公布之时,人口情况早已发生了巨大的变化。
在大数据时代,数据的采集、存储、处理和传输等各个环节都实现了智能化、网络化。由于智能芯片的广泛应用,数据的采集实现了完全智能化和自动化,数据的来源从人工采集走向了自动生成。例如上网自动产生的各种浏览记录,社交软件产生的各种聊天、视频等记录,摄像头自动记录的各种影像,商品交易平台产生的交易记录,天文望远镜的自动观测记录等等。由于数据采集设备的智能化和自动化,自然界和人类社会的各种现象、思想和行为都被全程记录下来,因此形成了所谓的“全数据模式”,这也是大数据形成的重要原因。此外,数据的存储实现了云存储,数据的处理实现了云计算,数据的传输实现了网络化。因此,所有数据都从原来的静态数据变为动态数据,从离线数据变为在线数据,通过快速的数据采集、传输和计算,系统可以做出快速反馈和及时响应,从而达到即时性。
4、Veracity(数据客观真实)
大数据的第四个特征是数据的真实性(Veracity)[7]16。数据是事物及其状态的记录,但这种记录也因是否真实记录事物及其状态而产生了数据真实性问题。由于小数据时代的数据都是人工观察、实验或调查而来的数据,人的主观性难免被渗透到数据之中,这就是科学哲学中著名的“观察渗透理论”。我们在观察、实验或问卷调查的时候,首先就要设置我们采集数据的目的,然后根据目的设计我们的观察、实验手段,或者设计我们的问卷以及选择调查的对象,这些环节中都强烈渗透着我们的主观意志。也就是说,小数据时代,我们现有目的,后有数据,因此,这些数据难免被数据采集者污染,很难保持其客观真实性。
但在大数据时代,除了人是智能设备的设计和制造者之外,我们人类并没有全程参与到数据的采集过程中,所有的数据都是由智能终端自动采集、记录下来的。这些数据在采集、记录之时,我们并不知道这些数据能用于什么目的。采集、记录数据只是智能终端的一种基本功能,是顺便采集、记录下来的,并没有什么目的。有时候甚至认为这些数据属于数据垃圾或数据尘埃,先记录下来,究竟有什么用,以后再说。也就是说,在大数据时代,我们是先有数据,后有目的。这样,由于数据采集、记录过程中没有了数据采集者的主观意图,这些数据就没有被主体污染,也就是说,大数据中的原始数据并没有渗透理论,因此确保了其客观真实性,真实反映了事物及其状态、行为。
三、大数据的哲学本质
大数据究竟是什么这个问题,仅仅从语义和特征来回答,似乎并没有完全揭示出大数据的本质。大数据时代的来临,最重要的是给我们带来了数据观的变革,只有从哲学世界观的视角分析大数据的世界观或数据观,才能真正回答大数据究竟是什么。[17]简单说来,大数据作为一场数据革命,除了带来海量数据,并且这些数据具有4V特征之外,更重要的是大数据带来的数据世界观。在大数据看来,万物皆数据,万物皆可被数据化,大数据刻画了世界的真实环境,并且带来了信息的完全透明化,我们的世界变成了一个透明的世界。
1、在大数据看来,万物皆由数据构成,世界的本质是数据。
世界究竟是什么?这是哲学家长期关注的重大问题。从古希腊哲学家泰勒斯开始,哲学家们就开始探索世界的本原,并从beginning(起源)和element(要素)两个维度进行了回答。[18]早期自然哲学家曾经把水、火、土、气、原子分别作为本原,而后期的人文哲学家则基本上将人类精神作为本原。马克思主义哲学正是从beginning的维度将历史上的所有哲学分为唯物主义和唯心主义,在这一维度,物质和精神是对立的,只能二者选一。从element的维度看,物质和精神都是构成世界的要素,而且以往的哲学家和科学家基本都认为也只有这两者才是构成世界的终极要素。但刚刚兴起的大数据则认为,除了以往认为的物质和精神之外,数据是构成世界的终极要素之一,即构成世界的三大终极要素是物质、精神和数据。英国大数据权威维克托o舍恩伯格甚至认为,世界万物皆由数据构成,数据是世界的本质。[9]125
所谓万物皆数据,数据是世界的本质,说的是世界上的一切,无论是物质还是意识,最终都可以表述为数据,这样数据就成了物质、意识的表征,甚至将物质和意识关联和统一起来。古希腊哲学家毕达哥拉斯从音乐与数字、几何图形与数字的关系中发现了数据的重要性,提出了“数是万物本原”的思想,强调了数据对世界构成的意义以及对世界认知的影响。无独有偶,中国老子在数千年前就认识到数据的世界终极本质,在周易中就提出了“道生一,一生二,二生三,三生万物”的思想,把世界的生成与数据联系起来。特别是在易传中的阴阳八卦图中,从阴阳两极相反相成,从阴阳两仪,到八卦、六十四卦象……由此不断演化,最后生成出整个世界。两千多年以前的毕达哥拉斯和周易都不约而同地揭示了数据与万物的关系,以及世界的数据本质,充分强调了数据在世界构成中的重要地位。但是,在随后的两千多年的历史长河中,数据在人类生活和科学认知中虽然越来越重要,而且也有莱布尼兹、康德、马克思之类的哲学家关注过数据的重要性,不过总体来说,哲学家们对数据基本上是忽视的。随着大数据时代的来临,数据才获得到了应有的地位,哲学家们才又想起毕达哥拉斯和周易的数据世界观。可以说,大数据时代的来临是毕达哥拉斯和周易所提出的数据世界观的当代回响。
2、在大数据看来,世界万物皆可被数据化,大数据可实现量化一切的目标。
数据是对世界的精确测度和量化,是认知世界的科学工具。自从发明了数字和测量工具,人类就不断地试图对世界的一切进行数据测量、精确记录。古埃及时期,由于尼罗河泛滥,人们每年需要重新丈量土地,于是发现了数据的秘密,并发明了测量技术。在古代,各国先民都陆续开始了用数据来记录财富,例如丈量土地、人口统计、征收税赋、计算财富等等。于是,数据成了测量、记录财富的工具,人们日常生活所接触的大量物品、财产都可以用数据来表征,这个时期的数据可被称为“财富数据”。文艺复兴之后,人们逐渐发明了望远镜、显微镜、钟表等科学测量器具。随着测量技术的进步,测量与数据被广泛应用于科学研究之中。例如天文学家第谷对天文现象进行了大量的观察记录,并积累了大量的天文数据。随后,力学、化学、电磁学、光学、地学、生物学等,各门学科都通过测量走上了数据化、精确化的道路。各门科学积累大量的科学数据,并借助于数据,各种自然现象都实现了可测量、可计算的精确化、数学化的目标,自然科学各学科也完成了其科学化的历程。这个时期可被称为“科学数据”时期。
由于人类意识的复杂性,人类及其社会的测量和数据化成为数据化道路上的拦路虎。社会科学虽然引进自然科学方法,但其数据的客观性往往招致质疑,而人文学科更是停留在思辨的道路上。在传统方法遇到困难的地方,大数据却可以大显身手。大数据用海量数据来测量、描述复杂的人类思想及其行为,让人类及其社会也彻底被数据化,这些数据可被称为“人文数据”。所以,大数据时代将数据化的脚步向前迈进了一大步,在财富数据化、科学数据化的基础上,实现了人文社会行为的数据化。因此,大数据自信地认为,数据是物质的根本属性,世界万物皆可被数据化,其一切状态和行为都可以用数据来表征,因此量化一切是大数据的终极目标。
3、大数据全面刻画了世界的真实状态,科学研究不必再做理想化处理。
真实、全面地认知世界是人类的一种理想,同时也是摆在人类面前的一道难题。真实的世界,无论是自然界还是人类社会,都极为复杂,需要极其繁多的参数才能准确、全面地对其进行描述。但是,由于过去没有先进的数据采集、存储和处理技术,于是不得不对复杂的研究对象进行“孤立、静止、还原”的简单化处理。所谓孤立就是把对象与环境的所有联系都切断,让其成为一个孤立的研究对象,免得受外界的侵扰。所谓静止,就是将本来运动变化的对象做一时间截面,然后就以这一时点的状态代表所有时点的状态。所谓还原是指将复杂的现象逐渐返回到几个简单的要素或原点,然后从要素的性质和状态推演出系统的性质和状态。复杂对象经过简单化处理之后,虽然我们能够认识和把握对象的某些性质和状态,但毕竟经过了简单、粗暴的理想化处理,它已经不能真正反映真实对象和真实世界。
大数据技术使用了无处不在的智能终端来自动采集海量的数据,并用智能系统处理、存储海量数据,不再需要对研究对象做孤立、静止和还原的简单化处理,而是将对象完全置于真实环境之中,有关对象的大数据全面反映了复杂系统各个要素、环节、时态的真实、全面状态。这样,在大数据时代,我们可以在真实、自然的状态下研究复杂的对象。大数据记录了真实环境下研究对象的真实状态,因此我们可以利用大数据去真实、完整、全面地刻画复杂的研究对象。这就是说,大数据是真实世界的全面记录,一切状态尽在数据之中,大数据真正客观地反映了对象的真实状态。
4、万物的数据化带来了世界的透明化,未来的世界是一个透明世界。
宇宙万物,复杂多变,因此难于被人类把握。人们面对复杂多变的世界往往感到漆黑一片,难怪哲学家康德会认为,现象世界背后存在着一个物自体,而这个物自体就像一个黑箱,永远无法被人类认知,那是上帝留下的自留地,科学无法涉足其中。这就是说,真实的世界就像一个大黑箱,我们永远无法打开。我们人类就像那个剥洋葱的小男孩,剥到最后也不知道里边究竟是什么。
但是,大数据技术彻底改变了人类对世界的认知。由于无处不在的智能芯片,整个世界变成了一个智能的世界、数据的世界,或者叫智慧世界。通过赋予世界以智慧,就像一切事物都被安装了充满智慧的大脑。无所不知的智能系统可以感知出世界的一切,而且将一切状态都以数据的形式记录、储存下来。通过数据挖掘,我们人类就可以知道了世界的一切秘密。过去只有上帝才有全知全能,如今大数据似乎取代了上帝的位置,或者说大数据成了全知全能的上帝代言人,它能够感知万物、知晓一切,从此解决了长期困扰人类的信息不对称问题。康德所设置的科学禁区被大数据所打破,透过大数据,世界变成了一个完全透明的世界,一切都可以被人类所感知、把握和预知。大数据让我们的世界从一个附魅的世界变成了祛魅的世界,数据的阳光把原本黑暗、神秘的世界深处照得通彻透亮。在大数据面前,无论是自然物质世界还是人类精神世界,都从黑天鹅变成了白天鹅甚至是透明的天鹅,大数据成了无所不能的上帝。套用赞美牛顿的一首英格兰儿歌来说,宇宙万物及其秘密都隐藏在黑暗之中,上帝说,让大数据去吧,于是一切都变成了光明!
大数据究竟是什么?这个问题虽然难于用一句话回答,但从大数据的语义中我们知道了大数据意味着数据规模特别巨大,以至于传统的技术手段难于处理。从大数据的4V特征中,我们进一步了解到大数据时代的所谓数据已经从狭义的数字符号走向了广义的信息表征,一切信息都是数据。从大数据的哲学本质中,我们更深入地发掘出大数据现象背后所蕴藏的哲学本质:大数据代表着一种新的世界观,万物皆数据,数据是万物的本质属性,而且随着大数据的发展,我们的世界将变成一个完全被数据化的透明世界。
[参考文献]
[1]Steve Lohr. The Age of Big Data [N]. The New York Times, Feb. 11, 2012.
[2]M-S. Viktor, C. Kenneth. Big Data [M]. London: John Murray, 2013.
[3]涂子沛.大数据—正在到来的数据革命[M].桂林:广西师范大学出版社,2013.
[4]转引自赵国栋,等.大数据时代的历史机遇[M].清华大学出版社,2013: 21.
[5][EB/OL]..
[6][EB/OL].大数据.
[7]Michael Wessler.Big Data Analytics for Dummies[M].New Jersey: John Wiley &Sons, Inc., 2013.
[8][EB/OL]..
[9]维克托o舍恩伯格,肯尼思o库克耶.大数据时代[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013.
[10]J. Hurwitz, etc.Big Data for Dummies[M].New Jersey: John Wiley &Sons, Inc., .
[11]邬贺铨.大数据时代的机遇与挑战[J].求是,_49.
[12]李德毅.聚类成大数据认知的突破口[N].中国信息化周报,,第7版.
[13]李国杰.大数据成为信息科技新关注点[J].硅谷,2012(13):17.
[14]P.C. Zikopoulos,etc. Understanding Big Data[M].New York:McGraw Hill, 2012: 5.
[15]黄欣荣.从复杂性科学到大数据技术[J].长沙理工大学学报(社科版),2014(2):5-9.
[16]黄欣荣.大数据哲学研究的背景、现状与路径[J].哲学动态,2015(7):96-102.
[17]黎德扬.信息时代的大数据现象值得哲学关注[J].长沙理工大学学报(社科版),2014(2):10-13.
[18]赵林.西方哲学史讲演录[M].北京:高等教育出版社,2009:37.
The Meaning, Character and Essence ofBig Data
Huang Xinrong
(Management philosophy research center, Jiangxi University of Finance and Economics, Nanchang 330013, China)
Abstract: Big data is a hot wordat present, but what is the big data?Its meaning is relatively vague in academic circles and industry. Semantic analysis from the confusion of meaning, and revealing the meaning of big data from the basic features and essence have important significance for the development of big data technology and public understanding of big data.
Keywords: big data, semantic, feature, essence
作者单位:黄欣荣,教授,博士生导师,(江西财经大学管理哲学研究中心南昌330013)

我要回帖

更多关于 从哲学角度看挫折 的文章

 

随机推荐