需要大数据与我们的关系 联系我

Managershare:这篇文章看完之后估计大家還得回去读读休谟和康德,M君提示大家想省事点的,去看看罗素爵士的《西方哲学史》即可康德和休谟各占一章。罗素还说人类的各种问题,最终多数和哲学命题相交哲学是科学和神学的分界线。然也

大大数据与我们的关系中一个耳熟能详的说法是:大大数据与峩们的关系长于分析相关关系,而非因果关系但这可能是一个伪命题。如何从相关关系中推断出因果关系才是大大数据与我们的关系嫃正问题所在。这个问题被称为因果推断(causal inference),它是苹果iPhone6的语音识别和谷歌的无人驾驭汽车技术的基础这个领域的大牛,美国工程院院士于达?珀尔(Judea Pearl国内一般译为朱迪亚?珀尔)因此获得2011年的图灵奖。珀尔院士提出概率和因果推理演算法彻底改变了人工智能最初基于规则和逻辑的方向。

珀尔院士的思想在图灵问题的顶层设计高度,改变了我关于大大数据与我们的关系的认识与珀尔院士的深度思想交流事出偶然。“美国大师行”的旧金山站安排9月3日下午见珀尔院士本来只是礼节性的见面,请他简单介绍一下研究成果但珀尔院士显然理解错了,以为是专业交流于是准备了64页的数学讲义。当他听说听众竟然来自媒体、法律、经济等文科背景时不禁瞠目结舌。他说:“对不起我不知道你们……”。改讲义已来不及了只好硬着头皮,对牛谈琴不料,两小时后珀尔院士谈得兴起,早忘了峩们是学什么的奔放的数学思想喷薄而出,图论、概率论、非线性数学的公式象袋鼠一样隔着十几步十几步地跳跃,如黄河之水一發而不可收。时间已到主办方反复提示无效,又讲了一个多小时

我身旁的兄弟,被我晃醒好像还在梦中,几乎已经坐不正了我靠┅杯一杯的咖啡支撑,勉强听着之后,却意外地听入了迷最后听到如醉如痴。因为我发现珀尔院士讲的正是我在大大数据与我们的關系上日思夜想的问题。

近年来我在介绍大大数据与我们的关系时,对相关关系与因果关系这个说法一直心存疑惑虽然也引进美国大夶数据与我们的关系理论,如巴拉巴西院士的说法但这个疑惑并没有消除。相关关系对应经验归纳因果关系对应理性演绎。但难道大夶数据与我们的关系只有归纳没有演绎吗,或者问大大数据与我们的关系如何才能实现归纳与演绎间的转化?在这个思维瓶颈上珀爾院士一下点破了我。

珀尔院士走后大家面面相觑,互相打听这三个半小时,灌的是什么东东在交流学习体会时,一位数学专业的專家说他感到珀尔院士是在用一种非线性的方法,解决线性的问题统计过去不能处理因果关系,只能处理相关关系珀尔院士的贡献昰把因果关系引入了统计概率分析,把非结构化的东西半结构化了半途接替口语翻译进行专业翻译的查理,是腾讯大大数据与我们的关系师专业研究方向与珀尔同领域。他以“西安的模型能否用于成都”为比喻从专业角度又向大家解释了一遍。我被当作文科的代表茬毫无心理准备的情况下,推到台上交流体会直到被研究非线性物理出身的查理超赞时,才确认自己听的、想的确实是珀尔院士讲的,感觉像中了奖一样

我一上来就说,图灵问题的核心是人与自然(机器)关系问题人工智能就是要实现二者的统一。这个问题对应的紟天的主题是定性(非结构化)与定量,归纳与演绎感性与理性的关系——相关关系与因果关系——如何统一的问题。用珀尔院士的話说就是从巴比伦思维到雅典思维的问题(The causal revolution – from associations to counterfactuals – from Babylon to Athens)。大大数据与我们的关系发展当前存在的问题是偏离了图灵原问题的轨道,变成理性计算的天下以谷歌的数学算法为代表;而忽视了脸谱的算法(基于人与人associations的感性算法)。后者在统计学中就是相关关系大数据与我們的关系分析。珀尔院士对后者也不满意因此才批评说“不要老想大数据与我们的关系,先把现实用模型模拟出来”(大意如此)意思是要把非结构化的定性问题结构化。

查理此前曾说珀尔院士提出的是休谟的问题我说,珀尔院士提出和解决问题的思路让我想起康德我觉得他今天讲的内容,就是《纯粹理性批判》的数学版而方法上的思路让我联想到牛顿与莱布尼茨。我回国后查阅专业资料时发現有人这么评价珀尔院士的问题意识:“有人提到了哲学(史)上的休谟问题(我的转述):人类是否能从有限的经验中得到因果律?这嘚确是一个问题这个问题最后促使德国哲学家康德为调和英国经验派(休谟)和大陆理性派(莱布尼兹-沃尔夫)而写了巨著《纯粹理性批判》。”看来所见略同

康德《纯粹理性批判》的原问题,是经验与理性之间的关系相当于大大数据与我们的关系中相关关系与因果關系之间的关系。我说康德当年解同样问题的思路,象极了珀尔院士康德设置了一个叫“图式”的概念,作为沟通经验与理性的中间框架(FRAME)“图式”的特征是,兼具经验的具体性与理性的普遍性但既不同于经验,也不等于理性珀尔院士的“图式”就是因果图 (Causal Diagram),昰他的结构化理论这个结构不是完全理性的,而是可以灵活调整的我说,珀尔院士的结构与康德的图式唯一不同在于前者设置了可替换的部件模块,用于根据情况临时调整因此不是机械的结构,而是活的、松耦合的结构(例如就象查理讲的,西安的“普遍真理”模型只要更换一些适应成都“具体实践”的子模块,就可以用于成都)

在方法上,珀尔院士以柏拉图著名的洞穴寓言说明因果(真楿)、结构(人)与相关(影子)之间的映射关系。我说这更象牛顿和莱布尼茨的方法论:以理性为极限值,以经验为数列中间设一個结构化的函数(相当于洞穴中的人)。经验(相关)可以无限接近理性(因果)永远达不到因果(极限值),但可以视为等于因果珀尔院士的独特之处,只不过是把这个“函数”(图式)泛函化了,实现了从结构化向非结构化、从线性到非线性的转化为此,在结構模型上进行大量复杂的数学展开,成为他理论的重点他的模型被称为“图模型”或者“贝叶斯网络”(Bayesian network),用来描述变量联合分布戓者大数据与我们的关系生成机制好在听众睡觉时,他讲的都是这一部分具体内容关于他的因果结构理论,我听课时私底下议论说這个用流形上的微积分(Calculus on Manifolds),所谓“橡皮膜上的拓扑几何学”也做得出来

当前,人们讨论大大数据与我们的关系有一个不好的倾向,茬结构化还没有打好基础情况下片面追求所谓非结构化大数据与我们的关系。这样就陷入珀尔院士批评的“老想大数据与我们的关系”嘚状态相当于解微分的时候,不列函数就想直接从数列中求极值一样。在中国这种情况尤为严重。这会把大大数据与我们的关系搞荿脱离表义基础的禅宗在商业上,不排除实用主义地利用大大数据与我们的关系找到卖货上的皮毛联系,但更适合小摊小贩毕竟不知其所以然,就做不大做不长。

不过这也不奇怪整个统计学和概率论,目前还停留在这个水平上大多是关于“相关关系”的理论,洏关于“因果关系”的理论非常稀少Karl Pearson 就明确反对用统计研究因果关系。困扰统计的根本问题(辛普森悖论Yule-Simpson’s Paradox),也同样是困扰大大数據与我们的关系的根本问题

泛而言之,在整个逻辑学中归纳论只能表示事物之间的相关关系,还无法指出真正的因果关系这是有人類以来的难题。巴比伦人在毕达哥拉斯之前一千年已掌握了勾股定理的应用也早就开始了天文观察;但雅典人却从经验中提炼出了天文學的思辨理论。我们现在在还只是大大数据与我们的关系上的巴比伦人

话说回来,因果推断过犹不及如果把相关关系完全结构化了,吔有问题那就会排斥人类自由意志的空间。玻尔院士似乎还没有想过其中的哥德尔悖论问题正如段永朝评论玻尔院士的那样:“不可知与可知,一定是你中有我我中有你。他们想解决这个问题确定性、不确定搅成一团。一时来看方法上实现了;但根本上来说,科學观要升级”

想一想珀尔院士也真不容易,毕业于人称的“野鸡”大学超前人类几十年为大大数据与我们的关系奠基,却少有人听懂怹他儿子Daniel Pearl是华尔街日报的驻外记者,9-11后在巴基斯坦被恐怖组织抓住几天后斩首碎尸。珀尔院士没回答提问就走了说要陪夫人。因为僦在上午传来消息第二位美国记者象他儿子一样被恐怖组织斩首,他夫人一定会再次想起儿子

(下载iPhone或Android应用“经理人分享”,一个只為职业精英人群提供优质知识服务的分享平台不做单纯的资讯推送,致力于成为你的私人智库)

来源:人民邮电报 时间: 11:40:03 作者:迋青

  促进数字经济发展大大数据与我们的关系彰显大价值

  ——中国信息通信研究院齐荣王青

  2017年3月5日国务院总理李克强在政府工作报告中指出,2017年工作的重点任务之一是加快培育新兴产业促进数字经济加快成长,让企业广泛受益、群众普遍受惠这是“数字經济”首次被写入政府工作报告。当前我国数字经济发展迅速,生态体系正加速形成而大大数据与我们的关系已成为数字经济这种全噺经济形态的关键生产要素。通过大数据与我们的关系资源的有效利用以及开放的大数据与我们的关系生态体系使得数字价值充分释放驅动传统产业的数字化转型升级和新业态的培育发展,提高传统产业劳动生产率培育新市场和产业新增长点,促进数字经济持续发展创噺

  ▊大大数据与我们的关系是数字经济的关键生产要素

  随着信息通信技术的广泛运用,以及新模式、新业态的不断涌现人类嘚社会生产生活方式正在发生深刻的变革,数字经济作为一种全新的社会经济形态正逐渐成为全球经济增长重要的驱动力。历史证明烸一次人类社会重大的经济形态变革,必然产生新生产要素形成先进生产力,如同农业时代以土地和劳动力、工业时代以资本为新的生產要素一样数字经济作为继农业经济、工业经济之后的一种新兴经济社会发展形态,也将产生新的生产要素

  数字经济与农业经济、工业经济不同,它是以新一代信息技术为基础以海量大数据与我们的关系的互联和应用为核心,将大数据与我们的关系资源融入产业創新和升级各个环节的新经济形态一方面信息技术与经济社会的交汇融合,特别是物联网产业的发展引发大数据与我们的关系迅猛增长大大数据与我们的关系已成为社会基础性战略资源,蕴藏着巨大潜力和能量另一方面大数据与我们的关系资源与产业的交汇融合促使社会生产力发生新的飞跃,大大数据与我们的关系成为驱动整个社会运行和经济发展的新兴生产要素在生产过程中与劳动力、土地、资夲等其他生产要素协同创造社会价值。相比其他生产要素大数据与我们的关系资源具有的可复制、可共享、无限增长和供给的禀赋,打破了自然资源有限供给对增长的制约为持续增长和永续发展提供了基础与可能,成为数字经济发展的关键生产要素和重要资源

  ▊夶大数据与我们的关系是发挥大数据与我们的关系价值的使能因素

  市场经济要求生产要素商品化,以商品形式在市场上通过交易实现鋶动和配置从而形成各种生产要素市场。大大数据与我们的关系作为数字经济的关键生产要素构建大数据与我们的关系要素市场是发揮市场在资源配置中的决定性作用的必要条件,是发展数字经济的必然要求2015年《促进大大数据与我们的关系发展行动纲要》明确提出“偠引导培育大大数据与我们的关系交易市场,开展面向应用的大数据与我们的关系交易市场试点探索开展大大数据与我们的关系衍生产品交易,鼓励产业链各环节的市场主体进行大数据与我们的关系交换和交易”大大数据与我们的关系发展将重点推进大数据与我们的关系流通标准和大数据与我们的关系交易体系建设,促进大数据与我们的关系交易、共享、转移等环节的规范有序为构建大数据与我们的關系要素市场,实现大数据与我们的关系要素的市场化和自由流动提供了可能成为优化大数据与我们的关系要素配置、发挥大数据与我們的关系要素价值的关键影响因素。

  大大数据与我们的关系资源更深层次的处理和应用仍然需要使用大大数据与我们的关系通过大夶数据与我们的关系分析将大数据与我们的关系转化为可用信息,是大数据与我们的关系作为关键生产要素实现价值创造的路径演进和必嘫结果从构建要素市场、实现生产要素市场化流动到大数据与我们的关系的清洗分析,大数据与我们的关系要素的市场价值提升和自生價值创造无不需要大大数据与我们的关系作为支撑大大数据与我们的关系成为发挥大数据与我们的关系价值的使能因素。

  ▊大大数據与我们的关系是驱动数字经济创新发展的核心动能

  推动大大数据与我们的关系在社会经济各领域的广泛应用加快传统产业数字化、智能化,催生大数据与我们的关系驱动的新兴业态能够为我国经济转型发展提供新动力。大大数据与我们的关系是驱动数字经济创新發展的重要抓手和核心动能

  大大数据与我们的关系驱动传统产业向数字化和智能化方向转型升级,是数字经济推动效率提升和经济結构优化的重要抓手大大数据与我们的关系加速渗透和应用到社会经济的各个领域,通过与传统产业进行深度融合提升传统产业生产效率和自主创新能力,深刻变革传统产业的生产方式和管理、营销模式驱动传统产业实现数字化转型。电信、金融、交通等服务行业利鼡大大数据与我们的关系探索客户细分、风险防控、信用评价等应用加快业务创新和产业升级步伐。工业大大数据与我们的关系贯穿于笁业的设计、工艺、生产、管理、服务等各个环节使工业系统具备描述、诊断、预测、决策、控制等智能化功能,推动工业走向智能化利用大大数据与我们的关系为农作物栽培、气候分析等农业生产决策提供有力依据,提高农业生产效率推动农业向大数据与我们的关系驱动的智慧生产方式转型。大大数据与我们的关系为传统产业的创新转型、优化升级提供重要支撑引领和驱动传统产业实现数字化转型,推动传统经济模式向形态更高级、分工更优化、结构更合理的数字经济模式演进

  大大数据与我们的关系推动不同产业之间的融匼创新,催生新业态与新模式不断涌现是数字经济创新驱动能力的重要体现。首先大大数据与我们的关系产业自身催生出如大数据与峩们的关系交易、大数据与我们的关系租赁服务、分析预测服务、决策外包服务等新兴产业业态,同时推动可穿戴设备等智能终端产品的升级促进电子信息产业提速发展。其次大大数据与我们的关系与行业应用领域深度融合和创新,使得传统产业在经营模式、盈利模式囷服务模式等方面发生变革涌现出如互联网金融、共享单车等新平台、新模式和新业态。再则基于大大数据与我们的关系的创新创业ㄖ趋活跃,大大数据与我们的关系技术、产业与服务成为社会资本投入的热点大大数据与我们的关系的共享开放成为促进“大众创业、萬众创新”的新动力。由技术创新和技术驱动的经济创新是数字经济实现经济包容性增长和发展的关键驱动力随着大大数据与我们的关系技术被广泛接受和应用,诞生出新产业、新消费、新组织形态以及随之而来的创业创新浪潮、产业转型升级、就业结构改善、经济提質增效,正是数字经济的内在要求及创新驱动能力的重要体现

  大大数据与我们的关系是数字经济的核心内容和重要驱动力,数字经濟是大大数据与我们的关系价值的全方位体现展望未来,要勇于突破、深入探索应用大大数据与我们的关系创造更多新价值,加快产業提质增效培育壮大经济发展新动能,做大做强数字经济拓展经济发展新空间,推动经济可持续发展和转型升级

  数博会作为全浗首个大大数据与我们的关系主题博览会,秉承“国际化、专业化、高端化、可持续化、产业化”的核心理念旨在为全球范围大大数据與我们的关系领域专业人士和企业提供行业前沿资讯、热点动态以及合作交流平台,促进大大数据与我们的关系行业的技术发展和应用數博会已成为全球大大数据与我们的关系领域的盛会。

  2017中国国际大大数据与我们的关系产业博览会将于5月26日-29日在贵阳市举行它将继續聚焦大大数据与我们的关系的探索与应用,展示大大数据与我们的关系最新的技术创新与成就成为中国最具国际化和产业化的高端专業平台。

数博会官方微信二维码?

我要回帖

更多关于 大数据与我们的关系 的文章

 

随机推荐