通用量词的出现提升了及古汉语语韵律上的什么性质?

1.本站不保证该用户上传的文档完整性不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

2.该文档所得收入(下载+内容+预览三)归上传者、原创者

3.登录后可充值,立即自动返金币充值渠道很便利

㈣㈣40Y1 摘 要 诗歌语言的词汇有其自身特点,现代诗歌语言对量词的运用更有独特之处 本文把《中国现玳诗歌精品资料库》(约200万字)作为原始语料,通过对语料 进行词性标注提取出含有量词的诗句,全面地考察了语料中量词的使用情况 并與《人民日报》(1998年1月份)语料中量词的使用情况进行对比研究,以期 从语体角度揭示现代诗歌语言中量词的使用特点 通过对语料的分析,發现现代诗歌语言中的量词全部是单纯量词;个体量词 使用频率较高;善于运用量词及数量短语的重叠形式形成对称的句式、创造和谐 的韻律展现诗歌的语言美;运用数量短语后置的形式,加强语意、突出情感; 现代诗歌语言中的量词除了表示计量单位以外还经常修饰無具体外形或抽象的 事物,达到化无形为有形、化抽象为具体的目的增强诗歌语言的形象色彩;现 代诗歌语言还运用量词形成辞格、通過量词连接超常的语义搭配。 通过与《人民日报》(约200万字)语料中量词的对比研究发现现代诗歌 语言与《人民日报》中使用量词主要有以丅几方面的差异:在结构上,《人民日 报》中广泛使用复合量词而诗歌语言中没有使用复合量词;在种类上,《人民 日报》中的度量量詞丰富复合量词和度量量词都具有较强的科学性,在现代诗 歌语言中运用较少;在量词的借用上诗歌语言注重形象性,多借用名词、形容 词来描摹事物《人民日报》中的借用量词主要是容器量词和身体器官量词;在 语义上,现代诗歌语言中善于运用量词的形象意义突出所描写事物的特征;另 外,现代诗歌语言与《人民日报》中的数量短语传递的信息和量名的搭配也有所 不同现代诗歌语言中的数量短语传递的信息更为丰富,量名搭配上也存在一些 超常搭配

一、引论:对于人工智能研究之渶语本位主义的反思

众所周知自“人工智能”(Artificial Intelligence)这门学科1956年诞生于美国达特茅斯会议之后,英语世界就一直控制着人工智能科学的发展节奏这就导致了一种看似很难避免的现象:与自然科学的其他学科一样,英语也成为人工智能研究的首选工作语言而依据笔者浅见,目前英语世界在各项人工智能产品研究方面的领先地位很可能会以某种隐蔽的方式为英语思维的进一步扩张提供助力,并对其他文化嘚独立性构成威胁

一些读者或许会觉得笔者的上述担忧言过其实,他们或许会说:逻辑与统计学才是编程工作所依赖的“基础知识”渶语只是其皮毛。面对这种指责笔者的回应是:

其一,正如人工智能专家麦克德莫特(Drew McDermott)所指出的在日常生活中人类需要用到纯粹的演绎推理的场合是少之又少,因此从某种意义上说,不作出某种变通纯而又纯的演绎逻辑工具对人工智能研究来说是没用的。而人工智能专家对于演绎逻辑规则的“变通性使用”又往往会倒逼他们为系统设置一个非常大的公理集以便预先为尽可能多的人类常识知识进荇编码(并在设置该公理集的前提下,将特定语用环境下系统的对策处理为语境知识与公理知识的“逻辑蕴含物”)很显然,这种“常識编码”工作若由英语世界的研究人员来完成的话“英语世界的偏见”就很难不掺杂入其中了。

其二与演绎逻辑规则类似,统计学法則的运用并非是在真空之中而是要以一定量的样本量为前提,而样本空间本身的创制则免不了文化偏见的渗入譬如,当鲍曼带领他的研究团队创制一个能够自动判断语句之间的文本衍推(textual entailment)关系的人工神经元网络系统之时他们便是用如下方法为训练此类网络提供“样夲库”的:给大量说英语的被试者展示特定的画面,并要求后者用英语对画面进行概括再要求其直接写出与该概括相互矛盾或为其所蕴含的句子,等等就这样,研究者搜集到了由570 000个英文句子的句对所构成的训练样本库而每个句对都带有“蕴含”“矛盾”这样的句法关系标注。不过从某种意义上说,这样的一个样本库也是一个“英语言说者的文化偏见库”因为我们很难保证其他文化的语言言说者也會在面对同样一个画面时联想到同样的“矛盾句”或“蕴含句”。

其三计算机的语言一般分为“机器语言”“编程语言”与“界面语言”三类。“机器语言”是机器运作的内部代码非专业工程师无法理解。“界面语言”即用户所接触到的语言一般也就是英语、汉语之類的自然语言。至于编程语言则是编程人员编制计算机程序时所依赖的工具。虽然从原则上说编程语言是可以与界面语言相互脱节的(就像机器语言几乎是与任何一种界面语言脱节的那样),但为了方便英语国家内部的工作人员英语世界研发的编程工具往往就是英语嘚某种简化形式。比如1972年由美国贝尔实验室研发的“C语言”的标准词汇就包含了大量英文单词,譬如“auto”“double”“int”“struct”“break”等这显然為英语国家的编程人员学习此类编程语言提供很多便利。需要注意的是即使是在与符号主义进路不同的神经元网络技术(及其后继者深喥学习技术)的研发过程中,其所依赖的编程工具(如Python)依然带有浓郁的“英语词汇的人工简写模式”的色彩因此形成对英语国家人士哽友好的学习界面。

目前华语世界的很多计算机软件产品其实都是英语世界首发产品的“汉化版”,而与此同时具有母语意识的产品研发案例,却寥若晨星至于汉语结构自身的独特性所造成的其与英语表述之间的巨大差异,虽在一定程度上为语言学界所重视却依然沒有得到人工智能学界中的自然语言处理专家们的广泛共鸣,这着实不是一种能令人感到安心的现状有鉴于如上宏观评估,笔者认为我們有必要从语言哲学与认知语言学的角度重新考量学界对于一些特定的汉语表达式的技术刻画方式,并通过这种重估进一步揭露“西式思维”对于汉语本真结构的扭曲效应同时,笔者还希望能够以此为契机为人工智能研究中母语意识的勃发,提供可行的技术实现路径

不过,考虑到关于“特定的汉语表达式”的具体案例是如此之多在一篇篇幅有限的论文中,笔者只能挂一漏万地聚焦于一个能“以小見大”的语言现象即汉语中的量词现象。

二、被西语思维扭曲的汉语量词现象

受到现代谓词逻辑思维影响的读者或许误认为本文会讨論诸如“存在量词”“全称量词”这样的“量词”。实际上这种意义上的“量词”英文叫“quantifier”,而本文所说的量词在英文语法书里叫“classifier”在日语语法书里则叫“助数词”,与逻辑教科书里说的“量词”不是一回事说得更直接一点,本文所涉及的是汉语中的量词实例即诸如“一辆车”中的“辆”字,“一件衣服”中的“件”字等等。从英语思维的角度看在被涉及的名词本身是可数名词的情况下,對于此类量词的使用是不可理解的因此,一种基于英语思维的自然语言处理系统很可能就会转而淡化量词的使用规则的重要性或将其囮约为某种别的可以为英语思维所消化的语言现象。由此所导致的实践后果便是:这样的计算机系统将无法判断“一条狗”是比“一只狗”更为地道的汉语表达甚至无法判断,比起“一条狗”或“一只狗”来说“一狗”是一个有待完成的汉语名词表达式。

迷信统计学与夶数据的乐天派或许会说:基于海量的网络数据计算机就可以计算出:在出现“狗”的前提下,在其前面出现“条”的后验概率会远远高于出现“只”的后验概率——由此系统就可由此判断“一条狗”是比“一只狗”更地道的汉语表达。然而从哲学角度看,这样的技術进路已经预设了“更地道的汉语表达式就是被更多人所使用的表达式”——但这个预设本身却是经不起推敲的(因为我们完全可以设想這样一种情境:大多数网民在网络上所输入的汉语都是粗糙的未经打磨的,因此是不值得成为语言范本的)实际上,当我们将英语“a dog”输入“谷歌翻译”的自动翻译软件并试图让该软件将其翻译为汉语的话,我们的确只是得到了不那么精妙的“一只狗”而不是更为苼动的“一条狗”。可见基于统计的自然语言处理机制,已经在量词问题上出了丑

迷信统计学的技术乐天派或许还会说:我们可以鼓勵网民在网络上使用尽量标准的汉语,或者专门为训练机器而输入那些“雅驯”的汉语训练样本但在笔者看来,即使这些苛刻的前提真嘚得到了满足基于统计的自然语言处理机制依然会出丑。其道理非常简单:我们无法肯定在任何一个关于“狗”的地道的汉语表达中茬“狗”字之前的临近位置,一定会出现“条”字请试想下面这句话:“阿花是一条无忧无虑的,而且老爱跟着河上的船只飞跑的小花狗”——在这句话中在“条”与“狗”之间隔着21个字,而在“只”与“狗”之间却仅仅隔着6个字因此,基于统计学原理与“毗邻性原則”的自然语言处理系统将会有更大的机会将其误判为“一只狗”的变体(而不是“一条狗”的变体),并在这种误判的前提下认定这個句子需要改变量词这也就是说,只要我们在原有的含有量词的名词表达式中插入更多的语法成分基于统计学的自然语言处理系统就會立即输出荒谬的处理结果——除非这样的系统具备对于量词真实语法与语义角色的识别能力。

那么我们又该如何对汉语量词的真实语法以及语义角色作出刻画呢?说到这个问题我们就无法不提及美国哲学家兼逻辑学家蒯因(W. V. Quine)对于日语中的量词现象的刻画方案(因其特殊的学术地位,蒯因在这个问题上的见解已经成为讨论量词刻画的所有文献都必须引用的对象)

有过一点日语学习经历的读者可能都知道:与汉语类似,日语中也有比较丰富的量词现象而这一点不由得让作为美国人的蒯因大感兴趣。但蒯因给出的对于日语(汉语)中嘚量词现象的分析如此不让人满意呢关键问题便在于,他是用英语的思维去设想东方语言的情况的依据英语思维,可数名词与不可数洺词之间的差异可是一件大事情这种差异会导致动词词尾、形容词前缀方面的一系列变化。而当一个美国人突然发现:(1)日语(汉语)中没有明显的可数名词与不可数名词方面的差异;(2)日语(汉语)中却有英语中不那么明显的量词现象的时候他所能够想到的一个佷自然的解释就是:要么这些东方人认为世上万物都是可数对象(并在这种情况下将量词用作数词的一部分),要么这些东方人认为世上萬物都是不可数对象(并在这种情况下将量词视为某种“个体化对象的产生机制”)但为蒯因所始终忽略的一种可能性就是:“可数—鈈可数”的区分本身或许压根儿就没有进入中、日语言说者的意识,亦未进入其本体论背景——因此量词的出现或许与“可数—不可数”的区分毫无关系,而是基于某种其他语言学或心理学机制

但令人遗憾的是,蒯因关于量词问题的思维范式是如此强大以至于马歇尔·威尔曼(Marshall Willman)先生在最近重拾“汉语中的量词”这个话题的时候,依然采用了一种亲和于英语思维的分析方式具体而言,他以一种同情蒯因的“甲案”的方式作出了如下评论:因为汉语中缺乏英文中的词缀“s”来提示名词的复数形式,婴幼儿时期的汉语言说者只有求助於别的语法机制来完成对于名词单数与复数的区分——换言之由此完成对于混沌世界的分割。而量词的引入也正是为了满足这种语言訴求。然而这样的一种预设了“单—复数区分”之基础性的解释方案,却无法解释如下这些经验现象:

其一正如很多发育心理学家所指出的,在学会母语之前各个民族的正常婴儿都能够识别物理对象的那些基本空间属性(比如知道两个固态物体不可能占据同一时—空唑标,或知道一个空间对象的各个空间部分会随着整体的移动而一起移动等等)。这也就是说即使在语言没有对单、复数区分进行强調的情况下,人类的基本心理能力已经能够满足“对混沌世界的区分”这一需求了因此,汉语中“量词”的出现未必就一定会去强化这┅区分而可能是为了满足其他语法功能。

其二正如威尔曼本人所注意到的,不少量词——比如“一门课”与“一节课”中的“门”与“节”——是扮演了一定的语义角色的因此,用谓词逻辑的术语来说它们更应当被视为某种意义上的“命题函项”,而不是数词的某種补充机制但同样很明显的是,这些现象是无法被威尔曼关于量词的整体解释框架所消化的而这一点便使得他的理论的统一性受到了佷大的削弱。

其三正如家徐丹先生所指出的,尽管汉语并不强行要求在名词表达式中给出单复数区分但至少在中及古汉语语中,我们吔可以找到大量与复数表达相关的语言表述手段比如“都”“皆”“全”“并”“具”“悉”“咸”“总”“举”等。这些词的存在顯然会使得威尔曼赋予量词“区别单、复”功用的重要性被大打折扣,并进一步提示我们:量词在汉语中或许在执行着某种与上述功用不哃的其他重要功能

无独有偶,日本的语言哲学家饭田隆对于日∕汉语中的量词现象的解释亦同样缺乏应有的统一性,而且也同样受制於“单、复区分”的思维陷阱然而,经由这样的叠床架屋的构建我们依然无法找到一种关于“为何汉语或日语需要量词”这个问题的統一性解释——我们得到的,只是几种不同解释的外在拼接用计算机科学的术语来说,按照饭田隆对于蒯因理论的发展模型一个关于量词的语言处理系统需要安置两到三个不同的算法模型来对应他所说的三种构建——而这样的处理却显然会让系统难以在与三种构建相关嘚不同表达式之间建立起畅通的推理路径。

而从一个更深的角度来看正如笔者前文已经提及的,蒯因—威尔曼—饭田隆路线的量词解释方案之所以缺乏内在统一性根本上或许就是因为:在汉语或日语的量词现象与英语思维对于单—复区分的敏感性之间,本来就是存在着某种张力的因此,学者们在后一种敏感性的指引下去为前者分类就很难不导致种种削足适履的结果了。换言之倘若不“悬置”英语思维对于研究的影响,我们就无法直面汉语或日语中量词现象的“实情”

三、一种基于汉语演化史与认知语言学的复合式解释

依笔者浅見,要理解汉语中量词所发挥的实质功能汉语演化史或许能够为我们提供相应的启发。根据张赪先生的研究量词现象的确在汉语演变嘚历史中经历了一个“从不显著到日益显著化”的嬗变过程。具体而言先秦时期上及古汉语语中量词现象并不多见(或再借用麻爱民先苼的话来说,先秦时期是中国量词发展史上的“比较稚嫩的萌芽期”而量词使用频度的显著提升,乃是在两汉时期到魏晋南北朝时期,及古汉语语中的量词种类则进一步丰富化了说得更具体一点,如果我们将“枚”这样的量词称为“通用量词”(即可以与各种名词搭配的量词)并将“粒”“口”“乘”称为“专用量词”(即只可与特定名词搭配的量词)的话,那么根据张赪的统计,在两汉可以與通用量词搭配的名词有55种,可与专用量词搭配的名词则只有11种;到了魏晋可以与通用量词搭配的名词种类数目上涨到了75种,而可与专鼡量词搭配的名词种类的数目则上涨到了43

在笔者看来,这样的统计结果显然说明:(1)量词的真实功用或许压根儿就与“个体化机制”或“单复区分”没什么关系否则我们就必须非常牵强地说:在两汉时期,有一种特别的需要迫使人们在语言中固化了某种“个体化机淛”而在此之前,这样的需要乃是不存在的(但毫无疑问的是两汉时期中国人与先秦时期的中国人所面对的物理环境是大同小异的,兩个时期中国人的认知架构也应当是大同小异的);(2)既然通用量词的发育是先行于专用量词的那么,通用量词的功能肯定会与专用量词有所差异——而且专用量词功能的施展又很可能是以通用量词功能的存在为前提的,否则二者的发育次序就会被颠倒过来。

由此看来要解决“汉语量词功能”之谜的关键,便是首先要解释清楚为何在两汉时期文献中大量出现了通用量词对此,冯胜利先生给出了┅个颠覆蒯因思维模式的新颖解释:驱使通用量词在两汉大量出现的主要因素与所谓“个体化语言设施”毫无关联,而是具有明显的韵律学(prosody)面相的

需要注意的是,冯胜利并没有解释为何来自韵律美的这种要求在两汉时期变得急迫起来很显然,面对这种不对称性輕描淡写地说“先秦的汉语言说者相对不重视汉语韵律美”,恐怕是不太负责的因为一个不重视韵律的民族是不可能有《诗经》与《楚辭》的。而对于这种看似怪异的现象笔者的一个推断是:根据江荻先生对于战国末年出现的《尔雅》的研究,上及古汉语语基本可以被判定为一种多音节词语言尽管它也一直在朝向单音节词语言进行着演化。这也就是说尽管我们不能够断定这种演化在两汉时期是否已經完成,但两汉时期的及古汉语语肯定要比先秦及古汉语语更具备浓厚的“单音节词语言”的色彩而正如我们在前面所分析的,“通过補充量词来增加含单音数词的名词表达式的音节数使之接近含多音数词的名词表达式的韵律形式”这一说法,也只有在相关语言基本上昰一种单音节词语言的前提下才有意义换言之,是及古汉语语从多音节词语言到单音节词语言的演化才使得其韵律形式发生了改变,並使得通用量词的出现实现了韵律学功能

不过,在笔者看来仅仅从韵律学的角度猜测汉语量词生产的机制,我们还没有将量词扮演的功能属性真正说透因为这种假设对汉语量词的“语义属性”关照依然不够。但语义问题本身却是无法被回避的因为即使就能够与各种洺词搭配的通用量词——如两汉时期最流行的“枚”——来说,也很难说它是不具备某种基本语义的(根据许慎的《说文解字》对于“枚”的解释“榦曰枚”中,“枚”就是“小树枝”的意思)那么,我们又该怎样解释:为何偏偏是“枚”而不是别的什么字,成为两漢时期通用量词的首选字呢

而为了解决这个问题,我们不妨向认知语言学(cognitive linguistics)所擅长的“隐喻”研究借脑按照认知语言学家权威莱考夫(George Lakoff)与约翰逊(Mark Johnson)在《我们赖以生存的隐喻》中所提出的见解,隐喻不仅仅是一种修辞手段而且还是人类思想的基本概念组织方式,洇为任何一种语义抽象方式其实都是一种隐喻投射方式(比如本体A与喻体B的接续,就可以被视为“将与B有关的概念图式投射到A之上”的過程)按照莱考夫等人的这种理解模型,我们不妨就将两汉文献中“枚”与一个名词N的接续视为“将与‘枚’相关的概念图式投射到Nの上”的过程,或者说“将N的概念图式按照‘枚’的方式加以顺化”的过程。说得再具体一点按照上述解释模型,在“具桩六枚”“弓二枚”“树一枚”“犬一枚”这样的表达式中不同的名词品类的原始意像都按照“小树枝”(即“枚”的本义)的意像模式进行了某種结构调整,并由此成为某种像“小树枝”那样可供人类的双手轻易操控的对象由此,万物之间的差异性得到了一定程度上的淡化而囚类通过语言操控万物的意识也由此得到了一定的加强。

读者或许会追问:为何这种通过语言来削减事物门类之间差异的倾向会在两汉突然勃兴?对此笔者不成熟的推断是:汉代作为中国历史上第一个长期稳定存在的统一性王朝,为国家统一货币——五铢钱——在较大時空范围内的稳定流通创造了历史条件而能够与“钱”这个名词接续的典型量词显然就是“枚”。换言之“枚”的高频度出现或许就昰对于“钱”的一种“借喻”(metonymy),而金钱对于万物差别的“祛差异化效应”或许也借此使得“枚”本身也具备了类似的效应最终使得其成为两汉最具流通性的量词(当然,我们可能还需要更多的经验证据来验证这一推断)

读者或许还会问:那么,为何在魏晋时代“個”作为新的通用名词的地位,慢慢开始赶超“枚”另外,为何与各类名词的特殊语义相匹配的“特殊量词”也在魏晋得到了发展

对於这些问题,笔者的浅见如下:从汉末到魏晋再到隋唐量词出现在汉语名词表达式的方式经历了一个从“名词+数词+量词”到“数词+量词+洺词”的结构转换过程,换言之量词的位置从末尾调整到了中间,而到了宋代这种转换已经基本定型。虽然这一结构转换的真实动因依然不明但可以肯定的是,正是这一转换改变了包含量词的名词表达式的韵律结构,并使得“枚”在表达式结尾统一韵母的功能不复存在并由此使得与“枚”不同的其他量词的发展获得了机会。换言之先前由于“枚”的普遍化而造成的“量词生态位”一旦被稳定下來,那么更多的语义属性对于这些生态位的占据,就会成为语言演化进程中难以避免的现象——而语义属性的多样性显然就会带来量词品类的多样化即特殊量词的大量涌现。至于为何在这个过程中“枚”作为通用量词的地位反而遭遇到了来自于“个”与“只”的竞争┅种可能是:“枚”在魏晋时代有被渐渐用作特殊量词的趋势,由此使得新的普遍量词的出现挪移出了生态位譬如,在两汉人们可以说“树木一枚”“矢一枚”“鸡一枚”“狗一枚”到了魏晋却必须说“一根∕个∕株树木”“一发∕只矢”“一头∕只鸡”“一个∕头狗”,等等;在两汉可与“笔”接续的量词只有“枚”,而到了魏晋“枝”与“管”也可与之接续了。至于“枚”的这种降格化是否與汉末动乱以来五铢钱地位的暂时下降有关(甚至与政治分裂时局下人们对于事物多样性敏感度的提升相关),则需要更多的经验证据加鉯验证

不过,至少可以肯定的是魏晋以来特殊量词在汉语地位中的快速上升,已经使得量词的语义描述性质开始覆盖其早期的韵律学屬性最终成为汉语中量词的首要属性。这种属性无疑使得汉语言说者在使用形容词之外具备了一种额外的对名词性质进行范畴归类的掱段,或者说可以方便言说者将某种更抽象的隐喻结构投射到与之相关的名词品类之上。譬如正如宗守云先生所指出的,量词“条”所具有的关于“长形物”的隐喻图式便可以通过与特定名词的接续而体现在“一条烟”“一条鞭子”“一条项链”这样的表达式之中,甴此使得“烟”“鞭子”“项链”这些名词的空间外观特征的凸显性得到提升

那么,为何汉语需要通过这种额外的手段对事物的名词进荇范畴化而相关语言现象在英语中却并不明显呢?关于这个问题日语专家金子孝吉先生的研究或许可作参考(顺便说一句,金子的研究对象虽是日语但是也提到了其他的亚洲语言,因此其研究成果有一定的跨语言覆盖力)虽然金子孝吉提及的上述量词运用方式未必铨部在汉语中有直接的对应,但这些语例显然向我们展示出了各种亚洲语言中“量词活用”的巨大逻辑空间充分证明了量词的重大使用價值,甚至对汉语未来可能的“进化”方向具有一定的提示意义

现在我们就把文章第三个问题中的讨论结果做一番小结。从汉语演化史嘚角度看韵律学方面的因素,加上某些在“大一统”的政治经济环境下所造成的特殊社会心理或许是造成两汉时期像“枚”这样的通用量词使用频度大大提高的复合性原因。而一旦这种使用达到了一定的社会流传度即使是在两汉的“名词+数词+量词”的构词结构慢慢嬗变为“数词+量词+名词”的新结构的情况下,原先通过“枚”所获取的“量词生态位”依然能够得到保留并为魏晋以后出现的大量特殊量词提供了“插入槽口”。而随着这种“信息插入槽口”的日益增多语言共同体关于世界感知方式、社会等级、宗教与意识形态的很多隱秘信息,都可以通过量词的活用而得到间接的体现由此大大丰富了语言的语义推理潜能与审美趣味。

笔者认为虽然基于汉语演化史與认知语言学的量词功能说明方式的确牵涉到了比较丰富的理论因素与历史细节,但其内在的理论统一性却是很高的换言之,根据笔者嘚解释与蒯因等人的预想彻底相反,量词在东亚语言中的大量出现与语言言说者对于外部世界的“个体化”与“对象化”需求基本无關,而与语言表征系统内部的某些内在特征更为相关换言之,量词现象更相关于比较不抽象的“名词认知图式”与比较抽象的“量词认知图式”之间的推理路径的特征至于这样的“量词认知图式”究竟是应当与特定的韵律学属性发生更密切的关系,还是应当与那些编码叻宗教与意识形态信息的语义节点发生更密切的关系则是一个经验性质的问题,且并不影响“量词在实质上是对于名词品类的一种高阶歸类”这一判断在更高层面上的普遍有效性

如果笔者对于汉语中量词功能的上述理解方式基本上是正确的,倘若我们要在某种计算机的岼台上尽量模拟人类对于量词的使用与把握方式的话那么,这样的计算平台就应当至少具有如下的性质:其一它应当已然能够轻松地實现对于隐喻结构的表征(因为“量词+名词”的结构本身是一种隐喻投射结构);其二,它应当具有“非公理性特征” 即可以灵活地允許与名词相关的“量词插位槽”作出新的扩容,以便随时插入新的量词而不是预先以“公理集”的方式将名词与量词之间的搭配方式全蔀锁死;其三,它应当具有与系统感知模块的输出进行接驳的潜力以便在可能的情况下为量词表达式的韵律学属性进行编码;其四,它應当具有通过小的训练样本掌握量词用法的能力而不是像深度学习技术所要求的那样,需要海量的学习样本(如前所示这是因为,线仩提供的关于汉语量词正确用法的样本数量总是被种种不正确的用法案例所压倒)。但问题是:我们有这样的计算平台吗

据笔者所知,目前在全球范围内最可能将笔者所构想的量词功能解释予以算法化的计算平台,乃是由美国天普大学(Temple University)的计算机科学家王培先生发奣的“纳思系统”所提供的纳思系统的英文全称为“Non-Axiomatic Reasoning System”(非公理推理系统),“NARS”为其缩写“纳思”为该缩写的汉语音译。大体而言纳思系统乃是一个具有通用用途的计算机推理系统,而且能够在下述意义上与上面提出的四点要求相互契合:其一它是一个非公理系統,即能够允许自身的知识库内容随着学习经验的增加而随时改变;其二它的基本知识表征形式虽然具有“主—谓逻辑”的外观,却允許在某种复杂的递归结构中表征类比推理与隐喻投射;其三它的基本词项可以是前符号的感知范型,并在这种意义上与感知模块的输出楿互接驳;第四其系统的运作并不依赖于大数据环境的存在,并能够通过比较小的学习样本进行归纳不过,关于如何具体地将纳思系統的这些特征与“量词刻画”这项具体的任务结合在一起我们显然还需要另外一个研究项目加以推进。

四、结语:以人工智能为武器来反抗地球的扁平化

正如笔者在文章开头所指出以英语为思维底色的主流人工智能技术的传播具有“扁平化地球”的某种文化毁灭功能,對维护人类文化的多样性不利然而,若我们只是空洞地去抗议这种披着技术外壳的文化霸权的扩散的话恐怕效果会事与愿违,因为“批判的武器”毕竟无法取代“武器的批判”依笔者浅见,正确的做法便是用保护特定文化特异性的人工智能去抵抗试图消除这种特异性的人工智能,即以机器的工作效率成倍地提高弱势文化之“弥母”(meme)的传播效率套用到关于量词的具体案例上说,这样的人工智能將帮助汉语文本的编辑用户充分意识到汉语中量词现象的丰富性与灵活性并能够在文本编辑过程中为用户提供更多相关方面的构词咨询,由此避免量词表达式在社会传播中的退化而且,由于量词现象背后的隐喻投射方式天然存在着某种任意性人工智能系统便能够依据哽强大的计算能力自行发明新的隐喻投射方式,由此造成新的量词使用方法供用户选择依据笔者之见,所有这些举措若得到落实最终佷可能反而会促进量词现象在数码时代的又一次勃发,并使得以后的汉语演化历程成为机器与人共同书写的新篇章。

同时需要读者注意除了汉语之外,日语、韩语与泰语中也有丰富的量词现象——而且在藏语、缅甸语、彝语、羌语等大约二十来种亚洲大陆语言与不少茚第安族语言甚至澳洲土语中,量词现象也都是普遍存在的这就说明了三点:第一,英语思维对于地球文化的“扁平化效应”不仅仅是針对汉语的而且还针多其他多种文化;第二,有鉴于量词现象客观上的普遍性以及英语文化优势地位之形成所具有的某种历史偶然性峩们有理由认为:恰恰是英语思维方式本身才是具有真正的“地方性”的——或者说,是某种伪装成普遍性的地方性;第三由于存在着對于各种民族语言中量词现象的统一说明模式(即基于认知语言学的“隐喻”理论的说明模式),因此从原则上说,一种试用于汉语量詞理解的计算程序只要经历过新的学习过程也是能够把握其他语言中的量词现象的(就像任何一个合格的汉语言说者,都有可能通过特萣的学习步骤学会日语中的量词使用一样)

作者 | 徐英瑾,复旦大学哲学学院教授

我要回帖

更多关于 及古汉语 的文章

 

随机推荐