有四个汉字翻译西夏文字字不认识

以识别西夏文为例,聊聊人工智能如何帮我们认识历史
[ 亿欧导读 ]
用AI识别西夏文,主要依托的是计算机字符识别技术,它的核心技术主张是基于人工智能运算来识别文字符号的数字影像,并将其转换为对应的数字文本,达到可识别、可编辑、可转化的目的。
曾记得有一次聊天,有个朋友描述他对的印象,总结成三个词:西方的、商业的、未来的。
我当即表示你说的很好,唯一的问题是一条都没说对……
按下我们俩怎么展开斗殴暂且不提。这里希望破除的是大家对人工智能的某种固有印象。事实上,人工智能作为一种很早就发展起来的通用技术,绝不是西方的专利,也绝不仅仅能够创造商业价值。
甚至在某些机缘巧合下,人工智能能够成为我们用以认识历史、认识自身民族、认识祖先与过去的利器。
梁启超说“学术乃天下之公器”,不仅是说学术天下人共有,同时也是说学术天下共致。作为一种基础工具的人工智能,往往能够在意想不到地方发生效用。比如说今天为大家介绍的借助人工智能技术,自动识别西夏文——一个纯粹中国的人文社科领域。
虽然这项技术大多数人永远不会涉足,但这个案例的价值在于可以打破我们对AI的某些偏见。AI不只是集中在那几个领域,也不是欧美寡头的玩具,它甚至可能无处不在。
为什么要识别西夏文?其中隐含着哪些困难?
我们知道,西夏是与北宋、辽、金先后对峙的党项族国家,曾经统治河西地区超过二百年。与大众认知中不同,西夏不是个茹毛饮血的野蛮文明。他们曾经创立过惊人的文化、艺术与宗教文明,但随着1227年蒙古灭西夏,蒙元不为西夏立史,关于这个政权的记录快速消亡,李元昊立国时创立的西夏文也随之湮灭。
西夏文又名河西字、番文、唐古特文,曾在西夏王朝统辖的今宁夏、甘肃、陕西北部、内蒙古南部地区盛行了约两个世纪。但在西夏灭国后,这种参考汉字创立的奇特文字逐渐失传,最终成为了一种死文字。
直到1804年,武威大云寺发现了著名的《重修凉州护国寺感通塔碑》,西夏文才在埋藏了数百年后重现人世。从此识读西夏文开始成为了学界的重要工作。
二百年以来,出土的西夏文文献不断增多,其中大部分都被英、俄探险家带到了境外。但各国学者努力下,西夏文的基础文字识别已经完成,现阶段的工作重点是依据文字列表,去识读大量西夏文文献的具体内容,揭开西夏以及当时中原、西域各国的历史迷雾。
但在这个过程里,研究人员认读西夏文必须通过手工翻阅查找,耗费时间异常辛苦不说,由于西夏文是一种相似度极高的文字,人工识别还可能存在很大的错误率。
所以就有学者提出,利用计算机来自动识别西夏文。这种设想很好,但在具体操作中还是有巨大问题。比如西夏文结构复杂、组成字符各部分要素高度相似,并且平均笔画达到25画,计算机识别难以入手。
此外,西夏时期虽然已有印刷术,但出土文献还是以手抄本和刻版文字为主,同一个字的在不同文献上的位置不固定、整体布局会发生偏移,都给机器识别带来巨大困难。
于是有意思的事出现了,宁夏大学相关研究机构为代表的学术力量,选择了以人工智能技术解决西夏文的自动识别。
并且这个工作很早就已经开始,不断有成果涌现。从时间上看,绝不是赶这波AI热的产物。
人工智能完成西夏文自动识别
其实,用计算机技术处理西夏文很早就已经开始。
早在1996年,日本国立亚非语言文化研究所就制作了西夏文字库和排版系统。1997年中国学者李范文和日本学者中岛干起利用该排版系统合作出版了《电脑处理西夏文〈杂字〉研究》。俄罗斯应该也都有西夏文数据化和计算机处理的项目与研究成果。
而使用弹性网络、、AI算法以及来识别西夏文,则是中国领先完成的一个创举。
用AI识别西夏文,主要依托的是计算机字符识别(optical character recognition,OCR)技术,这种技术上世纪60年代就成为了人工智能研究的主要领域之一。它的核心技术主张是基于人工智能运算来识别文字符号的数字影像,并将其转换为对应的数字文本,达到可识别、可编辑、可转化的目的。
OCR技术目前在很多领域已经相当成熟,比如我们经常用到的印刷文件文字提取。在OCR识别领域,更多的应用是手写体内容的精准识别,而利用OCR识别考古文献中的非广泛使用文字却基本处于空白。
这里可以结合论文简单介绍两种AI识别西夏文的案例。
比如在《基于弹性网络的西夏文识别》当中,研究人员利用弹性网络技术,将西夏文中的笔画特征进行网格化提取。再统计像素点在每个网格内的概率分布,形成一种可读取的特征模型。最后使用文档主题模型方法对提取的特征降维处理,结合数据库对文献进行识别。
根据论文这种方法现实,这种方法平均识别率可达87.99%。
再比如《基于Mean Shift算法的西夏文字笔形识别》,Mean Shift算法,即偏移均值向量,是机器学习领域的一种基本算法。其基础理论是利用信息密度来完成聚类、图像分割、跟踪任务,可应对相似但界限模糊的图像处理应用。利用这种算法,研究人员将原始资料生成概率统计直方图,通过相似度来判断归类具体的西夏文笔形。
这里仅仅是两个具体应用案例,利用深度学习等前沿人工智能技术识别西夏文的应用还在不断发展。
文献与考古领域的人工智能应用
可能识别西夏文距离我们的日常生活还相对较远,但推广当整个人文社科领域,AI的应用可能就会从另一个角度无限贴近我们的生活。
从近处来说,AI推动学术效率,可能会影响我们的学科配置、学术训练甚至高等教育体系,从远处来看,AI推动的进一步识别历史与文献的能力,是我们窥探自身过去,了解“中国”为何是“中国”的全新工具。
在我们沉浸于未来带来的快感时,人工智能却可能在历史领域快速发挥它的价值。通过西夏文识别的例子,不难发现在文献与考古这些社科领域当中,人工智能至少可以发挥以下几种功效:
1、考古图像的识别与归档,比如基于算法的文物识别、文物数据化、考古现场数据化。
2、文献文本的识别与转码,比如原始文献的文字识别读取、文献聚类、文献数据化。
3、文献数据库的知识图谱化与机器学习应用。比如学科文献图谱化、时代文献图谱化、科研项目数据图谱化,以及基于知识图谱训练的人文社科领域智能体。这一点尤其重要,想象力也最为充沛。就像金融、翻译等领域很可能被AI替代一样,文献学与历史研究领域大部分依赖考证、校勘、资料爬梳的工作,也完全可以被AI取代。
类似的人文领域与AI跨界还有很多,有些甚至涉及哲学与伦理层面的技术与人文互搏,以后我们会陆续介绍。
也许AI就像风,当它是一场风暴的时候,家家户户都会门窗紧锁小心防护。但当它是清风徐来穿屋而过的时候,在我们不知觉间,AI就已经无孔不入了。
日,亿欧将在北京举办“”,就传统物流企业、制造企业、物流科技应用场景及实操、物流科技新畅想等议题,携行业人士一同探讨新机遇下物流科技如何更好落地及发展走向。
报名链接:
各工作岗位将被AI取代的概率
选择岗位,查看结果
制图员和摄影师
建筑造价师
计算机硬件工程师
石油工程师
采矿和地质工程师(包含安全)
电气工程师
核能工程师
景观设计师
生物医学工程师
土木工程师
航空航天工程师
化学工程师
机械工程师
制图员和摄影师
快来扫描二维码,参与话题讨论吧!
获取验证码
新用户登录后自动创建账号
登录表示你已阅读并同意
账号为用户名/邮箱的用户 选择人工找回
关联已有账户
新用户或忘记密码请选择,快捷绑定
账号为用户名/邮箱的用户 选择人工找回
获取验证码
创建关联新账户
发送验证码
获取验证码
未完成注册的用户需设置密码
如果你遇到下面的问题
我在注册/找回密码的过程中无法收到手机短信消
我先前用E-mail注册过亿欧网但是现在没有办法通过它登录,我想找回账号
其他问题导致我无法成功的登录/注册
账号密码登录
关联已有账户
曾经使用手机注册过亿欧网账户的用户
创建并关联新账户
曾用微信登录亿欧网但没有用手机注册过亿欧的用户
没有注册过亿欧网的新用户
先前使用邮箱注册亿欧网的老用户,请点击这里进入特别通道
扫描二维码,下载亿欧客户端
Android & iOS
亿欧公众号
小程序-亿欧plus(jerryyou)
(jerryyou)
(千古一见)
第三方登录:文海(西夏文字书)_百度百科
清除历史记录关闭
声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。
?西夏文字书
[wén hǎi]
(西夏文字书)
文海,西夏文字书。著者不详﹐成书约在12世纪。1909年在中国黑水城遗址(在今内蒙古额济纳旗)出土。原书有平声﹑上声﹑杂类三部分。出土为残刻本,蝴蝶装。上声部分全佚﹐平声﹑杂类有部分残缺﹐计有一百零九页﹐三千多字条。每页版口分别标有西夏字“文海平﹑“文海杂类”以及页数。每面各有七竖格﹐被注释字占满格﹐注释字较小﹐双行占一格。平声九十七韵﹐每韵中所属字以声母和介音的差别为序。同音字集为一组﹐各组间以小圆圈相间隔。无同音字者为独字。据另一部西夏文字书《文海宝韵》知上声有八十六韵。
据另一部西夏文字书《文海宝韵》知上声有八十六韵。杂类则是平、上两部分的补篇,其中又分平、上两类,每类内以声母九品音分部。每一字条注释分三部分。首以四个字分析字形构造,多采用合成法。合成时可选用一个字的上部、下部、左部、右部、中部、大部或全部。次以较多的字解释字义,常用解说字义、组成词组、同义词、反义词相注,指明类属和用途等方式。最后以反切法注音,同音字组中反切上下字标在第一个字下。体例上兼有《》和《广韵》的特点,是研究西夏语言、文字的重要。由于书中有很多关于西夏、和社会生活、文化等方面的资料,也是研究西夏社会历史的参考书。
史金波、白滨、黄振华.《文海研究》:社会科学出版社,1983年
清除历史记录关闭以识别西夏文为例 聊聊人工智能如何帮我们认识历史_网易科技
以识别西夏文为例 聊聊人工智能如何帮我们认识历史
用微信扫码二维码
分享至好友和朋友圈
本文由脑极体授权网易智能发表,并经网易智能编辑。曾记得有一次聊天,有个朋友描述他对人工智能的印象,总结成三个词:西方的、商业的、未来的。我当即表示你说的很好,唯一的问题是一条都没说对……按下我们俩怎么展开斗殴暂且不提。这里希望破除的是大家对人工智能的某种固有印象。事实上,人工智能作为一种很早就发展起来的通用技术,绝不是西方的专利,也绝不仅仅能够创造商业价值。甚至在某些机缘巧合下,人工智能能够成为我们用以认识历史、认识自身民族、认识祖先与过去的利器。梁启超说“学术乃天下之公器”,不仅是说学术天下人共有,同时也是说学术天下共致。作为一种基础工具的人工智能,往往能够在意想不到地方发生效用。比如说今天为大家介绍的借助人工智能技术,自动识别西夏文——一个纯粹中国的人文社科领域。(美感奇特的西夏文)虽然这项技术大多数人永远不会涉足,但这个案例的价值在于可以打破我们对AI的某些偏见。AI不只是集中在那几个领域,也不是欧美寡头的玩具,它甚至可能无处不在。为什么要识别西夏文?其中隐含着哪些困难?我们知道,西夏是与北宋、辽、金先后对峙的党项族国家,曾经统治河西地区超过二百年。与大众认知中不同,西夏不是个茹毛饮血的野蛮文明。他们曾经创立过惊人的文化、艺术与宗教文明,但随着1227年蒙古灭西夏,蒙元不为西夏立史,关于这个政权的记录快速消亡,李元昊立国时创立的西夏文也随之湮灭。西夏文又名河西字、番文、唐古特文,曾在西夏王朝统辖的今宁夏、甘肃、陕西北部、内蒙古南部地区盛行了约两个世纪。但在西夏灭国后,这种参考汉字创立的奇特文字逐渐失传,最终成为了一种死文字。直到1804年,武威大云寺发现了著名的《重修凉州护国寺感通塔碑》,西夏文才在埋藏了数百年后重现人世。从此识读西夏文开始成为了学界的重要工作。(《重修凉州护国寺感通塔碑》局部)二百年以来,出土的西夏文文献不断增多,其中大部分都被英、俄探险家带到了境外。但各国学者努力下,西夏文的基础文字识别已经完成,现阶段的工作重点是依据文字列表,去识读大量西夏文文献的具体内容,揭开西夏以及当时中原、西域各国的历史迷雾。但在这个过程里,研究人员认读西夏文必须通过手工翻阅查找,耗费时间异常辛苦不说,由于西夏文是一种相似度极高的文字,人工识别还可能存在很大的错误率。所以就有学者提出,利用计算机来自动识别西夏文。这种设想很好,但在具体操作中还是有巨大问题。比如西夏文结构复杂、组成字符各部分要素高度相似,并且平均笔画达到25画,计算机识别难以入手。此外,西夏时期虽然已有印刷术,但出土文献还是以手抄本和刻版文字为主,同一个字的在不同文献上的位置不固定、整体布局会发生偏移,都给机器识别带来巨大困难。于是有意思的事出现了,宁夏大学相关研究机构为代表的学术力量,选择了以人工智能技术解决西夏文的自动识别。并且这个工作很早就已经开始,不断有成果涌现。从时间上看,绝不是赶这波AI热的产物。人工智能完成西夏文自动识别其实,用计算机技术处理西夏文很早就已经开始。早在1996年,日本国立亚非语言文化研究所就制作了西夏文字库和排版系统。1997年中国学者李范文和日本学者中岛干起利用该排版系统合作出版了《电脑处理西夏文〈杂字〉研究》。俄罗斯应该也都有西夏文数据化和计算机处理的项目与研究成果。而使用弹性网络、神经网络、AI算法以及深度学习来识别西夏文,则是中国领先完成的一个创举。(纪录片《神秘的西夏》创立文字片段)用AI识别西夏文,主要依托的是计算机字符识别( optical character recognition,OCR) 技术,这种技术上世纪60年代就成为了人工智能研究的主要领域之一。它的核心技术主张是基于人工智能运算来识别文字符号的数字影像,并将其转换为对应的数字文本,达到可识别、可编辑、可转化的目的。OCR技术目前在很多领域已经相当成熟,比如我们经常用到的印刷文件文字提取。在OCR识别领域,更多的应用是手写体内容的精准识别,而利用OCR识别考古文献中的非广泛使用文字却基本处于空白。这里可以结合论文简单介绍两种AI识别西夏文的案例。比如在《基于弹性网络的西夏文识别》当中,研究人员利用弹性网络技术,将西夏文中的笔画特征进行网格化提取。再统计像素点在每个网格内的概率分布,形成一种可读取的特征模型。最后使用文档主题模型方法对提取的特征降维处理,结合数据库对文献进行识别。根据论文这种方法现实,这种方法平均识别率可达87.99 %。再比如《基于Mean Shift算法的西夏文字笔形识别》,Mean Shift算法,即偏移均值向量,是机器学习领域的一种基本算法。其基础理论是利用信息密度来完成聚类、图像分割、跟踪任务,可应对相似但界限模糊的图像处理应用。利用这种算法,研究人员将原始资料生成概率统计直方图,通过相似度来判断归类具体的西夏文笔形。(西夏文智能识别算法流程)这里仅仅是两个具体应用案例,利用深度学习等前沿人工智能技术识别西夏文的应用还在不断发展。文献与考古领域的人工智能应用可能识别西夏文距离我们的日常生活还相对较远,但推广当整个人文社科领域,AI的应用可能就会从另一个角度无限贴近我们的生活。从近处来说,AI推动学术效率,可能会影响我们的学科配置、学术训练甚至高等教育体系,从远处来看,AI推动的进一步识别历史与文献的能力,是我们窥探自身过去,了解“中国”为何是“中国”的全新工具。在我们沉浸于未来带来的快感时,人工智能却可能在历史领域快速发挥它的价值。通过西夏文识别的例子,不难发现在文献与考古这些社科领域当中,人工智能至少可以发挥以下几种功效:1、考古图像的识别与归档,比如基于算法的文物识别、文物数据化、考古现场数据化。2、文献文本的识别与转码,比如原始文献的文字识别读取、文献聚类、文献数据化。3、文献数据库的知识图谱化与机器学习应用。比如学科文献图谱化、时代文献图谱化、科研项目数据图谱化,以及基于知识图谱训练的人文社科领域智能体。这一点尤其重要,想象力也最为充沛。就像金融、翻译等领域很可能被AI替代一样,文献学与历史研究领域大部分依赖考证、校勘、资料爬梳的工作,也完全可以被AI取代。类似的人文领域与AI跨界还有很多,有些甚至涉及哲学与伦理层面的技术与人文互搏,以后我们会陆续介绍。也许AI就像风,当它是一场风暴的时候,家家户户都会门窗紧锁小心防护。但当它是清风徐来穿屋而过的时候,在我们不知觉间,AI就已经无孔不入了。本文参考:孟一飞,杨小花,张晓彪《基于Mean Shift算法的西夏文字笔形识别》
门光福,潘 晨,柳长青《基于弹性网格的西夏文字识别》马希荣,王行愚《西夏文字特征提取的研究》关注网易智能公众号(smartman163),获取人工智能行业最新报告。
本文来源:网易智能
责任编辑:丁广胜_NT1941
用微信扫码二维码
分享至好友和朋友圈
加载更多新闻
热门产品:   
:        
:         
热门影院:
阅读下一篇
用微信扫描二维码
分享至好友和朋友圈探访西夏遗留文化:国内掌握西夏文字者仅10余人_新闻中心_新浪网
探访西夏遗留文化:国内掌握西夏文字者仅10余人
四城记:千年西夏文万里觅遗踪。
  西夏文自创制之时起,就因结构复杂、笔画繁多,被宋朝人认为是“若符篆”。它又一度消失,成为沉埋于历史地层中的神秘存在物。西夏文重现于世人面前的时候,曾被认为是“天书”。无论是“天书”,还是“符篆”,都透露着人们面对西夏文时的困惑和畏难。为了厘清“天书”的秘密,记者依次走访了银川、武威、敦煌和保定等西夏文使用且留下遗迹的地方,寻访有记录西夏文字的物质遗存,从中体悟它数百年的生命历程。
  银川:西夏文成了“陌生人”
  走在银川的大街上,昔日西夏王朝的痕迹所剩无几、难以寻觅。西夏文在它诞生的地方,如今成为一个“陌生人”。
  银川,曾是西夏的首都,也是西夏文的诞生地。这里曾被称作怀远。关于李元昊的父亲李德明定都于此,有一个神秘的传说。《西夏书事》卷十记载,公元1017年,“夏六月,有龙见于温泉山(即今贺兰县暖泉以西的贺兰山),山在怀远镇北。(李)德明以为瑞,遣官祀之,于是有迁都之意。”龙现祥瑞的传说,后世学者认为是李氏为迁都称帝造势的编造。1020年,李德明迁都怀远镇,改名兴州。
  夏大庆元年(1036),正是在银川,在李元昊的命令下,野利仁荣效仿汉文,主持创制并推广使用西夏文字。1038年,李元昊正式建立西夏。西夏文的创制和推行,是李元昊自立新朝的一项重要工作。
  银川,是记者采访的第一站。银川的街巷中,昔日西夏王朝的痕迹所剩无几、难以寻觅。西夏文在它诞生的地方,如今成为一个“陌生人”。
  银川老城以回族文化为特色,沿路走去,具有伊斯兰风格的建筑和牛肉拉面馆频频入眼;主要路段的路牌上,书有汉语、英语和阿拉伯语三种文字,但是没有西夏文这种“符篆”。位于西面的新城区西夏区,情况相近。不过,记者发现了一处写有西夏文字的场所。在一家位于交叉路口的综合市场,楼外墙面上书有四个西夏文大字。旁边的多家小店牌匾上也汉夏对照地展示着店名。不过,当记者问墙面上那四个字是什么意思时,摊主全部一脸茫然地说“不知道”。记者走进综合市场,询问正在吃饭的工作人员,得到的答案也大同小异。“好几年了,不少人都过来问,我们也不知道。不过,这些字总该让人认得吧。”女营业员有些无奈地答复。
  位于银川西郊约35公里的西夏王陵蜚声中外,这里有9座帝王陵和253座陪葬墓。记者从西夏广场乘车来此,远远看到大门上镌刻着四个西夏文大字。出租车司机有点儿“显摆”地告诉记者,“这是大白高国。”后来,记者从门口的介绍标示中得知“大白高国”是西夏国的自称,而当时宋人因为西夏自称“大夏”而称其为“西夏”。
  西夏王陵风景名胜区管理处副主任、西夏博物馆馆长马升林告诉记者,西夏王陵是目前规模最大的西夏文物保护区;这里也出土了大量文物,其中包括大量西夏文的碑刻。但是,这组墓群没有逃过蒙古大军的铁蹄。当年,蒙古大军六伐西夏,一代天骄成吉思汗也因此病逝于六盘山的军营之中。西夏君臣看到大势已去被迫投降,蒙古军队在此进行有组织的大规模掘墓,造成了巨大破坏。他们有意砸破碑刻,将其中涉及西夏帝号等的部分敲碎。马升林说,“这是出于政治目的而抹去西夏国历史记忆的做法。”在王陵内的西夏博物馆,记者见到了从王陵出土的西夏文物,其中三块为铭刻有西夏文的残碑,每块上面有若干个西夏文。
  “我们很需要西夏文专家的帮助,特别是在释读文字等方面。”马升林说。
  走出博物馆,记者去探访王陵。王陵西面是贺兰山,东望黄河,依山傍河,气势不凡。经过长长的墓道,记者看到了一座圆锥形的“土丘”。这就是世人熟悉的3号陵,一般被认为是李元昊的陵寝。
  “原来就是这么一个土疙瘩,比秦始皇陵兵马俑差多了!”一位游客大表失望。来此的游客大多有这种情绪,看了一会儿后扭头就走。
  他们没有想到,就是这样一个看似平常的“土疙瘩”,景区方面大费苦心对其进行保护,还通过招标形式从甘肃的敦煌研究院引进技术,对其采取砌筑土坯、夯土填充等方法,并用化学药剂加固保护。
  夕阳里,贺兰山东面的原野如同桌面一般平旷,远处的地平线上凸现着大大小小的土丘。沐浴在余晖中的3号陵,无言地巍然矗立着。此时,遥想发生在这片土地上的沧桑往事,不禁为那个消失的王朝感到几许悲凉,也为墓主们的生前身后感慨不已。
  武威:西夏陪都“夏”味不足
  1804年,清代学者张澍辨识出了这座被封存石碑上的“奇怪”文字为西夏文,从而揭开了中国学者研究西夏文字乃至西夏学的序幕。
  离开银川,记者赶往甘肃武威。一路上土地渐渐荒凉,水成了一种稀罕的资源,沿途不少地名都跟水有关。武威古称“凉州”,为河西重镇之一,也是西夏建国的根据地。这里又是在诗歌中被反复吟咏的地方,“葡萄美酒夜光杯”的《凉州词》被收入中学语文课本。武威城楼前的广场,地面上镌刻了历代有关武威的诸多名篇。
  武威,在西夏时叫西凉州,也是西夏文物的密集出土地。记者前去拜访武酒集团西夏文化研究所所长孙寿岭。他感慨武威虽有丰富的西夏文物资源,但研究队伍却跟不上,规模仍在原地踏步,“现在宁夏那边研究者多了,这边还是几个人。”
  谈起西夏人在武威的活动,孙寿岭特别称道的是他们的活字印刷术和酿酒。当年,韩国人认为自己有铜活字,是世界上最早的活字印刷的实物证据,执意“申遗”。中国当时只有《梦溪笔谈》中关于毕N发明活字印刷的文字记载,活字字模等没有得到考古证明。此后,峰回路转的机会来自西夏的文物。一部出土于武威的西夏文佛经《维摩诘所说经》,被认定为一件泥活字印刷品。孙寿岭撰写文章论证,为了增强证据的说服力,他还用三年时间,自费按照西夏时的技术,刻版、印刷,复原出了这部佛经。
  党项族是善于学习的民族,他们印制的多部活字印刷作品,被专家认为是最早的活字印刷作品。孙寿岭找到的这部佛经就是其中之一。它们的存在捍卫了中国活字印刷术的发明权。
  记者去武威博物馆瞻仰《重修凉州护国寺感应塔碑》(以下简称“感应碑”)和其他西夏文物。1804年,清代学者张澍辨识出了这座被封存石碑上的“奇怪”文字为西夏文,从而揭开了中国学者研究西夏文字乃至西夏学的序幕。该碑刻于西夏天v民安五年(1094),碑高2.5米,宽0.9米,厚0.3米,两面刻文,一面为西夏文,一面为汉文,诸多文字仍然清晰。记者来到它的发现地――大云寺(此前名为护国寺)。寺内大殿闭锁,只是前面供桌摆着各路神仙。寺庙东面墙边有一片小碑林,立着几块石碑。不知道当年感应碑是不是也曾混在其中。
  武威也曾出现文物被毁的惨剧。当时因为农民看不懂西夏文字,部分被发现的西夏文文献曾遭到烧毁。现在此类事件不会再发生了。如今,西夏文献如果被当地人找到,很可能会被当做宝贝收藏起来待价而沽。
  敦煌:西夏文物填补敦煌学空白
  有学者评价,莫高窟北区的考古填补了敦煌在西夏时期近两百年的空白。
  敦煌是记者此行向西寻访的最后一站。“西出阳关无故人”,这里已经接近当年西夏的边陲。敦煌是丝绸之路上的重镇,更以敦煌石窟壁画和莫高窟藏经洞中的文献闻名于世。
  记者对于敦煌和西夏的了解,始于根据日本著名小说家井上靖小说改编的电影《敦煌》。不过,井上靖是采用法国汉学家伯希和的“避难说”来解释藏经洞封存的原因。在莫高窟藏经洞陈列馆的展览中,明确写着伯希和的解释“1035年西夏攻略沙洲时封存”,当代学者白滨和荣新江也持类似观点,不过时间分别为“1008年至1010年”和“1006年”,所防御的对象分别为西夏和黑韩王朝。实际上关于藏经洞的形成,在学术界有其他如“废弃说”(斯坦因等)等与之平行的解释。
  西夏统治敦煌将近两百年,这个崇尚佛教的国家,对敦煌也颇有贡献。榆林窟的第3、29窟都是典型的西夏洞窟。不过,在莫高窟缺少典型的西夏洞窟,西夏人用过的北区洞窟却极多。
  敦煌也是与中国的西夏学人有着不解之缘的地方,1964年,中国科学院民族所(今中国社会科学院民族学与人类学研究所的前身)王静如、史金波、白滨与北京大学宿白、敦煌文物研究所(今敦煌研究院的前身)的李承仙和万庚育等,以及甘肃博物馆陈炳应共同组成敦煌西夏调查工作组,由敦煌文物研究所所长常书鸿负责领导,开展莫高窟和榆林窟的西夏洞窟调查,弄清和确定两窟群中西夏时期的窟数及其分期、排年等。
  从敦煌市区穿过戈壁,远远就能看到一半是山、一半是沙的景象。莫高窟这座宝藏,令人真切感受到“绿洲”的意义。在粗犷而沉寂的沙海之中,居然有一带茂盛的树木。天蓝得清澈如洗,流水淙淙,白杨树的叶子一片橙黄。置身这样一个纯净的天地,更能体会过去僧人在此礼佛的虔诚心境。
  莫高窟北区共有石窟248个。1988年到1995年,敦煌研究院研究员彭金章前后共主持了6次北区石窟的考古发掘。根据发掘成果,出版了三大卷《敦煌莫高窟北区石窟》(敦煌研究院编,彭金章、王建军著),历来几乎被人们遗忘的北区从此揭开了神秘面纱。中山大学历史系教授姜伯勤认为,北区考古扩展了敦煌学研究的新领域。这其中就有西夏部分的贡献。有学者评价,莫高窟北区的考古填补了敦煌在西夏时期近两百年的空白。
  在考古工作者心目中,北区是一座宝库。彭金章告诉记者,莫高窟北区的观赏价值、艺术价值不高,但是学术、考古价值很高。北区出土了100件西夏文献,其中不乏世界或中国孤本。比如,《诸密咒要语》和《地藏菩萨本愿经》等均为世界孤本。巧合的是,这里还出土了《番汉合时掌中珠》半页,为国内孤本,与伯希和从第464窟盗走的那张恰为同一页,内容是有关蔬菜的。据敦煌研究院工作人员介绍,莫高窟北区出土的6件西夏文文献被列入国家珍贵古籍名录。北区还发现了28枚汉文的西夏钱币,为武威以西发现西夏钱币最多的一次,更是敦煌的第一次。汉文的天盛元宝、乾v元宝,因为与宋代钱币发现在同一个洞窟中,这表明当时两者在敦煌是通用的。
  元代时,西夏文仍在使用,被称作“河西字”。元代广福大师管主八印的西夏文大藏经流传到了敦煌,已先后三次在莫高窟发现了押捺有“僧禄广福大师管主八施大藏经于沙州文殊舍利塔寺永远流通供养”汉文施经愿文的西夏文大藏经。但前两次的发现已流失域外,只有近年的一次发现留存国内。莫高窟北区不仅出土了佛教文献,还出土了极为罕见的西夏文道教文献。
  在敦煌石窟文物保护研究陈列中心的文物库房中,记者获得特批,戴上参观文物需要的白手套后,亲身触摸西夏文物。纸质文物每件都装在大小合适的纸袋中,每一件都有编号,标明出土的石窟号和题目。外面则有一个大档案袋。工作人员小心翼翼地将文物从纸袋中取出,慢慢打开,在专业的素养之外,又带着对亲手挖掘出来的文物的悉心爱护。有的西夏文残片仅有一个字,也被仔细地保存起来。其中的《番汉合时掌中珠》、《三才杂字》等虽然并不完整,但颇有研究价值。考古工作者是用筛子细细地将纸片发掘出来的。因为这些洞窟此前积沙太多,在发掘时,他们用传送带将数百立方米的沙子运送到石窟前的大泉河中。
  推开与南区分开的铁门,在彭金章的引导下,记者来到不对公众开放的北区。藏传密教的第465窟,里面的一个供养僧人画像戴着西夏风格的帽子,有学者据此认为这个洞窟是西夏时的。而彭金章根据他的考古知识,认为按照科学判断当属最晚的一个,元代照样也可以绘制西夏时的服饰,所以断定该窟仍属元代的。
  北区石窟,多为禅窟、僧房窟、瘗窟等。记者在埋葬僧人的瘗窟看到了当年圆寂于此的僧人的白骨。一些修行窟只能猫腰进入,里面也只有粗粝的岩壁和简单的石床,没有南区那样富丽堂皇、神韵万千的壁画或者雕塑。其中编号为第464窟的,就是1908年法国汉学家伯希和盗走西夏文献和其他文种文献的洞窟。目前,该窟门口紧闭,掩藏着一段令人伤心的历史。
  通过已发现的实物材料,可以推测西夏时期敦煌佛事活动繁盛。西夏人在此修缮洞窟、印刷佛经,而且还特别重视教育。
  保定:这里的经幢静悄悄
  两座西夏文经幢默默地消受着它们的静寂。它们是西夏文在生命末期的一束余晖,代表着这种文字走向死文字的步伐。
  河北省保定市是记者寻访西夏文遗物的最后一站。保定原为直隶总督府所在地,也曾是河北的老省会,素有“京畿重地”等称谓。这里的古莲花池公园保存着1962年9月出土于保定市北郊韩庄的两座西夏文陀罗尼经幢。它们被认为是我国目前发现的有确切年代可考的最晚的西夏文字。据学者研究,其内容为《佛顶尊胜陀罗尼》。1977年,郑绍宗、王静如写出了《保定出土明代西夏文石幢》,发表于当年第1期《考古学报》。同一期的刊物,也刊登了到此调查的史金波和白滨的《明代西夏文经卷和石幢初探》。
  经过一番寻找,记者在公园东部的宸翰院找到了这两座经幢。经幢旁边的标示上写着:“两座经幢都是为死去的西夏僧人建造的坟幢,同建于明弘治十五年(1562)。一幢高2.63米,刻有1029字;另一幢高2.28米,刻有983字。它们的出土为研究我国党项族晚期的历史及其文字提供了珍贵的资料。”
  这两座经幢一高一矮,碑均为八棱形,有碑帽和碑座。碑都被人拓过,碑体呈黑色,文字清晰可见。碑上文字有“明弘治十五年”等汉文字样,所以研究者推断出其立于1562年。这两座经幢的发现,将西夏灭亡后党项人的活动及西夏文字使用的时间下限比先前向后推迟了150多年。
  公园中游者寥寥,经幢所在的宸翰院更是冷落无人。两座西夏文经幢默默地消受着它们的静寂。它们是西夏文在生命末期的一束余晖,代表着这种文字走向死文字的步伐。
  链接:“天书”重现震惊学坛
  西夏文在创制时,模仿吸收了当时的汉字,在形体上与汉字非常相似,但是结构更为复杂,撇捺明显多于汉字。对这种文字,习惯汉字的人会有种似曾相识的感觉,但是细看又都不认识。清代学者张澍的一语道出了大家的共同感觉:“乍视字皆可识,熟视无一字可识。”
  西夏文在诞生之后,受到了李元昊的大力推广。他将其定为“国书”,并且成立蕃字院等机构,在西夏国境内,西夏文得以广泛使用。西夏灭国后,在元代和明代,西夏文仍然为党项族后裔使用。元代时,还刊印了西夏文的大藏经。1962年出土于保定的经幢为目前发现最为晚近的西夏文文物之一。历史学家陈寅恪曾说,“柏林国家图书馆所藏藏文甘珠尔,据称为明万历时写本。寅恪见其上偶有西夏文字。”他认为,“明神宗之世,西夏文字书籍,其遗存于西北者,当不甚少,或尚有能通解其文字之人欤?”
  随着党项族在历史长河中融入汉、蒙古等民族,西夏文的使用越来越稀少,并且最终“人去文亡”,成为了“死文字”。但是,在数百年后,这种令人无一字可识的文字,逐渐掀开了神秘的面纱。
  西夏文字的重见天日从1804年发现于武威的《重修凉州护国寺感应塔碑》开始。而真正掀开其现代研究篇章的,则在1909年科兹洛夫发现黑水城文献之后。黑水城位于今内蒙古自治区额济纳旗。这部分文献目前被保存于俄罗斯科学院东方研究所圣彼得堡分所。此外,斯坦因与伯希和也分别从黑水城遗址和敦煌莫高窟盗掠走了珍贵的西夏文献,这些文献现保存于英国和法国。
  陈寅恪先生曾说,“一代之学术,必有其新材料与新问题,取用此材料,以研求问题,则为此时代学术之新潮流。”这句话被众多学者经常引用,西夏文学者更是对此深度信服。有一种提法,将黑水城西夏文献和殷墟甲骨、居延汉简、敦煌吐鲁番文献并称为“20世纪初中国出土文献四大发现”。(出处:中国社会科学报)
更多关于&& 的新闻

我要回帖

更多关于 西夏文字典在线查字 的文章

 

随机推荐