您当前所在位置:

探析信息处理与现代汉语轻声

2013-01-09

6.这是你的不是?

7.他们一直打冷战。

8.那两个是小王的兄弟。

9.他实在不会说那种话。

10.那个人很像大爷。

这些句子例5中的“东西”里的“西”读阴平,“东西”表示方位,指东边和西边。当“西”读轻声时,“东西”指的是物品。例6中的“不是”里的“是”读去声时,“是”为动词,“不是”表示否定。当“是”读轻声时,“不是”表示错处、过失。例7中的“冷战”中的“战”读去声时,“冷战”指他们双方之间进行的无声较量。当“战”读轻声时,表示因寒冷或害怕浑身突然发抖。例8中的“兄弟”里的“弟”读去声时,“兄弟”指的是哥哥和弟弟,当“弟”读轻声时,指的是弟弟。例9中的“实在”里的“在”读去声时,“实在”是形容词,表示很老实、本分,当“在”读轻声时,“实在”是副词,表示的确的意思。例10中的“大爷”,当“爷”读阳平时,“大爷”指的是不好好劳动、傲慢任性的男子,当“爷”读轻声时,表示是伯父或尊称年长的男子。

这些词语在句子里会有两种读法,两种理解,而且单独就一个句子而言,两种读法、两种理解都成立。我们人工阅读或说话时,要准确地理解其中的意思,只有联系上下文去理解。那么,这种现象在计算机信息处理时,就遇到了困难。在一个句子里,读原调和轻声,所表示的意思都成立,这是由于轻声的缘故构成的歧义句。这种现象给人工阅读带来了麻烦,需要再联系上下文去理解意思,当然,计算机要理解这些句子的意思就更困难了。也正如亢世勇说的“尽管信息处理专家运用了规则排歧、统计概率排歧或者两者结合起来等多种方法进行排歧,但到目前为止,还没有一种方法、一种系统能够彻底解决这个问题。”

因为,目前,计算机完成了“字处理”,在“词处理”和“句处理”的过程中,遇到的问题比较多。例如:词的切分问题,词性的标记问题,也就是说让计算机面对真实文本自动进行词的切分和词性标记。其中词的切分这一项,是字处理突破后中文信息处理所必须突破的又一个核心问题,是必须要闯过的第二道难关。从20世纪80年代以来,计算机学界和汉语言学界联手攻克词的切分这一难关,20多年来,都取得了可喜的成果,研制了一些相应的软件。到目前为止,计算机自动分词,正确率可达到90%到95%,剩下的5——10%的词的切分问题,难度也比较大。其中就包括歧义句的词的切分问题,当然也包括由于轻声引起的歧义现象。对于歧义句的理解,我们运用增加、替换词语,或联系上下文理解意思。这又涉及到“句处理”的问题。句处理的主要内容是,怎样使计算机理解自然语言(现代汉语)的句子的意思,又怎样使计算机生成符合自然语言规则的句子。由此可见,“句处理”所需要的语言知识,将是一种涉及到语音、语义、语法、语用等多方面的综合性知识。而且,“句处理”要解决的核心问题是排除歧义的问题。科学家们正在努力攻克这一难关,争取早日突破信息处理中的一大瓶颈问题。

参考文献:

[1]徐世荣:《试论北京语音的“声调音位”》,《中国语文》,1957.7。

罗常培、王 均:《普通语音学纲要》,商务印书馆,2002。

厉为民:《试论轻声和重音》,《中国语文》,1981.1。

林 焘、王理嘉:《语音学教程》,北京大学出版社,1992。

林茂灿、颜景助:《普通话轻声与轻重音》,《语言教学与研究》,1990.3。

亢世勇:《面向信息处理的现代汉语语法研究》,上海辞书出版社,2004。

威廉希尔app  语言学论文栏目