汉语依存树库中方位词的计量考察
runsly
03-11 17:09
0

高松 钱隆

摘  要:方位词是现代汉语中的一个特殊词类,关于方位词的研究大多基于定性分析展开。利用汉语依存树库资源,对方位词的分类和范围、语法功能、词性归属等问题进行计量分析,可以验证和补充现有的研究结论。根据方位词的使用频率,区分出核心方位词和非核心方位词。考察方位词的语法功能分布,总结方位词的语法特点。并通过对比方位词与其他词类的语法特征,来阐述方位词的词性归属。这将有利于更加深入地认识方位词,量化信息丰富了以往单纯依靠定性分析的研究,也可以为现代汉语自动句法分析提供参考。

关键词:方位词;语法特征;依存树库;计量

方位词是汉语中的一个特殊词类,目前已取得丰富的研究成果。关于方位词的分类和范围、语法特征、词性归属等问题,学者们进行了深入的讨论,这些研究大多是基于定性分析展开的,有关方位词的计量研究相对较少。随着语料库语言学的发展,语料库研究方法受到越来越多的关注。经过句法标注的语料库,称作“树库”。利用带有标注信息的语料库进行语言研究,提取语言数据,大大方便了语言研究者[1]。近些年来,树库用来获取句法知识和评价句法分析结果,成为了句法分析器[2](P103-127)。在树库标注体系中,依存語法标注已经成为主流标注体系之一,依存语法可以很好地处理汉语句子中词与词之间的复杂关系。依存树库通过建立词语之间的联系来描述句法的结构,它以依存关系为基础。依存关系是一种有向的非对称关系,由支配词、从属词和依存关系标记三个部分组成。句子中的每个词都必须有一个支配词[3](P98-99)。这里不妨以“那本书在桌子上”为例加以说明,其依存句法结构可如图1所示:

在图1中,带有箭头弧的起点是支配词,弧的终点为从属词,弧上的标记为依存关系标记。在“那本书在桌子上”这个句子中,动词“在”是句子的核心;“在”分别支配名词“书”和方位词“上”,它们的依存关系标记为“subj”和“obj”,分别表示主语和宾语。

本文所使用的树库是中国传媒大学应用语言学研究所树库建设团队建立的汉语依存树库Institute of Applied Linguistics-Communication University of China Chinese Dependency Treebank(简称“IAL-CUC CDT”)。该树库中共有3600个句子,98236个词次。利用中国传媒大学国家语言资源监测与研究有声媒体中心的在线分词标注系统(CUCBst),对文本进行了自动分词和词性标注。按照现代汉语依存关系句法标注体系,进行了句法标注[4]。标注结果经过人工和机器校对,以确保标注结果的准确性。本文利用汉语依存树库对方位词进行计量分析,尝试在树库中统计方位词的范围,考察方位词的语法功能,明确方位词的词性归属,从定量分析的角度对已有研究结论进行验证和补充。

一、方位词的分类和范围

关于方位词的分类和范围,学者们已经得出了一些共识性结论。通常认为,方位词分为单纯方位词和合成方位词两类。单纯方位词包括“东、南、西、北、上、下、前、后、左、右、里、外、内、中”等[5]—[8]。

关于合成方位词的范围,尚存在一些争议。黄伯荣、廖序东认为,合成方位词只包含单纯方位词前加“以”“之”这两种情况[5](P10)。邵敬敏指出,除了前加“以”“之”外,单纯方位词后加“边”“面”“头”也是合成方位词[7](P174)。金昌吉认为,除了前加“以”“之”外,“前后”“左右”这种对举类的也是合成方位词[9]。吕叔湘则认为,“跟前”“底下”“中间”“当中”也属于合成方位词[10](P14)。各家争议的主要原因,是在于对方位词语法特点的认识不一致。金昌吉认为,方位词附着在其他词后面构成方位短语时,中间不能插入其他词语[9]。邵敬敏则认为,中间可以插入其他词语[7](P174-175)。

划分词类的主要依据是词的语法功能[11](P38),具有相同语法功能的词应归为一类。因此,我们以语法功能为标准来确定方位词的范围,并根据方位词的使用频率区分出核心方位词和非核心方位词。方位词的语法功能,是指方位词作支配词,支配其他词而形成“方位结构补语”fc这种依存关系。笔者对树库中的“方位结构补语”进行了统计,共有3562个。为了便于统计分析,我们将一些“方位结构补语”的支配词进行了合并。“当中”“中间”“面前”“底下”“边上”等合并为其他类;“内外”“前后”“上下”等合并为对举类。具体情况如表1所示:

从表1可以看出,在单纯方位词方面,“上”“中”“里”出现的频次较高,是最为常用的单纯方位词,可以看作是核心方位词。除此之外,“前”“后”“内”“下”“外”“间”等也是单纯方位词。这跟已有的研究结论一致。同时,我们还在树库里发现,“边”也属于单纯方位词,如“耳边”“马路边”等,这一点学者们较少提到。通常认为的单纯方位词“东”“南”“西”“北”“左”“右”,在树库中均未单独出现,都是以前加、后加或对举形式构成合成方位词。在合成方位词方面,单纯方位词前加“以”“之”是最为常见的合成方位词,其中,“之~”的出现频次占比为8.59%,“以~”的占比为8.37%。因此,可以将单纯方位词前加“以”“之”构成的词看作是核心方位词。除“以”“之”外,单纯方位词后加“边”“面”“头”,单纯方位词对举及单纯方位词与其他语素或词结合,也能构成合成方位词。此外,在依存树库中,“部”“方”“侧”前加单纯方位词也能构成合成方位词,如“机关内部”“屏幕下方”“场地左侧”等,这也是已往研究较少关注的。

二、方位词的语法特点

在依存树库中,我们统计了方位词为支配词时,它与从属词所形成的支配关系,包括支配关系标记、各种支配关系出现的频次、每种支配关系占所有支配关系的比例以及在树库中的例句,其中,双下划线的词是支配词,单下划线的词是从属词。具体如表2所示:

在依存树库中,我们也统计了方位词作从属词时,支配词支配方位词所形成的从属关系,包括从属关系标记、各种从属关系出现的频次、每种从属关系占所有从属关系的比例以及在树库中的例句,其中,双下划线的词是支配词,单下划线的词是从属词。具体如表3所示:

关于方位词的语法特点,此前学者多有论及。丁声树等认为,方位词单用作主语,限于前后并列的句法。复合方位词修饰名词的时候,一般要带“的”;放在名词后头、受名词修饰时,一般不带“的”字[12](P78-79)。邹韶华认为,方位词差不多都能用在所有的物质名词之后,一部分方位词能用在时间名词之后,用在抽象名词之后表示引申意义的方位词很少;方位词可位于动名词后面,一般不能位于形容词后面;方位词可用在数词后,表示顺序;重叠的量词后面能加方位词;代词后面能加方位词,但很少能加单音节的方位词;只有表示最高级意味的副词可以修饰方位词;介词后面能加方位词,组成介词结构;连词可以用在几个方位词之间,起连接作用,不能放在单一的方位词后面;方位词不能用在助词和叹词后面[13]。林祥楣指出,方位词经常修饰动词,部分方位词能受“最”“尽”的修饰[14](P214)。杨润陆、周一民指出,方位词不能或不常受数量词组的修饰[15](P234)。吕冀平指出,方位词附在名词后边,或者同别的方位词结合成一个表示時间或处所的名词[16](P79)。方绪军认为,方位词与所附着的词语之间不能插入“的”,方位词只有在对举的格式里,才可以作主、宾语[17](P141-142)。张谊生认为,多数的方位短语都可充当介词宾语,以组成介词词组。单纯方位词在特定条件下可以充当句法成分;用在一些表位移的动词前面,可以充当状语;用在一些表方向的介词后面,可以充当介词宾语[18](P302)。刘叔新指出,方位词不能受名量短语修饰,大部分都能受“最”修饰[19](P142)。张斌指出,方位词一般只能附在名词或名词性短语的后面,组成方位短语。有时方位词也可以单独充当句法成分[20](P291)。

在依存树库中,“主要指建筑里的各种排水”等句子证明,方位词一般不单独使用,需要附在名词或名词性短语的后面,组成方位短语充当句法成分。在“他做事真是前怕狼后怕虎”“前轮过线,后轮还在线内”等句子中,存在方位短语作主语、定语和方位词对举的情况。我们发现,复合方位词修饰名词可以不带“的”,特别是名词前还有别的修饰词时。如“在我们前边这个场馆,它是国家体育馆。”“他后面那句话真让我伤心。”在这两个句子中,名词“场馆”“话”前面受“这个”“那句”修饰,复合方位词“前边”“后面”在修饰名词“场馆”“话”时,就没有带“的”字。当复合方位词放在名词后面时,一般不带“的”,如“机油前面的黏度只是代表它的使用地区”,复合方位词放在名词“机油”后头,不带“的”字。此外,多数方位短语都可以充当介词的宾语,组成介词短语,我们发现很多方位短语作介词宾语的句子,如“你们不是从这上面走过来的吗?”等。单纯方位词也大量地用在介词后面,作介词宾语,如“她在场内一直喊着向前向前”。此外,单纯方位词还可以作状语,如“在一个红绿灯路口,我强行左拐了”中,单纯方位词“左”作动词“拐”的状语。

我们再来看方位词与其他词语的结合能力。方位词能用在普通名词和部分时间名词后面,如“她思想上已经有准备了”“你务必八点前到”等;方位词可用在动词后面,如“抑肽酶注射液临床上主要用于心脏手术的患者。”其中,方位词“上”位于动词“临床”的后面,此处“临床”具有名词的特点和意义。邹韶华认为,方位词不能位于形容词后面[13],而树库中有很多“形容词 方位词‘中、之中’”格式的句子,如“这些年是如何在孤独中挣扎的。”“他从痛苦之中走出来了。”方位词可用在数词后,如“全国75%以上的城镇就业岗位都是由中小企业提供的。”“我四十之前都没意识到这个问题。”这里的方位词“以上”“之前”分别位于数词“75%”“四十”的后面。同时,量词后面都可以带方位词,树库里有很多名量词(如“达到30度以上”)、动量词(如“每周跑两次以上”)、时量词(如“10分钟左右”)带方位词的句子。代词中,人称代词和指示代词后面都可以加方位词,如“他们之间的距离越来越近。”“这以前都白费了。”树库中没有疑问代词后面带方位词的用例。个别副词“最、再”等可以修饰方位词,如“我在最上面一排。”“那时真是左得不能再左了”。此外,树库中有大量的介词后面带方位词的用法,如“就朝东边走就能找到”等;还有连词用在几个方位词之间的例证,如“东和西两边的房子比北方差一些,叫作厢房”等。

三、方位词的词性归属

关于方位词的词性归属,目前学界尚未达成共识。多数学者认为方位词应归入名词,是名词下的一个次类,如黄伯荣和廖序东[5](P10)、胡裕树[8](P285)、刘月华等[21](P50)。对此,也有学者持不同观点。朱德熙、邢公畹均认为,方位词应该单列一类[11]、[22]。钱乃荣认为方位词是介词[23](P182)。刘丹青认为方位词是框式介词中的后置词[24]。金昌吉认为方位词只能算作是黏着“后置词”,部分方位词只能称得上是构词语素[9]。方经民则将方位成分由实到虚划分为四类:方位名词、方向词、方位区别词和方位词[25]。

基于依存树库中方位词的统计,我们认为,方位词不是黏附语素。虽然方位词经常附在名词或名词性短语的后面,组成方位短语,但是方位词可以独立充当句法成分。从表3可以看出,当方位词为从属词时,可以作状语、定语、宾语、主语等。

同时,我们也不认为方位词是介词或框式介词中的后置词。在表3中,方位词作为从属词时,由介词支配的比例为34.93%,方位词与介词之间具有语法关系,一般来讲,介词是不和另一个介词产生语法关系的。此外,方位词作定语、宾语、主语等句法功能,也是介词所不具备的。因此,不能简单地将方位词看作介词。在语言信息处理领域,肖丹等曾在依存句法标注实践中引入框式介词的标注方式,将介词与方位词之间的词当作核心,由该词分别支配前后的介词和方位词,并把方位词当作介词处理[26]。这种标注方式存在一些问题。在介宾结构中,介词是核心,介词后的补足语受介词支配。在方位短语中,方位词是核心,方位词前的补足语受方位词支配。李亚非曾从形式语法的角度解释了方位词与介词的关系。从格语法角度来看,方位词不能在句中赋格,而介词在句子中最主要的功能就是给其他词赋格。因此,方位词并不是介词或框式介词中的后置词[27]。

此外,根据依存树库中的统计,当方位词为支配词时,最主要的语法功能就是作方位短语中心词,支配其他名词或名词短语;当方位词为从属词时,最主要的语法功能是在句中作介词的宾语或状语,少部分可以作“的”字结构补足语或定语。可见,方位词的语法功能与名词的语法功能具有较大差异。在依据语法功能确定词性归属的原则下,如果把方位词看作是名词下的一个附类就有些说不通了。

综上所述,我们认为方位词比较特殊,语法功能与其他词类存在较大差异,应在实词中将方位词单列一类。

基于汉语依存树库,我们对现代汉语方位词的分类和范围、语法特点、词性归属等进行了定量分析。首先,在方位词的分类和范围方面,区分出核心方位词和非核心方位词。其次,通过统计方位词作支配词、从属词所形成的依存关系,归纳出方位词的语法特点。再次,根据方位词语法功能与其他词类的对比,明确方位词的词性归属,指出在实词中方位词应单列一类。从定量分析的角度,我们对已有的研究结论进行了验证,对学者们未论及的问题进行了补充。这不仅有助于使方位词的本体研究更加深入,而且可以为现代汉语自动句法分析和对外汉语教学提供有益的参考。

参考文献:

[1]卫乃兴.语料库语言学的方法论及相关理念[J].外语研究,2009,(5).

[2]Abeillé,A.Treebanks:Building and Using Parsed Corpora[M].Dordrecht:Kluwer,2003.

[3]刘海涛.依存语法的理论与实践[M].北京:科学出版社, 2009.

[4]Liu,H. & Huang W.A Chinese Dependency Syntax for Treebanking[A].Proceedings of The 20th Pacific Asia Conference on Language,Information and Computation[C].Beijing:Tsinghua University Press,2006.

[5]黄伯荣,廖序东.现代汉语(增订六版)[M].北京:高等教育出版社,2017.

[6]兰宾汉,邢向东.现代汉语[M].北京:中华书局,2006.

[7]邵敬敏.现代汉语通论(第二版)[M].上海:上海教育出版社,2007.

[8]胡裕树.现代汉语(重订本)[M].上海:上海教育出版社,1995.

[9]金昌吉.方位词的语法功能及其语义分析[J].内蒙古民族师院学报(哲学社会科学版),1994,(3).

[10]吕叔湘.现代汉语八百词(增订本)[M].北京:商务印书馆,1999.

[11]朱德熙.语法讲义[M].北京:商务印书馆,1982.

[12]丁声树,等.现代汉语语法讲话[M].北京:商务印书馆,1961.

[13]邹韶华.现代汉语方位词的语法功能[J].中国语文, 1984,(3).

[14]林祥楣.现代汉语[M].北京:语文出版社,1991.

[15]杨润陆,周一民.现代汉语[M].北京:北京师范大学出版社,1995.

[16]吕冀平.汉语语法基础[M].北京:商务印书馆,2000.

[17]方绪军.现代汉语实词[M].上海:华东师范大学出版社,2000.

[18]张谊生.现代汉语虚词[M].上海:华东师范大学出版社,2000.

[19]刘叔新.现代汉语理论教程[M].北京:高等教育出版社,2002.

[20]张斌.新编现代汉语(第二版)[M].上海:复旦大学出版社,2008.

[21]刘月华,潘文娱,故韡.实用现代汉语语法[M].北京:外语教学与研究出版社,1983.

[22]邢公畹.现代汉语教程[M].天津:南开大学出版社, 1994.

[23]钱乃荣.现代汉语(修订本)[M].南京:江苏教育出版社,2001.

[24]刘丹青.汉语中的框式介词[J].当代语言学,2002,(4).

[25]方经民.现代汉语方位成分的分化和语法化[J].世界汉语教学,2004,(2).

[26]肖丹,楊尔弘,张明慧,陆天荧,杨麟儿.汉语中介语的依存句法标注规范及标注实践[J].中文信息学报, 2020,(11).

[27]李亚非.汉语方位词的词性及其理论意义[J].中国语文,2009,(2).

A Quantitative Study of Localizers in the Chinese Dependency Treebank

Gao Song,Qian Long

(School of Chinese Studies, Dalian University of Foreign Languages, Dalian 116044, China)

Abstract:Localizers are a special category of words in modern Chinese. At present, most of the studies on localizers are based on qualitative analysis. In order to verify and supplement the findings of existing studies, we used the resources of the Chinese Dependency Treebank to conduct a quantitative analysis of the object range, syntactic function and lexical categorization of the localizers. A distinction was made between core and non-core localizers according to their frequency of use. The syntactic function distribution of the localizers is examined and the grammatical features of the localizers are summarised. Finally, the lexical categorization of localizers is proposed by comparing the grammatical features of localizers with those of other word classes. The study provides a deeper understanding of localizers, and the quantitative information enriches previous studies that relied solely on qualitative analysis, as well as providing a reference for automatic syntactic analysis of modern Chinese.

Key words:localizers;syntax;dependency treebank;quantitative study

标签: 方位词 计量

相关内容

热门资讯

全国政协十三届五次会议在京开幕 全国政协十三届五次会议在京开幕 习近平李克强栗战书王沪宁赵乐际韩正王岐山到会祝贺 汪洋作政协常委...
1.35万亿元!中国烟草创下利... 1.35万亿!虽然处在疫情之年,但是中国烟草还是在2021年刷新了税利纪录。3月6日,2021年烟草...
理想汽车:2021年第四季度净... 2021年第四季度的车辆毛利率2为22.3%,而2020年第四季度为17.1%,2021年第三季度为...
新泰天气预报03月04日 新泰天气预报30天 今日天气:新泰市,晴,0℃~18℃,西风1级,当前温度8℃。 2022年03...
考验践行良法善治的知识产权“维... 某CMS发函广大网站主侵权,并要求高额付费的事情,近期闹得沸沸扬扬。被大家诟病的是其一直对外宣传免...
一周国内本土确诊553例,涉3... 人民日报健康客户端根据国家卫健委通报的新冠疫情情况梳理发现,2月25日至3月3日,31个省市(含兵团...
最大12级!华北大部出现7级以... 截至4日下午14时,内蒙古中东部、北京、天津、陕西、河北西部、山东、辽宁西部等地出现7-8级以上大风...
最晚不会晚于2025年,中国一... 据中国新闻网微博3月3日消息,全国政协常委、北京大学新结构经济学研究院院长林毅夫接受采访表示,中国距...
胡锡进:军费占GDP的比例太低... 今年中国国防预算增长7.1%,高于去年的6.8%,另外明显高于今年GDP增长5.5%左右的目标。但老...