双向型高搭配力度ngram链在语料库建设中的应用Utilization of Bi-directional Ngram Chains of High Collocatabiliy in Corpus Building
苗永
摘要(Abstract):
对搭配的研究是语言研究的焦点之一,搭配研究不仅包括两个词之间的搭配,还包括各种扩展的搭配,最常见的对搭配的扩展是搭配在频数上的扩展,通常称为词串(lexical bun-dles)。本文研究的是搭配的另外一种维度的扩展——按照搭配力度的双向扩展,称为双向型高搭配力度ngram链,即把搭配力度最强的多词序列提取出来,然后进行分析。分析发现:双向型高搭配力度ngram链中大部分序列与文本内容相关度比较高,并且结构相对完整,可以作为候选的关键词组。
关键词(KeyWords): 中国英语语料库;关键词组,;双向型高搭配力度ngram链
基金项目(Foundation): 国家社科基金项目“基于语料库的英语本土化研究及应用”(07BYY022)
作者(Author): 苗永
参考文献(References):
- [1]李文中.语料库与学习者语料库[M]//杨惠中.语料库语言学导论.上海:上海外语教育出版社,2002:69-81.
- [2]卫乃兴.语料库支持的词语搭配研究[M]//杨惠中.语料库语言学导论.上海:上海外语教育出版社,2002:82-127.
- [3]濮建忠.学习者动词行为:类联结、搭配及词块[M].郑州:河南大学出版社,2003:191-192.
- [4]桂诗春,杨惠中.中国学习者英语语料库[M].上海:上海外语教育出版社,2003:11-23.
- [5]Sinclair J.Corpus,Concordance,Collocation[M].Ox-ford:Oxford University Press,1991:109-121.
- [6]马广惠.外国语言学及应用语言学统计方法[M].西安:西北农林科技大学出版社,2003:3-56.