2004年全国术语标准化技术委员会年会在京召开
2024-05-15
来源:年旅网
维普资讯 http://www.cqvip.com ‘术语标准化与售惠技术)2005年第1期 语言信息处理・ (2)首尾字基本均衡的临界字。例如:“例、余、 是全部字都出现在术语的首字和尾字;在可以做 纸、面、导、栈、乱、子、载、解、家、用、含、似、典、焊、 临界字的汉字中,有一部分字只能出现在首字或 瓦、掉、叉、轴”等。 者只能作为尾字出现,有一部分字既可以作为首 (3)尾字为主的临界字。例如:“件、器、率、络、 字也可作为尾字出现 通过上面的分析,我们基本 址、据、的、式、缆、言、境、态’钥、议、义、户、法、则、 了解了信息技术领域术语用字的特点。 术、案”等。 但是在术语中,汉字只是进一步构词的基本 这些特点也为我们判断术语提供更多的语言 单位,从基本词的角度来看汉语术语的用词情况, 学特征。这样就能够为术语的自动提取找到一些 可能会为汉语术语的识别和自动提取提供更多的 特点。 信息。我们将进一步对全部术语进行分词,并对术 五、结论 语用词进行统计,建立术语基本词数据库,在此基 础上对术语基本词的分布特点进行进一步的分析。 从上面的统计我们看出。术语用字共有2359 参考文献 个,这说明术语用字的数量是很有限的,而且这些 f1]李芸、王强军.信息技术领域术语宇频、诃频及术语长度 汉字93%以上都包含在3500常用字中,这说明术 统计.第一届学生计算语言学研讨会论文集 语用字并没有多少非常用的生僻字。但是从和通 l2】李芸、王强军.信息技术领域术语自动提取研究,辉幢二 用领域汉字的使用次数的比较来看,术语用字和 十年——中国中文信息学会二十周年学术会议论文 通用领域汉字差别较大,表现为一些通用领域的 集.200l 常用字在术语用字中却是不常用的汉字或者在术 [3】孙宏林、黄建平、孙穗金、李镥钧、邢红兵.现代汉语研究 语用字中不出现,而术语用字中的一些使用次数 语料库系统・概进胡明扬主编《第五届国际汉语教学 很高的汉字在通用领域的使用次数却很低。因此, 讨论会论文选.北京:北京大学出版社,I997 术语用字的主要特点体现在字的使用次数的差别 [4】夏华、郭建中、林峰英汉信息技术词典北京:机槭工 业出版社,2002 上,而不是汉字本身:从术语用字的使用次数看, f51邢红兵.基于第三代晤料库的信息领域术语动态更新. 术语用字在构成术语时的使用次数也有很大差 涪言文字应用,2OOO(2) 别,有32.22%的汉字使用次数超过100砍.但也 _61邢红兵.计算机领域汉英术语的特征及其在语料分布规 有40.06%的汉字使用次数在1O次以下,只使用1 律.术语标准化与信息技术.2000(3) 次的汉字也有293个:从术语的临界字来看,并不 ・44・