公务员期刊网 论文中心 正文

中医药术语语义类型分析

中医药术语语义类型分析

本文作者:胡雪琴、李莎莎 单位:中国中医科学院中医药信息研究所

本文对所有主题词的语义类型进行统计,对未曾加工的新词,进行语义类型的人工添加。但是,由于文献是来自临床,主题词中有很多西医的术语,例如:理化检查、手术操作、抗生素等。为了保证“腧穴”文献报道真实的语义环境,本文适当增加了一些语义类型,保证主题词至少具有一个语义类型,并且对相应的实例进行语义类型的加工,实例如表1所示。

经过对主题词的语义类型加工,得到主题词的所有语义类型,一条记录是一个主题词集合,也是一个语义类型集合,结果如表2所示。同时,也统计了TCMLS系统中所有与“腧穴”相关联的概念词的语义类型,作为系统中与“腧穴”共现的语义类型集合,如表3所示。对这两个语义类型集合进行对比,发现临床文献的语义类型集合与TCMLS加工的语义类型集合明显不同,前者注重临床,而后者则主要来源于术语词典,明显偏重在理论方面。

聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。本文使用SPSS18.0的层次聚类法,通过对语义类型集合的聚类,获得了与“腧穴”共现的几类语境。并且通过层次聚类,得到“腧穴”的共现语义类型,从而得到常见的共现语义关系。聚类得到的层次图如图1所示。

从上面图1可以看出,“腧穴”主题词集的语义类型大致聚成了4类,分别体现为:“治法语境”、“处方语境”、“辨证语境”、“空间语境”。例如,“疗法”和“针灸疗法”最先聚在了一起,这个结果说明在“腧穴”这个语境下,“疗法”和“针灸疗法”经常和“腧穴”一起共现,可以说“疗法”、“针灸疗法”、“腧穴”构成了一个语义类型的“治法语境”。同理,推理得到“腧穴”的“处方语境”、“辨证语境”、“空间语境”,从而,可以得到“腧穴”临床报道文献的一个大语境模板。

通过对语义类型共现的分析,可以得到新的语义关系,例如目前TCMLS中尚未有“腧穴”和“证候”的语义关系,通过聚类分析,得出了“腧穴”发生于“证候”情况下这一语义关系。此外,根据聚类结果,可以新增加一些语义关系,例如“共现”、“操作部位”等。

这些语义关系并非来自于术语词典,而来自于临床文献,可以说具有一定的实用价值。这个实验结果对语义类型的加工也具有提示意义。因此,从主题词集来进行语义类型的挖掘,是一个值得尝试的研究方向,有利于TCMLS的发展和应用。