公务员期刊网 论文中心 正文

小议中医药语言系统中的语义类型

小议中医药语言系统中的语义类型

1使用数量多的语义类型情况分析

1)“方剂”和“中药”类数量多的主要原因在于具体的方剂名称、中成药以及具体的单味药数量很多;2)“中医文献”位居第二,是由于系统收录了大量的古代和现代医书、医案等名称,如“《经方要义》《南阳类案》”等,均属于中医文献类;3)“医学人物”类,系统收录了古、近、现代中医医家,如“朱丹溪”“葛洪”等,这部分内容也很庞大;4)“动植物”类实际指“药用动植物”,即单味中药的原植物和原动物,如“白斑角鲨”“黄凤仙花”等,有些概念词的中药名称与原植物、动物相同,既属于“中药”也属于“动植物”,如“黄柏”“蜈蚣”等;5)“诊断的过程”这一语义类型是原来系统加工西医诊断学时设立的,目前暂时保留了这一部分数据,该部分的概念基本为西医诊断学术语;6)“疾病或证候群”这一语义类型也是系统设立初期建立的一个语义类型,其内容包括了疾病、证候和症状,系统旧数据有大量的概念标为这一语义类型,还未修改;7)“中药化学成分”类包含具体的化学成分名称,系统收集了中药涉及的化学成分名称;8)“食疗-药膳”类包含可以用作食疗和药膳的具体名称,如“安神茶”“八宝粥”等;9)“中医机构”类包含了全国所有中医药研究机构、行政机构、医院、制药企业等,如“安徽省卫生厅中医管理局”“安庆市中医医院”“安顺制药厂”等。综上所述,使用最多的10个的语义类型都属于实体类型,均有较多实例,故包含的概念较多,在语义类型的使用上属于正常现象。

2使用数量少于10个的语义类型的情况分析

具体分析语义类型使用数量少于10个的有30个,它们的使用情况分析如下。1)语义类型本身为大类,按照“能用具体类型的就不用上位类型”的语义类型归类原则,这类语义类型本身在分类中只起到分类节点的作用,而具体归类则归为其下的具体类型,如“事件”“物理实体”“中医基础理论”“中医信息文献学”“中药性能与功能”“有机体”等;2)语义类型本身定义范畴过窄,不能包含更多的概念,如“血”“血的功能”“津液功能”“精的功能”“腧穴功能”“五色”“五化”等;3)在中医药学系统里不能或者不需要作为语义类型存在的,如“归经”“针灸处方”“中药功能”“方剂功用”等;4)由于与其他语义类型定义分辨不清而归类错误或不完全的,如“针灸研究”“辅料”“中医预防”等;5)由于中医药学语义类型也是在不断修改完善过程中,有部分数据还未完全修改为目前的语义类型,如“中药药理作用”“矿物”等;6)语义类型分类过细,如“心理功能-中医心理”“神”“情志”“七情”。

3未用到的语义类型分析

中医药学语言系统现有语义类型128个,使用率为86.72%,未使用到的17个是:人工物质;中西医结合;医古文;自然物理学科;颜色;中医学与古代哲学;中西医结合疗法;制药工艺、农业;脏象学说;药用设备;思想或概念;研究设备;升降沉浮;研究活动;中药研究;师承关系;症状或体征。1)语义类型本身为上位概念,其下还有更具体的语义分类,如“思想与概念”“人工物质”“中医学与古代哲学”“制药工艺、农业”“研究活动”“中药研究”等;2)语义类型本身表示的是一种组合关系,而不是单一概念所能表达的,如“师承关系”“中西医结合”“中西医结合疗法”等;3)语义类型设置过大,过于空泛,目前中医药学语言系统未涉及其内容,如“自然物理学科”;4)语义类型设置问题,不表示一种语义分类。如“医古文”表示的是一种语言形式,每个医古文形式的字、词、句都会表示具体的语义含义;5)语义类型设置太过于狭小,仅表示特别具体的意思,如“升降沉浮”是具体指中药药性的一个方面,不应作为一个语义类型存在;6)语言系统目前收词范围的局限导致未使用到该语义类型,如“研究设备”“药用设备”等;7)语言系统数据问题,“症状或体征”是最近修改的语义类型,原有这部分数据均标为“疾病或症状群”,数据还未修改。

4小结

中医药学语言系统现有语义类型128个,使用到的有111个,使用率为86.72%。使用最多的语义类型为“方剂”,使用了33102次,占系统总数的26.86%。使用最少的为“雌雄霹雳火”“方剂功用”“经络学说”“矿物”“声音”“心理功能-中医心理”“针灸处方”等8个语义类型,使用频次均为1次。除“雌雄霹雳火”“针灸处方”为错误类型外,其他6个类型占语义类型总数的4.7%。4.7%的语义类型使用情况占系统概念总数少于0.006%。由于中医药学语言系通过的语义类型是存在等级结构的,上位语义类型都是比较大的概念,或仅作为分类而存在,所以其下归类的概念数量较少,不能仅以数值来说明整体使用情况。通过上述分析,可以得出:中医药学语言系统分类整体框架合理,但在具体下位语义类型的设置上还需调整,不能将过于具体的概念或组合概念作为语义类型。综上,中医药学语言系统的语义类型是一个动态的、逐渐完善的体系,它需要根据中医药学及中医药学语言系统的发展不断调整、修改和完善。

作者:贾李蓉 董燕 田野 杨硕 朱玲 刘丽红 高博 李敬华 单位:中国中医科学院中医药信息研究所