公务员期刊网 论文中心 正文

生物医学信号相似性分析方法

生物医学信号相似性分析方法

〔摘要〕随着医学技术不断发展,生物医学信号逐渐成为医学方面的一项重要的诊断技术。由于生物体的复杂性,生物信号还具有随机性强、信号弱、噪声强、频率范围低、周期性等特点,这导致在相似性分析时面临很多困难。该文提出了窗口斜率特征提取法,通过确定参数窗口阈值和网格高度,利用相关公式进行计算,用斜率变化规律对比相似波形。

〔关键词〕生物医学信号;相似性;度量方法;窗口斜率法

生物医学信号是由复杂的生命体发出的不稳定的自然信号,可以反映出生物体所处的状态及生命情况等,生物医学信号不同于其他信号,具有本身的特征和测试方法。通常生物信号包括心电、呼吸、脉搏等,这些信号是生物生命活动的基本属性[1]。采集生物体内的信号后,可以根据信号的特征对生物体所处状态进行分析和研究,为诊断生物体器官功能并确定治疗方法提供可靠的依据。

1生物体医学信号

生物体不同信号的波形图。几种常见的心电波形图如图2所示,可以看出不同形态的生物体反映出不同的信号特征,进而反映在波形图上。医师可以根据波形图的特征对生物体的病情加以判断,从而进行针对性治疗。计算机和智能化技术的不断发展为生物信号诊断技术提供可靠的保证。正确地划分生物信号类别是医学内的重要保证。一般来说,对波形间的相似性程度进行划分类别,再对不同类别信号加以分析,可以缩短工作量,提高工作效率和分析的准确性,这是目前生物信号研究的发展方向。

2相似性分析法

指采用某种方法来描述和分析两者之间的相似度。相似性分析通常分为两个步骤:特征提取和表示以及相似性度量。由于生物体发出的生物自然信号能够随时间的推移而发生变化,因此可以把生物信号作为时序信号中的一种。对时序数据的分析目前已广泛应用,例如气象变化情况、石油勘探情况、股票走势数据等。可以看出时序数据具有很大的复杂性和计算量,其相似性度量会很大程度影响着分析的结果。生物信号同样具有上述特性,复杂多变是生物信号波形曲线形态的主要特征,因此其相似性分析要包括以下两个方面:一是从原始生物信号中提取特征信息,进行优化组合,作为表示特征向量;二是对特征向量进行相似性度量或分类。原始数列的特征提取对降低计算量有很好的帮助,通过只保留数列的主要形态,去除次要形态和细枝末节,提高数据分析的准确性。目前,特征提取的方法有很多,研究思路也各不相同。Keogh等[2]以时间序列为基础,输出的结果形式为线性分段,这种成为线性分段算法。主要方法是将数列表示为多段线性的直线,从而减少实验数据。这种线性分段算法的优点直观明了,可进行多解析多运算,支持各类测量方法,应用广泛。生物信号作为时间序列的一种,也存在复杂表现形式,因此在分析中会面临很多困难。基线漂移和时间轴的伸缩是生物信号最主要面临的问题[3-4],选择合适的距离度量方法,能够提高相似性分析的准确性。动态时间弯曲(dynamictimewarp,DTW)可以作为一种有效的解决方法,但它的缺点是时间复杂,应用并不广泛.

3生物医学信号相似性分析的关键问题

生物信号作为时序信号的一种,具有维数高、数据量巨大、噪声干扰严重的特点。但由于人体是一个复杂的自然系统,人体信号具有时序信号所没有的一些特点。

3.1随机性强

由于人体的个体差异性很大,所表现出的生理信号也会随之产生差异,比如年龄的差异、性别的差异等。人体健康与生病的生理信号,其差异性会更大。生物医学信号具有随机性,它的特征并不平稳,随着时间发生变化,这种变化为医学中的信号处理带来较大困难。

3.2信号弱,噪声强

一般直接从人体中检测到的电信号幅值比较小。因此,在处理各种生理信号之前要应用放大器。噪声是指其他信号对所研究对象信号的干扰,研究时需要对信号去除噪声再进行研究。

3.3频率范围低

经频谱分析可知,除声音信号(如心音)频谱成分较高外,其他电生理信号的频谱一般较低。

3.4周期性

生物信号的幅值会随着时间而产生周期性的变化,如图3所示的心电波形。首先,将连续信号分为单个波形,即找到电波的最高点为分割点;然后,将连续波形分为多个单段连续的波形。若分割点选取不准确,将会对信号的判断产生影响.生物信号具有维度高、数据多等特征,在相似性分析方面存在一定的难度。由于人们大都注意特征数据的提取方法,因此希望距离度量采用更简单的方法。生物信号经过复杂的特征数据提取后,距离度量通常采用简单方法降低运算复杂程度,提高准确率。生物信号具有信号弱、噪声强、频率范围低等特点,需要采用相应方法达到降维、去噪的功能。通常提取初次特征后,剩余的信息量仍然会很大,因此需要对特征数据进行再优化,采用该方法虽然能保证较高的准确率,但优化过程复杂度过高。

4窗口斜率的特征表示方法

特征提取方法是相似性分析的重要内容,是影响分析的效率和精确性的重要保证。由于生物信号波形的相似性,我们需要关注波形中特征点的微小差异,重视波形中的细节走势变化,对波形进行分类研究。上文提到,特征提取优化过程复杂度很高,难以同时兼顾提取的效率和准确性,但因为生物信号波形具有周期性,可以将波形按照周期进行划分,波形的变化走势可以用不同阶段内的斜率表示,因此本研究提出了采用窗口斜率的特征表示方法。

4.1窗口斜率表示法

基于X、Y轴的波形图表示方法。首先将该坐标内的区域进行网格划分,网格的大小可由两个参数:阈值t和网格高度h决定。对横坐标的划分网格大小由阈值t确定,对纵坐标的划分网格大小由网格高度h确定。两个参数t和h的大小对窗口效率法分析结果影响较大,对于不同的生物信号波形应选取合适的参数进行划分。在网格划分中,首先设定两个参数,窗口阈值为t,网格高度为h。则波形的任意一个窗口的幅值可表示为(at(i-1)+1,…,ati+1)。任意一个窗口内的纵向幅值差可以通过公式(3-1)来表示。(3-1)从公式可以看出,当阈值t固定后,公式所计算的值实际就是窗口内的斜率,因此这种方法称作窗口斜率表示法。

4.2参数确定

从上述公式的计算方法我们可以看出,窗口斜率特征法的参数t对于窗口内斜率的计算有着重要的影响,参数选择过大,则无法起到精细分析的效果;参数选择过小,会导致任务量增加,网格高度一般选择0.1且不变动。图5显示了心电波形和锋电位波形的形状,进行两种心电波形分析时,采用窗口斜率法首先确定阈值和高度。通常,窗口阈值在关键波峰的1/10~1/5内选择,经过大量实验数据表明,心电波形窗口阈值为4时效果最佳,锋电位波形窗口阈值为2时效果最佳.

4.3窗口斜率法特征提取结果

窗口斜率法的实质就是将坐标内的波形图进行网格划分,对网格内的数据进行斜率计算,计算结果表现在坐标内,从而对相似的波形区分开来。生物信号具有复杂性、纬度高等特征,非常适合采用窗口斜率法进行特征提取。在特征提取过程中主要关注窗口内斜率的变化规律,即使几个波形走势非常相似,但反映在斜率变化上会有很大的不同。图6显示了3种相似的波形经过窗口斜率法计算后,结果对比差异很明显。计算前可以看到3种原始波形很难区分,但通过窗口斜率计算后,特征体现在斜率上会有很大的变化,通过这些变化可以准确判断波形类别,再进行下一步研究分析。

4.4窗口斜率法特点

窗口斜率特征提取法是基于生物信号复杂性与相似性的难点而定。对3种相似的波形采用窗口斜率法计算后,其斜率波形表现出明显的差异,因此,窗口斜率法对于生物信号波形的特征提取非常有用,其原理较为简单,计算方法方便。经窗口斜率法对序列降维计算,能够节约计算量。此外,窗口斜率法能够维持灵敏度和特异度的平衡,使其均保持在较高水平,即在避免异常波形漏检的情况下,提高了波形识别的准确率。因此,窗口斜率法可作为生物信号相似波形处理的重要手段。然而,窗口斜率法的关键点在于选择合适的阈值参数,它很大程度影响计算的准确性。寻找最优阈值是一个烦琐的工作,需要不断地迭代计算。窗口斜率法的关键点在于窗口阈值的选取,该参数对斜率计算结果影响很大,而且对不同波形时要求不尽相同。通过手动选取分类阈值,计算结果会有误差,选不到最优阈值,分类结果也得不到最优。如果阈值范围很大,会造成任务量增大,如何选择确定合适的阈值参数,对于窗口斜率法的应用具有重要影响,这也是下一步工作的主要方向。此外,未来的工作还需要一些实验结果来论证此方法的效果,通过对不同信号波的研究,确定选择最佳阈值参数的方法与理论。

[参考文献]

[1]刘海龙.生物医学信号处理[M].北京:化学工业出版社,2006.

[2]KeoghE,ChakrabartiK,PazzaniM,etal.DimensionalityReductionforFastSimilaritySearchinLargeTimeSeriesDatabases[J].KnowledgeandInformationSystems,2001,3(3):263-286.

[3]练仕榴,郑刚,牟善玲.用于心电波形分析的相似性度量策略[J].计算机工程,2011,37(9):263-265.

[4]张大克,王玉杰.随机平均欧氏距离的统计性质与分类阈值[J].天津科技大学学报,2008,23(4):85-88.

作者:刘彬 马少华 闫广宇 单位:安徽省太和县人民医院