基于 LSTM 模型的无袖带血压测量方法研究论文

2023-07-10 11:15:15 来源: 作者:liuhong
摘要:无袖带血压测量技术拥有广泛的应用场景,其在穿戴式设备上的应用更是为关注血压的人群提供了随时随地测量血压的可能。为了使得血压测量的算法更加适应测量对象的身体情况变化,基于Tensorflow框架搭建了一种LSTM模型,建立了与测量血压的时刻、前一次测量结果以及当次PPG波形特征深度关联的血压计算模型,并使用采集的542个个体的6 931条数据进行了有效性验证。实验表明,经10折交叉验证后,测量的收缩压和舒张压均满足AAMI标准,即平均绝对误差(MAE)小于5 mmHg,标准差(SD)小于8 mmHg,收缩压
摘要:无袖带血压测量技术拥有广泛的应用场景,其在穿戴式设备上的应用更是为关注血压的人群提供了随时随地测量血压的可能。为了使得血压测量的算法更加适应测量对象的身体情况变化,基于Tensorflow框架搭建了一种LSTM模型,建立了与测量血压的时刻、前一次测量结果以及当次PPG波形特征深度关联的血压计算模型,并使用采集的542个个体的6 931条数据进行了有效性验证。实验表明,经10折交叉验证后,测量的收缩压和舒张压均满足AAMI标准,即平均绝对误差(MAE)小于5 mmHg,标准差(SD)小于8 mmHg,收缩压和舒张压的MAE分别为4.29 mmHg和2.68 mmHg,SD分别为6.12 mmHg和3.86 mmHg,得到了准确度较高的测量结果,对于提高高血压的知晓率,辅助诊断心血管疾病有着较高的应用价值。
关键词:PPG;LSTM;深度学习;交叉验证
Method on Cufffree Blood Pressure Measurement Based on LSTM Model
Jiang Zeyu1,2,Zhao Yubo2※,Zhao Jingbo1,Li Qingfu1,2
(1.School of Information and Control Engineering,Qingdao University of Technology,Qingdao,Shandong 266520,China;
2.Shandong Institute of Industrial Technology,Qingdao,Shandong 266101,China)
Abstract:Cuff free blood pressure measurement technology has a wide range of application scenarios,and its application in wearable devices provides the possibility of blood pressure measurement anytime and anywhere for people who are concerned about blood pressure.In order to make the blood pressure measurement algorithm more adaptable to the changes in the physical condition of the measured people,an LSTM model was built based on the Tensorflow framework,and a blood pressure calculation algrithm deeply related to the moment of blood pressure measuring,the previous measurement result and the feature of PPG was established.The model was validated using 6 931 pieces of data from 542 individuals.Experiments show that after 10-fold cross-validation,the systolic and diastolic blood pressure measured both meet the AAMI standard,that is,the mean absolute error(MAE)is less than 5 mmHg,the standard deviation(SD)is less than 8 mmHg,and the MAEs of systolic and diastolic blood pressure are 4.29 mmHg and 2.68 mmHg,SD were 6.12 mmHg and 3.86 mmHg,the measurement results is high accuracy,and has high application value for improving the awareness rate of hypertension and auxiliary diagnosis of cardiovascular diseases.
Key words:PPG;LSTM;deep learning;cross-validation
0引言
据世界卫生组织《柳叶刀》的《全球高血压流行趋势综合分析报告》显示[1],从1990年至2019年,30~79岁成年高血压患者人数从6.5亿人增加到12.8亿人,且呈现逐年上涨趋势。在调查东亚及东南亚人群中,对高血压的知晓率不足50%,这对于人口基数庞大且人口老龄化严重的中国,是一个亟需解决的问题。因此提高高血压的知晓率,找到一个便捷的、精准的血压测量方法变得十分重要。
血压测量方法可分为有创和无创两种方式。有创血压测量方法被誉为血压测量的金标准[2],但存在伤口感染的风险,不适用于日常血压测量。无创血压测量方法主要有张力测定法、恒定容积法、柯氏音法、示波法、脉搏波传播时间法以及脉搏波特征参数法[3]。柯氏音法和示波法的血压测量设备均使用袖带设计,长时间充放气会使被测者感到不适,而且设备携带不方便,无法实现连续血压测量。张力测定法、恒定容积法虽然可以实现连续测量,但仍需要对动脉施加一定压力,不利于长时间测量。因此,脉搏波传播时间法和脉搏波特征参数法脱颖而出,这两种血压测量方法适用于长时间的、随时随地的连续血压测量。但前者只考虑脉搏波传播速度和脉搏波传播时间来建立血压计算模型,研究表明[4],血压除了与脉搏波传播时间特征有关还与其他脉搏波特征存在很强的相关性。因此,需要考虑建立多个特征的血压计算模型来提高血压测量的准确度。脉搏波特征参数法基于光电容积描记技术(Photoplethysmography,PPG)获取人体的光电容积脉搏波,结合多个脉搏波特征参数建立血压计算模型,实现血压检测。这种方法常用于一些穿戴设备中,具有体积小、携带方便等优点。
PPG是基于朗伯·比尔定律实现的[5],被广泛应用于脉搏波传播时间法和脉搏波特征参数法。其原理是:当LED发出的绿光或红光照射到皮肤表面时,由于人体动脉血管中的血液是具有流动性的吸光物质,因此光线射到动脉时,不同时间段对光的吸收就会发生变化。经过这些吸光物质后,透射或反射出来的光线会被另一端的信号接收器接收,转化为电信号。最后按一定的频率进行采样,获得的波形为光电容积脉搏波[6],即PPG信号。
国内外对脉搏波特征参数法做了大量研究。Enric M[7]利用随机森林方法对血压进行测量,结果表明,加入PPG波形特征之外的个体信息(如年龄、体重、身高等)后在一定程度上可以提高测量的准确性。Gaurav A等[8]除了PPG波形特征外还加入了心率变异性特征,结果表明,加入心率变异性特征可以提高测量的准确性。吴绍武[9]提取了15个PPG波形特征,并结合历史血压数据使用梯度推进机(Light Gradient Boosting Machine,LightG‐BM)进行血压测量,最终的结果满足AAMI标准。上述文献虽然都加入PPG波形特征之外的个体信息来提高血压测量的准确性,但未考虑到测量血压的时间这一重要因素。研究表明[10],人体血压会随时间变化呈现勺型、非勺型、反勺型。因此测量血压的时间对血压有重大影响,可以考虑加入此特征并结合其他个体特征以及PPG波形特征进行血压测量,进一步提高血压测量的准确性。
本文使用测量血压的时间、前一次测量结果以及当次PPG波形特征进行血压测量。由于LSTM(Long-Short Term Memory,LSTM)算法对时间序列数据处理能力显著,不容易出现梯度消失和梯度爆炸的情况[11],且具有长期短期记忆能力。因此,本文使用LSTM算法建立血压计算模型,并对比不同网络结构的LSTM测量精度,找出最优的LSTM网络模型。最后,与其他血压测量方法进行对比分析。
1 LSTM的基本框架
传统RNN结构图如图1所示,其隐藏层状态计算公式如下所示:
由于计算该时刻隐藏层信息时只用到上一时刻隐藏层信息和这一时刻的输入,因此传统RNN无法实现长时记忆功能。
LSTM内部结构图如图2所示。相比传统RNN结构,LSTM内部增设了3个门,分别对信息进行遗忘和记忆。3个门分别为遗忘门、输入门和输出门[12],分别如式(2)~(4)所示。
LSTM除了比RNN增加了3个门来控制输入和输出信息之外,内部还包含了一个记忆细胞c(t),用来对之前重要的信息进行记忆[13],即长时记忆。该时刻记忆细胞的更新主要由两个阶段完成:
(1)遗忘阶段,经遗忘门后得到一组0~1的向量,0表示将无关信息全部遗忘,1表示将有用信息全部记住;
(2)短时记忆阶段,该阶段将h(t-1)和x(t)经过激活后得到一个候选细胞信息(t),输入门的作用是将(t)中有用的信息进行记忆[13]。
两个阶段保留的所有信息为该时刻记忆细胞信息,记忆细胞信息用于计算该时刻隐藏层状态h(t),h(t)再通过激活函数激活之后可以得到本时刻的输出。(t)、c(t)以及h(t)的计算公式分别为:
LSTM内部结构和原理综上所述,通过增加多个门控状态来筛选输入信息并通过不断更新记忆细胞,从而实现长期记忆。相比较传统RNN,LSTM对研究血压这种时间序列数据的优势突出。
2数据处理与特征提取
2.1数据预处理
本研究的数据是通过某公司的设备采集的,包含了542个个体的数据信息。由于在采集数据过程中会受到测量环境光线干扰、被测人员肢体抖动、传感器运动等影响,采集的PPG信号含有多种噪声[14],如高频噪声、低频噪声、无效噪声、随机噪声等。图3为一段PPG原始信号,由于受到不同频段噪声的干扰,导致该信号产生了基线漂移现象,需要进行降噪处理。降噪处理通常可以采用小波变换、傅里叶变换、中值滤波、维纳滤波等方法[15],由于小波变换可以将原始波形一些重要特征很好地保留下来[16],因此本文使用小波变换的方法去除噪声。具体步骤是:首先选用db8小波将原始PPG信号进行分解,然后将噪声所处的高频分量和低频分量置零,再设置软阈值将噪声进行滤波处理,最后进行小波重构。经小波变换处理完的PPG信号如图4所示。
2.2特征提取
本研究提取的PPG信号特征主要包括:PPG信号峰值点、PPG信号最大斜率点幅度、PPG信号峰值点相对于PPG信号起点的幅度、PPG信号最大上升沿斜率点到PPG结束点之间的面积、PPG信号重搏波相对于PPG信号起点的幅度、PPG信号起点到PPG重搏波节点之间的时间间隔与整个PPG宽度的比值、PPG信号起点到PPG信号结束点之间的时间间隔等42个特征。一个波段的PPG波形信号特征如图5所示。
2.3数据集分割
该数据集的数据总数为6 931条,除PPG信号特征外,该数据集还包含被测者的真实收缩压、真实舒张压、测量时间以及年龄等个体信息。收缩压频率分布直方图如图6所示,舒张压频率分布直方图如图7所示,年龄频率分布直方图如图8所示。该数据集收缩压和舒张压范围分别为80~184 mmHg和47~114 mmHg。年龄分布范围为25~87岁,平均年龄为64.9岁。
为了提高血压计算模型的泛化能力,本研究对542个个体的数据进行10折交叉验证,且测试集个体的数据信息不包含在训练集中。将9折数据作为训练集,1折数据作为测试集,分别进行10次模型训练,取10次结果的平均值作为最后的测量结果。
3实验设计与结果分析
由于人的血压会随测量时间变化发生不同程度的波动[10],所以将测量血压的时间作为一个重要信息加入模型进行训练。此外,历史血压数据也是一个重要特征[9]。本研究将测量血压的时刻、前一次测量结果以及当次PPG波形特征一起放入LSTM中进行模型训练,通过训练多个神经网络来确定LSTM隐藏层层数和神经元数量,找出最优的LSTM模型。
本研究对比了不同网络结构的LSTM模型,设置的隐藏层层数为1~2层。分别搭建了8组LSTM模型进行血压测量,结果均采用10折交叉验证方法取均值。不同网络结构的LSTM模型参数如表1所示。不同网络结构的LSTM模型测评结果如表2所示。不同网络结构LSTM模型SBP的MAE测评结果曲线如图9所示。不同网络结构LSTM模型SBP的SD测评结果曲线如图10所示。不同网络结构LSTM模型DBP的MAE测评结果曲线如图11所示。不同网络结构LSTM模型DBP的SD测评结果曲线如图12所示。
从10折交叉验证的结果可以得到以下结论。
(1)对于1层隐藏层的LSTM模型,随着神经元数量增加,SBP和DBP的MAE和SD总体呈现下降趋势。SBP的MAE从神经元数为16的4.586 mmHg下降到神经元数为128的4.288 mmHg,下降了0.298 mmHg;SD从神经元数为16的6.392 mmHg下降到神经元数为128的6.117 mmHg,下降了0.275 mmHg。而DBP中,神经元数为16到神经元数为32的MAE和SD几乎不发生变化。在此之后,随着神经元数量的增加,MAE和SD逐渐下降,从神经元数为32的2.770 mmHg和3.919 mmHg下降到神经元数为128的2.681 mmHg和3.857 mmHg,MAE和SD分别下降了0.089 mmHg和0.062 mmHg。
(2)对于两层隐藏层的LSTM模型,随着神经元数量的增加,SBP和DBP的MAE和SD呈现下降趋势。SBP的MAE从神经元为{16,8}的4.658 mmHg下降到神经元为{128,64}的4.303 mmHg,下降了0.355 mmHg;SD从神经元为{16,8}的6.506 mmHg到{128,64}的6.130 mmHg,下降了0.376 mmHg。DBP的MAE从神经元为{16,8}的2.945 mmHg下降到神经元为{128,64}的2.697 mmHg,下降了0.248 mmHg;SD从神经元为{16,8}的4.100 mmHg下降到神经元为{128,64}的3.865 mmHg,下降了0.235 mmHg。
对比结果发现,隐藏层数少,神经元数量多的模型表现较好。结果最优的模型的编号为4,该模型隐藏层数为1,神经元数为128,SBP和DBP的MAE和SD分别为4.288 mmHg、6.117 mmHg和2.681 mmHg、3.857 mmHg。最终选择的LSTM网络结构如图13所示。
对于编号为4的模型,取10折交叉验证中的第1折结果进行分析。收缩压计算误差频率分布直方图如图14所示。舒张压测量误差频率分布直方图如图15所示。收缩压测量值和真实值分布图如图16所示。舒张压测量值和真实值分布图如图17所示。由图14和图15可知,测量的SBP误差多数分布在-5~5 mmHg之间,最大误差分布在-25~30 mmHg之间;测量的DBP误差多数分布在-5~5 mmHg之间,最大不超过±20 mmHg。由图16和图17可知,SBP和DBP计算模型的决定系数R2分别为0.74和0.83,决定系数R2均接近1,说明LSTM模型的测量值接近真实值,尤其是在DBP测量上表现更为明显。
将本研究方法与其他深度学习方法进行对比,结果如表3所示。对比表3数据可以发现,本研究方法测量的SBP的MAE仅高于李帆等[17]使用LSTM的测量结果,且数值相差不大,而本研究方法SBP的SD、DBP的MAE以及DBP的SD均低于其他血压测量方法。相比其他方法,本研究有效利用了时间与血压的关系并结合其他与血压有关的重要特征,最终测量的SBP和DBP的MAE均小于5 mmHg,SD均小于8 mmHg,符合AAMI标准,同时获得了较高的测量精度。
4结束语
本文利用日间血压呈现勺型、非勺型或反勺型的特点,将测量血压的时刻、前一次血压数据以及当次PPG波形特征一起加入到LSTM中进行模型训练。通过对比多个血压计算方法,最终发现基于LSTM模型利用以上特征对血压进行计算可以获得较高的准确性,对于方便无扰、精准有效地预测高血压,有效降低高血压的发病率,提高高血压的知晓率有着重要意义。另外,由于高血压患者日间血压呈现非勺型、反勺型,在今后研究中可以利用这个特点,结合时间特征,先将高血压患者以及其他血压人群进行分类,再对不同人群进行血压测量,从而进一步提高血压测量的准确性。
参考文献:
[1]Müller Nurasyid M.Worldwide trends in hypertension preva‐lence and progress in treatment and control from 1990 to 2019:a pooled analysis of 1201 population-representative studies with 104 million participants[J].The Lancet,2021,398(10304):957-980.
[2]范勇,李沛尧,张楠,等.基于大样本重症监护数据库MIMIC-Ⅲ的无创和有创血压测量一致性研究[J].北京生物医学工程,2018,37(2):122.
[3]闻博.基于深度神经网络的无袖带血压建模方法研究[D].深圳:中国科学院大学(中国科学院深圳先进技术研究院),2020.
[4]Zheng Y L,Yan B P,Zhang Y T,et al.Noninvasive characteriza‐tion of vascular tone by model-based system identification in healthy and heart failure patients[J].Annals of biomedical engi‐neering,2015,43(9):2242-2252.
[5]Mosorov V.The Lambert-Beer law in time domain form and its application[J].Applied Radiation and Isotopes,2017,128:1-5.
[6]Ding X R,Zhang Y T,Liu J,et al.Continuous cuffless blood pres‐sure estimation using pulse transit time and photoplethysmogram intensity ratio[J].IEEE Transactions on Biomedical Engineering,2015,63(5):964-972.
[7]Enric M.Non-invasive estimate of blood glucose and blood pres‐sure from a photoplethysmograph by means of machine learning techniques[J].Artificial intelligence in medicine,2011,53(2):127-138.
[8]Gaurav A,Maheedhar M,Tiwari V N,et al.Cuff-less PPG based continuous blood pressure monitoring—A smartphone based ap‐proach[C]//2016 38th annual international conference of the IEEE engineering in medicine and biology society(EMBC),2016:607-610.
[9]吴绍武,续育茹.基于LightGBM的血压检测方法研究[J].生物医学工程研究,2019,38(3):312-315.
[10]高珊,张树龙,卢慧.高血压患者血压昼夜节律的影响因素研究进展[J].山东医药,2017,57(35):105-108.
[11]刘莹,杨超宇.基于多因素的LSTM瓦斯浓度预测模型[J].中国安全生产科学技术,2022,18(1):108-113.
[12]Hochreiter S,Schmidhuber J.Long short-term memory[J].Neu‐ral computation,1997,9(8):1735-1780.
[13]Luo J,Zhang Z,Fu Y,et al.Time series prediction of COVID-19 transmission in America using LSTM and XGBoost algo‐rithms[J].Results in Physics,2021(27):104462.
[14]刘丽佳.光电容积脉搏波信号采集及预处理方法研究[D].吉林:吉林大学,2020.
[15]张周,胡科,张鹏,等.基于小波变换的多路基坑尺寸检测降噪评估[J].电力大数据,2020,23(8):9-17.
[16]Baig S,Ali U,Asif H M,et al.Closed-Form BER Expression for Fourier and Wavelet Transform-Based Pulse-Shaped Data in Downlink NOMA[J].IEEE Communications Letters,2019,23(4):592-595.
[17]李帆,程云章,边俊杰,等.基于PPG信号的LSTM网络同步动脉血压预测[J].软件导刊,2020,19(8):44-48.
