学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 医学论文 同义词约束库在智能化编码解决方案的研究论文

同义词约束库在智能化编码解决方案的研究论文

2

2024-11-29 15:10:36    来源:    作者:liziwei

摘要:目的对病案首页疾病诊断自动化分类编码,快速完成首页疾病诊断填报及快速完成初步编码工作,提高病案首页填写的质量与工作效率。方法利用人工智能编码系统,建立同义词约束库,辅助智能编码系统提高对疾病名称和ICD-10分类编码的学习能力,完成以自然语言描述的疾病名称与ICD编码库的自动匹配和输出唯一的疾病分类名称和ICD编码。结果利用人工智能编码系统,建立同义词约束库,辅助智能编码系统快速完成病历首页初步编码工作,使初步编码匹配成功率达到95%,对特定的诊断进行人工干预可以提升疾病编码匹配成功率至97%以上。结论利

  摘要:目的对病案首页疾病诊断自动化分类编码,快速完成首页疾病诊断填报及快速完成初步编码工作,提高病案首页填写的质量与工作效率。方法利用人工智能编码系统,建立同义词约束库,辅助智能编码系统提高对疾病名称和ICD-10分类编码的学习能力,完成以自然语言描述的疾病名称与ICD编码库的自动匹配和输出唯一的疾病分类名称和ICD编码。结果利用人工智能编码系统,建立同义词约束库,辅助智能编码系统快速完成病历首页初步编码工作,使初步编码匹配成功率达到95%,对特定的诊断进行人工干预可以提升疾病编码匹配成功率至97%以上。结论利用人工智能编码系统,实现首页填写与出院记录填写一致,快速完成初步编码工作,同时减轻编码员的工作负担,为疾病诊断的智能化编码探索一条可行的路径。

  关键词:同义词约束库;疾病诊断;智能编码

  0引言

  由于编码工作具有一定的复杂性和专业性,临床医生根据习惯书写疾病诊断,同一种疾病各专科书写要求不同,复杂的疾病诊断难以标准化,因为ICD-10不是标准疾病名称,同时受限于编码员的编码技术水平等因素,疾病诊断分类结果往往无法统一。因此,如何快速完成首页初步编码及提高编码准确率,解决临床医师在病案首页中疾病诊断填报的问题,提高首页填报质量,是本课题研究的方向。

  1疾病编码存在的问题

  以某院病历首页疾病编码现状为例,首先由临床医师在病历首页上逐项填写疾病名称,方法是在编码字典库中选择一个诊断,带出相应的ICD编码,由于选择的诊断不一定是临床描述的疾病名称,为了完善相关的疾病名称,须在诊断名称的前缀或后缀添加该疾病的其他描述,以完成首页疾病初步编码工作。例如,编码疾病诊断名称为“左下肢胫骨粉碎性骨折”,在编码库中选择“胫骨骨折”S82.202,为了明确骨折的部位和程度,需要在疾病名称加上前后缀以完善疾病诊断名称,即(左下肢粉碎性)胫骨骨折。这种模式不仅耗费临床医师大量的工作时间和精力,而且未能达到与出院记录中的疾病名称描述一致的原则,同时延长病案归档时间。

  2资料与方法

  2.1研究资料

  在某院的病案信息统计系统中,2017年之后的诊断基本上是标准库的诊断,为了能真实地反映使用自然语言进行描述的疾病诊断,导出2016年6月至8月出院病人的所有疾病诊断,剔除需要进行人工干预的诊断,即产科描述孕周孕产次的诊断,恶性肿瘤病人治疗方式为Z51和Z08编码的诊断,余下提取的疾病诊断是临床医师使用自然语言描述的疾病诊断,基本上符合本次研究的实验要求。提取的出院诊断包括:2016年6月出院诊断共9648条,2016年7月出院诊断共10072条,2016年8月出院诊断共10392条。将疾病诊断分页导入智能编码系统中,由系统对导入的疾病诊断名称自动匹配相应的ICD编码。

  2.2研究路径

  在疾病智能编码系统的基础上,建立ICD编码标注库,同时建立同义词约束库,导入智能编码系统进行识别、学习。最终达到的效果是,随意输入自然描述的疾病名称,系统输出唯一的ICD编码和相应的ICD编码名称(如图1)。

image.png

  2.3实验一

  实验内容:①是否完全匹配国家编码库的诊断;②在添加标注库和同义词约束库后,系统经训练学习后能匹配地诊断。

  实验结果:2016年6月出院诊断共9648条,能完全匹配国家编码库的诊断有3531条诊断,完全匹配的正确率为36.6%,智能编码系统经训练后,能匹配的诊断提高至有9115条,出院诊断编码正确率为94.5%,不能匹配的诊断有533条,出院诊断编码错误率为5.5%;2016年7月出院诊断共10072条,能完全匹配国家编码库的诊断有3870条诊断,完全匹配的正确率为38.4%,智能编码系统经训练后,能匹配的诊断提高至有9488条,出院诊断编码正确率为94.2%,不能匹配的诊断有584条,出院诊断编码错误率为5.8%;2016年8月出院诊断共10392条,能完全匹配国家编码库的诊断有4002条诊断,完全匹配的正确率为38.5%,智能编码系统经训练后,能匹配的诊断提高至9878条,出院诊断编码正确率为95.1%,不能匹配的诊断有514条,出院诊断编码错误率为4.9%。本次实验智能编码识别正确率达到94%~95%,达到预期目标。实验结果见表1。

image.png

  2.4实验二

  由临床医师在首页填写时对特定的诊断进行人工干预,特定诊断是指产科描述孕周孕产次的诊断,恶性肿瘤病人治疗方式为Z51和Z08编码的诊断,这些诊断在首页填写时,由临床医师对其进行人工干预。

  例如:该产妇孕1产1,38+3周LOA,无并发症,头位顺产,医师对诊断进行人工干预,诊断填写为孕1产1,38+3周LOA头位顺产,系统自动匹配至ICD编码O80.000头位顺产;该产妇孕1产1,38+3周LOA,有并发症,做了急症剖宫产分娩,医师对诊断进行人工干预,诊断填写为孕1产1,38+3周LOA经急症剖宫产,系统自动匹配至ICD编码O82.100经急症剖宫产术的分娩;对于这种诊断编码只要在智能编码系统中预训练学习,就能100%的正确。恶性肿瘤病人治疗方式为Z51的诊断,采用同义词约束库设定同义词和约束条件,同义词分别为恶性肿瘤和癌,约束词为术后放疗,术后化疗等,系统只要识别该诊断有同义词“恶性肿瘤”和“癌”约束词术后放疗,术后化疗等,就能直接匹配到ICD编码Z51。例如:诊断为横结肠癌(Dukes C期)术后化疗,系统只要识别该诊断有“癌”和“术后化疗”就能直接匹配到ICD编码Z51.102术后恶性肿瘤化学治疗;诊断为鼻咽恶性肿瘤3期术后放疗,系统只要识别该诊断有“恶性肿瘤”和“术后放疗”就能直接匹配到ICD编码Z51.002恶性肿瘤术后放射治疗。利用同义词约束库辅助智能编码系统,恶性肿瘤病人治疗方式为Z51的诊断,编码同样可以达到100%的正确率。

  利用同义词约束库进行人工干预,既符合首页诊断填写与出院诊断相一致的原则,又能快速编码并提高编码的正确率。据粗略统计,对特定的诊断进行人工干预可以提升编码匹配成功率至97%以上,随着智能机器的学习,疾病编码匹配的正确率还有上升的空间。

  3讨论

  3.1国内智能化编码现状

  临床医师是住院病案首页的填写责任人,而编码员负责住院病案首页的质量控制。同时DRGs数据提取、数值的高低与临床医师准确填写病案首页息息相关。广东省从2021年1月启用《疾病分类与代码国家临床版2.0》,该版本在原有的ICD-10标准库中增加了1万多条临床疾病诊断名称和对应的ICD-10疾病编码,这种现有的解决方案是把常见的临床疾病诊断加入编码库中,由医生根据疾病诊断结果直接勾选最合适的ICD分类名称,系统直接匹配到对应的ICD编码,初步完成编码工作。由于疾病名称既能反映疾病的内在本质或外在表现的某些特点,又具有唯一性。疾病分类是根据疾病的某些特征,按照一定的规则把疾病分门别类。国际疾病分类不是疾病命名的标准,而是分类的国际标准。因此,疾病分类名称与临床诊断名称存在一定的差异,为了减少这种差异性,临床医师在选定的ICD分类名称加上前备注或后备注,使ICD分类名称转变为完整的临床疾病诊断名称。提交病历后,再由编码员核对病历记录,对医生编码结果进行全面审核和修改。该模式耗费医生大量的时间,且疾病名称往往与出院记录不一致。

  3.2智能化编码思路

  本次研究采用的系统注目于医疗领域ICD代码的自动分类问题,应用自然语言处理技术,基于字面相似的文本相似度计算,将医生的自然语言诊断描述自动转换为ICD编码以及其对应的标准诊断名称,通过比对医生的自然语言诊断以及标准编码库中的诊断,从中找出最相似的标准诊断以及编码作为自动转换结果。本系统包含一个自然语言的特征提取器以及一个分类器,特征提取器使用了当前前沿的预训练模型作为基础,大幅降低训练模型所需要的时间以及人力成本,分类器则根据特征提取器给出的特征,从标准诊断库中寻找一个最合适的诊断作为自动转换结果,预训练模式就是借助国家编码库和建立的ICD编码标注库,对编码系统进行训练,从而实现真正的人工智能编码。很大程度上减少了临床医师对每份病历首页中的疾病诊断在国家临床版2.0编码库的重复选择,减少了在疾病名称添加前缀后缀的工作量。

  3.3同义约束库的定义

  《中国临床疾病诊断规范术语集》在撰写的过程中对于术语的中英文名称进行了规范,确保诊断用词的规范性和一致性,如在术语集中将“粘膜”统一成“黏膜”。参照《术语集》,将同义词定义为:(A)指语义相似或相近的词组;(B)指在ICD-10第一卷类目表中归类于同一类目下的词组,语义可互换;(C)指在编码库中,归类于同一解剖部位的词组。将约束词定义为:对某一同义词实施条件限定的词组或语句。由同义词和约束词组成的词库,用于约束疾病诊断名称在编码的定位,称为同义词约束库。同义词约束库的定位是辅助人工智能识别系统提高ICD编码的正确率。

  3.4同义词约束库助力智能化编码

  中文的疾病诊断用自然语言描述时,同样存在较多同义不同词的情况。本研究设想在不改变疾病诊断名称书写模式,以国家临床版2.0编码库为基准,核对ICD-10国际统计分类第一卷类目表中类目和亚目中包含的疾病描述,加上日常收集的对疾病进行描述的习惯用语,建立同义词约束库,辅助智能编码系统,使单一疾病诊断的编码准确率提升到97%以上。将人工选择疾病诊断和疾病编码变为智能化选择,医师在首页填报疾病诊断,编码系统直接匹配相应的ICD分类编码,将初步编码的工作变烦琐为简单,实现首页填写与出院记录填写一致,减少临床医师填写首页时间和降低工作量,增加临床医师初步编码的正确率,逐步减少病案人员编码的环节,让病案人员将工作的重心由编码转为信息审核。

  综上所述,本研究是探讨如何利用自然语言处理和机器人工智能学习的技术,以疾病国际统计分类为轴心,以国家临床版2.0编码库为基准,核对ICD-10卷一类目表,建立同义词约束库,辅助编码系统自动匹配疾病诊断与ICD编码,使临床医师在填报病案首页疾病诊断时,只要输入临床疾病诊断名称,智能编码系统能自动匹配并输出唯一的相对应的ICD分类编码,使首页出院诊断与出院记录相一致,快速完成首页初步分类编码工作,降低医疗资源的损耗,减轻编码员的工作负担和后期的审核工作量,同时为医疗单位在病历首页的疾病诊断的智能化编码探索一条可行的路径。

       参考文献:

  [1]刘爱民.医院管理学病案管理分册[M].北京:人民卫生出版社,2012:208.

  [2]俞宏彬.医院病案管理质量现状及影响因素分析[D].福州:福建医科大学,2016.

  [3]肖江琴,孟佳琳,李冬梅,等.边疆地区临床医师与编码员对疾病诊断相关分组知识的认知现状[J].中国病案,2021,22(2):5-8.

  [4]张忻怡,谢明.临床常用疾病诊断编码库的构建与思考[J].中国卫生质量管理,2020(1):67-69.

  [5]王丽,曾跃萍,昆瑜,等.做好疾病诊断名称与疾病分类编码对照提升病案首页质量[J].中国病案,2019,20(4):11-13.

  [6]杨兴宇,王贺男,于丽华,等.《中国临床疾病诊断规范术语集》的临床应用与实践[J].中国卫生经济,2021(4):27-29.

  [7]刘新奎,杨林鹏.疾病诊断相关分组(DRGs)在我国的发展与应用[J].中华医学图书情报杂志,2018,27(8):48-51.

  [8]韩煦,孙利华.国际疾病诊断相关分组(DRG)研究:进展与趋势——基于Citespace和VOSviewer的文献计量分析[J].沈阳药科大学学报,2020,37(12):1125-1132.