您的当前位置:首页正文

一种基于神经网络的智能病案文字识别的方法[发明专利]

2020-01-24 来源:年旅网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 110633754 A(43)申请公布日 2019.12.31

(21)申请号 201910888334.X(22)申请日 2019.09.19

(71)申请人 颐保医疗科技(上海)有限公司

地址 200131 上海市浦东新区中国(上海)

自由贸易试验区希雅路55号6层610室(72)发明人 徐登友 董艺航 许慧 (51)Int.Cl.

G06K 9/62(2006.01)G06N 3/04(2006.01)G06N 3/08(2006.01)

权利要求书1页 说明书3页 附图1页

CN 110633754 A(54)发明名称

一种基于神经网络的智能病案文字识别的方法

(57)摘要

本发明提供了一种基于神经网络的智能病案文字识别的方法,本发明通过新设计的卷积神经网络模块和双层双向神经网络的结合,新的卷及神经网络模块能加深神经网络的深度,将卷积后的特征图进行双层双向神经网络的处理,充分考虑到图片每一切片之间的联系,随着神经网络深度的加深,不会产生梯度消失的问题,还能更好的提取特征,使得本识别算法在通用文本及病案文本的识别准确率上显著提高,特别是比现有的OCR识别病案的准确率高,准确度达到98.3%,其次,本发明的算法数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力,再有,本发明的数据集是通过真实病案数据制作的数据集,能够有效的消除背景的影响。

CN 110633754 A

权 利 要 求 书

1/1页

1.一种基于神经网络的智能病案文字识别的方法,其特征在于,包括以下步骤:S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;

S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;

S3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模块中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;

S4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;S5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。

2.根据权利要求1所述的一种基于神经网络的智能病案文字识别的方法,其特征在于,在步骤S1中,每张病案训练数据长宽相同并包含10个文字。

3.根据权利要求1所述的一种基于神经网络的智能病案文字识别的方法,其特征在于,在步骤S3中,所述特征图的35个切片为35个字或字符的数量。

4.根据权利要求1所述的一种基于神经网络的智能病案文字识别的方法,其特征在于,在步骤S4中,文本识别模型采用CTC作为损失函数,采用Adam梯度下降优化器进行模型的反向传播,调整神经网络模型参数。

2

CN 110633754 A

说 明 书

一种基于神经网络的智能病案文字识别的方法

1/3页

技术领域

[0001]本发明涉及医疗病案管理领域,特别是一种基于神经网络的智能病案文字识别的方法。

背景技术

[0002]按规范记录病人疾病表现和诊断情况的档案,由医疗机构的病案管理部门按照相关规定保存。不仅有纸质的,还有电子文档、医学影像、检查胶片、病理切片等保存形式。[0003]对于纸质保存的数据,我们需要通过技术手段将里面的数据提取出来通过电子文档的形式保存,用于统计分析和科研任务。对于纸质病案数据的提取,需要用到OCR技术,先对病案进行文字检测,再对检测到的文本行进行文字识别。[0004]目前,文字识别技术在病案识别上的缺陷有:1、通用文字识别仅仅只包含常用字的识别,病案中存在很多专业医学词汇。2、通用文字识别方法容易受到病案文本行数据背景的干扰,表现不佳。3、除了数据集包含文字较少外,通用文字识别方法准确率普遍没有达到95%。。发明内容

[0005]本发明的目的在于克服现有技术的不足,提供一种基于神经网络的智能病案文字识别的方法,以解决上述技术背景中所提出的问题。[0006]本发明的目的是通过以下技术方案来实现的:

一种基于神经网络的智能病案文字识别的方法,其方法包括以下步骤:S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;

S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;

S3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模型中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;

S4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;S5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。[0007]进一步的,在步骤S1中,每张病案训练数据长宽相同并包含10个文字。[0008]进一步的,在步骤S3中,所述特征图的35个切片为35个字或字符的数量。[0009]进一步的,在步骤S4中,文本识别模型采用CTC作为损失函数,采用Adam梯度下降优化器进行模型的反向传播,调整神经网络模型参数。[0010]本发明的有益效果是:

3

CN 110633754 A

说 明 书

2/3页

(1)本发明数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力;(2)本发明由真实病案数据制作的数据集,能够有效的消除背景的影响;(3)本发明通过新设计的卷积神经网络模块和双层双向神经网络的结合,使得本发明在通用文本及病案文本的识别准确率上显著提高,特别是比现有的OCR识别病案的准确率高,准确度达到98.3%。附图说明

[0011]图1为本发明卷积神经网络模块示意图;

图2为本发明文本识别模型示意图。

具体实施方式

[0012]以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。[0013]实施例:

一种基于神经网络的智能病案文字识别的方法,其方法包括以下步骤:S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;

S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;

S3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模型中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;

S4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;S5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。[0014]进一步的,在步骤S1中,每张病案训练数据长宽相同并包含10个文字。[0015]进一步的,在步骤S3中,所述特征图的35个切片为35个字或字符的数量。[0016]进一步的,在步骤S4中,文本识别模型采用CTC作为损失函数,采用Adam梯度下降优化器进行模型的反向传播,调整神经网络模型参数。

[0017]本发明通过新设计的卷积神经网络模块和双层双向神经网络的结合,新的卷及神经网络模块能加深神经网络的深度,将卷积后的特征图进行双层双向神经网络的处理,充分考虑到图片每一切片之间的联系,随着神经网络深度的加深,不会产生梯度消失的问题,还能更好的提取特征,使得本识别算法在通用文本及病案文本的识别准确率上显著提高,特别是比现有的OCR识别病案的准确率高,准确度达到98.3%,其次,本发明的算法数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力,最后,本发明的数据集是通

4

CN 110633754 A

说 明 书

3/3页

过真实病案数据制作的数据集,能够有效的消除背景的影响。[0018]以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

5

CN 110633754 A

说 明 书 附 图

1/1页

图1

图2

6

因篇幅问题不能全部显示,请点此查看更多更全内容