本发明涉及医疗服务,具体涉及一种互联网智能医疗问诊系统。
背景技术:
2、问诊系统通过自然语言处理、机器学习等技术自动分析患者输入的症状描述,提供初步的诊断建议,并智能匹配合适的科室,从而优化患者的就医体验。患者在问诊系统中描述或上传自身的主诉即患者情况,系统将患者的主诉与医院数据库中的病历进行对比,将与患者的主诉相似度较高的病历所属门诊科室推荐给患者,以提高患者的就诊效率。
3、在分析患者的主诉与病历之间相似度时,由于患者的主诉可能存在信息模糊且疾病的特征表现存在一定相似性,可能导致不同科室的病历与患者的主诉之间的相似度较高,降低对患者就诊科室推荐的准确率,影响患者的就诊体验。
技术实现思路
1、为了解决因病情多样性和患者主诉描述不清晰导致与患者匹配程度较高的科室数量较多,导致对患者就诊科室推荐准确率较低的技术问题,本发明的目的在于提供一种互联网智能医疗问诊系统,所采用的技术方案具体如下:
2、本发明提出了一种互联网智能医疗问诊系统,所述系统包括:
3、数据采集模块,用于获取患者的主诉、若干个病历与引导问题;所述病历有对应科室;
4、科室隶属分析模块,用于根据同一科室的病历与患者的主诉之间的相似度,确定患者对每个科室的初始的隶属度;由所有引导问题构成初始的引导集合;当患者对不同科室的隶属度之间的差异不满足待选条件时,根据引导集合中引导问题分别与患者的主诉之间的相似度和每个引导问题的特殊性,从引导集合中选取优选引导问题,之后对引导集合进行更新;获取患者对优选引导问题的回复文本,根据所述回复文本与同一科室的病历之间的相似度,对患者对每个科室的隶属度进行更新,直至患者对每个科室的更新后的隶属度满足待选条件;
5、就诊科室推荐模块,用于根据满足待选条件时的患者对每个科室的隶属度,对患者的就诊科室进行推荐。
6、进一步地,所述根据同一科室的病历与患者的主诉之间的相似度,确定患者对每个科室的初始的隶属度,包括:
7、获取患者的主诉与每个病历之间的文本相似指标;
8、将每个科室的所有病历分别与患者的主诉之间的所述文本相似指标中的最大值,作为患者对每个科室的初始的隶属度。
9、进一步地,所述获取患者的主诉与每个病历之间的文本相似指标,包括:
10、将所有病历与患者的主诉记为分析文本,对分析文本分词后转换词向量,由分析文本的所有词向量构成词向量集合;
11、从患者的主诉的词向量集合中任选一个词向量记为目标词向量,获取目标词向量分别与每个病历的词向量集合中每个词向量的向量相似指标,按照预设顺序遍历每个病历的词向量集合中的词向量,直至向量相似指标大于预设相似阈值时停止遍历,将停止遍历时的向量相似指标作为目标词向量与每个病历的局部相似指标;
12、若目标词向量分别与每个病历的词向量集合中所有词向量的向量相似指标均小于或者等于预设相似阈值,则将目标词向量与每个病历的词向量集合中所有词向量的向量相似指标中的最大值作为目标词向量与每个病历的局部相似指标;
13、将患者的主诉的词向量集合中所有词向量与每个病历的所述局部相似指标的均值,作为患者的主诉与每个病历之间的文本相似指标。
14、进一步地,所述待选条件,包括:
15、将患者对所有科室的隶属度中最大的两个值之间的差值绝对值进行归一化处理,得到科室划分清晰指标;
16、所述待选条件为:所述科室划分清晰指标大于预设清晰阈值,或者患者对每个科室的隶属度的更新次数等于预设数量阈值。
17、进一步地,所述根据引导集合中引导问题分别与患者的主诉之间的相似度和每个引导问题的特殊性,从引导集合中选取优选引导问题,包括:
18、从引导集合中任选一个引导问题记为分析问题,从分析问题的所述词向量集合中任选一个词向量记为引导词向量,根据引导词向量与引导集合中除分析问题外的其余引导问题的词向量集合中词向量之间的相似度,获取引导词向量的局部特殊指标;
19、将引导词向量分别与患者的主诉的所述词向量集合中所有词向量的所述向量相似指标中的最大值,记为引导词向量的问题主诉相似指标;
20、根据所述问题主诉相似指标与所述局部特殊指标,获取引导词向量的局部判断指标;将分析问题的所述词向量集合中所有词向量的所述局部判断指标的累加和,作为分析问题的筛选判断指标;
21、将引导集合中所有引导问题的所述筛选判断指标的最大值对应的引导问题作为优选引导问题。
22、进一步地,所述获取引导词向量的局部特殊指标,包括:
23、由引导集合中除分析问题外的其余引导问题的词向量集合中所有词向量构成引导词向量的对照引导集合;
24、将引导词向量分别与所述对照引导集合中所有词向量的所述向量相似指标中的最大值,作为引导词向量的第一相似指标;
25、获取引导词向量分别与所述对照引导集合中所有词向量的所述向量相似指标的均值,记为引导词向量的第二相似指标;
27、进一步地,所述根据所述回复文本与同一科室的病历之间的相似度,对患者对每个科室的隶属度进行更新,包括:
28、获取优选引导问题的回复文本与每个病历之间的所述文本相似指标;
29、将每个科室的所有病历分别与优选引导问题的回复文本之间的所述文本相似指标中的最大值,作为患者对每个科室的更新后的隶属度。
30、进一步地,所述对引导集合进行更新,包括:
31、将删除优选引导问题后的引导集合作为更新后的引导集合。
32、进一步地,所述向量相似指标为两个词向量之间的余弦相似度。