一种医疗文本命名实体识别方法及系统

专利信息

专利权人:山东大学,济南兴腾信息科技有限公司

第一发明人:薛付忠

专利号:ZL202111327160.3

授权日:2024-5-10

专利类型:发明

国别:中国

专利简介

专利权人 山东大学,济南兴腾信息科技有限公司 第一发明人 薛付忠
专利号 ZL202111327160.3 授权日 2024-5-10
专利类型 发明 国别 中国
所属领域 开放许可开始日期
开放许可截止日期 单次许可期限
许可费支付方式
本发明公开了一种医疗文本命名实体识别方法及系统,所述方法包括以下步骤:获取待识别医疗文本;基于预训练的命名实体识别模型,对所述待识别医疗文本进行命名实体识别;其中,所述命名实体识别模型训练方法包括:获取已进行实体标注的医疗文本训练数据集,对每个训练数据均进行字符级编码、实体位置编码和实体类别编码;根据选定中文预训练模型,根据所述字符级编码及相应的实体位置编码和实体类别编码,训练得到所述命名实体识别模型。本发明通过改进实体位置编码和实体类别编码方法,能够快速高效的进行命名实体预测。