一种文本信息的创新度评估方法

专利信息

专利权人:山东大学

第一发明人:郭伟

专利号:ZL201710543194.3

授权日:2019-10-15

专利类型:发明

国别:中国

所属领域:计算机

开放许可开始日期:2024-01-11

开放许可截止日期:2026-04-30

单次许可期限:三年

许可费支付方式:入门费结合提成费

专利简介

专利权人 山东大学 第一发明人 郭伟
专利号 ZL201710543194.3 授权日 2019-10-15
专利类型 发明 国别 中国
所属领域 计算机 开放许可开始日期 2024-01-11
开放许可截止日期 2026-04-30 单次许可期限 三年
许可费支付方式 入门费结合提成费

本发明公开了一种文本信息的创新度评估方法,对爬取的文本数据进行分词预处理;使用预处理数据训练LDA模型,实现以行业为主题的分类,用以把不同行业的文本进行区分,使得训练好的模型包含每个行业类别的关键词的模型文件;按照时间顺序,构建一个由预处理数据里的抽取的关键知识和技术信息组成的知识网络,并且每隔固定时间不断更新;使用按照时间排序的预处理数据,提取每一篇文献的属性信息,并构建一个文献文本结构网络,并确定各个文献的创新类型;利用训练好的LDA模型分析专利数据里面的技术和知识关键词分别属于的行业,综合文献文本结构网络的属性信息,构成多维度指标以评估创新度。