专利名称:基于分类模型的字段抽取方法、装置、电子设备及
介质
专利类型:发明专利发明人:刘玉,徐国强,邱寒申请号:CN202010368052.X申请日:20200430公开号:CN111639487A公开日:20200908
摘要:本发明涉及人工智能,提供一种基于分类模型的字段抽取方法、装置、电子设备及介质。该方法能够当接收到公共字段抽取请求时,提取多篇文本并进行预处理,整合预处理后的文本,得到文本片段,依次从配置区间中选取目标值,并以目标值为提取长度从文本片段中提取词组,计算词组的凝固度,并将凝固度大于第一阈值的词组确定为第一词组,计算第一词组在文本片段中的频数,并将频数大于第二阈值的第一词组确定为第二词组,获取第二词组在文本片段中的上下文信息,将第二词组、第二词组的频数及上下文信息输入至分类模型中,得到输出结果,当输出结果为公共字段时,分析第二词组,得到分析结果。本发明还涉及区块链技术,分析结果存储于区块链中。
申请人:深圳壹账通智能科技有限公司
地址:518052 广东省深圳市前海深港合作区前湾一路1号A栋201室
国籍:CN
代理机构:深圳市赛恩倍吉知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容