(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210385546.8
(22)申请日 2022.04.13
(71)申请人 江苏省联合征信有限公司
地址 210000 江苏省南京市 建邺区江东中
路373号20层
(72)发明人 于航 钱吟霄 倪伟渊 黄乐平
茅天天 朱琨
(74)专利代理 机构 南京众联专利代理有限公司
32206
专利代理师 叶涓涓
(51)Int.Cl.
G06Q 30/00(2012.01)
G06Q 50/00(2012.01)
G06F 16/36(2019.01)
(54)发明名称
基于知识图谱识别空壳公司的方法及系统
(57)摘要
本发明公开了基于知识图谱识别空壳公司
的方法及系统, 为识别空壳企业提供了切实可行
的方案。 本发明通过企业属性, 利用知识图谱将
目标企业划入企业社区并生成社区的关联特征
指数, 基于信贷申请数据训练而成的模型对目标
企业经营 活力进行评分, 然后根据目标企业所在
社区的关联特征指数与经营活力评分推断其是
否为空壳企业, 并能够对在惠企平台申请补贴、
贷款的空壳企业进行 预警。
权利要求书2页 说明书6页 附图2页
CN 115115380 A
2022.09.27
CN 115115380 A
1.基于知识图谱识别空壳公司的方法, 其特 征在于, 包括如下步骤:
步骤一, 对企业间关系进行关联, 具体包括:
生成系统中所有企业两两之间的一级关联特征, 遍历所有一级关联特征不为0的组合,
生成每组两个企业间的二级和三级关联特征, 计算每组两个企业的关联特征之和; 关联特
征分为三类, 一级关联特征包括人员、 联系方式、 登录设备, 其中人员包括法人、 最终受益
人、 股东、 高管; 联系方式包括工商注册地址、 工商注册电话、 登录注册电话; 登录设备包括
登录IP、 MAC、 IMEI; 二级关联特征包括注册资本、 实缴资本、 注册时间、 核准时间、 企业类型、
行业类型、 经营范围、 登记机关; 三级关联特征包括一级特征和二级 特征的变更时间和变更
内容;
步骤二, 通过图谱模块度与社区划分算法划分社区, 得到最大化图谱模块度的社区划
分, 并计算每 个社区的关联 特征指数, 具体包括:
两个顶点g和h之间边的权 重为二者关联特征之和F(g,h), 即
F(g,h)=F1(g,h)+F2(g,h)+F3(g,h)
将每个社区内所有连接顶点的边的权重之和, 作为每个社区对应的内部关联特征和,
将所有社区的上述内部关联特征和之和, 作为社区网络关联特征和; 将所有连接不同社区
的两个顶点所对应的边的权重之和, 作为社区间关联特征和; 将上述社区网络关联特征和
与上述社区间关联特征和之差, 作为该图谱的模块度; 通过最大化图谱模块度的算法进行
社区划分; 完成社区划分后, 计算每个社区的关联特征指数, 用于标识每个社区企业关联关
系的强度; 每 个社区的关联 特征指数=该 社区内部关联 特征和/该社区顶点数量;
步骤三, 通过 经营活力评分模型对目标企业的经 营活力进行评分, 具体包括:
经营活力 评分模型获取目标企业的历史数据及企业所属行业的行业数据; 依据 所述的
历史数据和行业数据, 获得所述目标企业和所述行业的各维度数据在五个预设时间段内对
应的平均值, 通过所述 目标企业平均值/行业平均值确定五个预设时间段内目标企业各维
度数据在行业内的等级指标; 通过目标企业在行业内的等级在五个预设时间段内的变化,
确定企业各维度数据的趋势指标; 将目标企业的等级指标、 趋势指标以及行业类型作为特
征向量输入经 营活力评分模型, 输出 所述目标企业的经 营活力评分;
步骤四, 从预设的数据库中获取空壳样本企业的经营活力 评分以及其所在社区的关联
特征指数, 通过非线性Logistic回归拟合分类, 确 定样本中空壳企业活力评分与所在社区
关联特征指数间的拟合曲线, 获取曲线下 方的部分为空壳预警区域并进行空壳预警。
2.根据权利要求1所述的基于知识图谱识别空壳公司的方法, 其特征在于, 企业两两之
间的各级关联 特征计算方法如下:
两个工商注 册企业g,h间一级特 征关联特征通过下式计算:
其中 μ、 ρ 、 σ 为S、 C、 E下关联 特征的预设权 重;
如果两个工商注 册企业间F1不 为0, 则计算两个实体的二级关联 特征如下:
权 利 要 求 书 1/2 页
2
CN 115115380 A
2其中τ 为关联 特征A的预设权 重;
如果两个工商注 册企业间的F1不 为0, 则计算两个实体的三级关联 特征如下:
其中
和ω为关联 特征U和V的预设权 重。
3.根据权利要求1所述的基于知识图谱识别空壳公司的方法, 其特征在于, 所述步骤三
中, 经营活力评分模型基于 机器学习算法对样本企业的数据进行训练得到 。
4.根据权利要求3所述的基于知识图谱识别空壳公司的方法, 其特征在于, 所述样本企
业为贷款申请企业, 包 含已成功获得贷款的企业和申请被拒绝的企业。
5.根据权利要求3所述的基于知识图谱识别空壳公司的方法, 其特征在于, 所述历史数
据涵盖以下三个维度:
(1)企业资产类: 注册资本、 实缴资本、 专利申请、 不动产登记、 机动车登记、 及以上特征
的时间序列特 征;
(2)企业经营类: 招投标、 招聘、 荣誉资质、 工商年报的人数、 收入与净利润、 电力缴费、
社保缴费、 纳税、 信贷、 及以上 特征的时间序列特 征;
(3)政府公告类: 行政许可、 行政处罚、 经营异常移入 ‑无法联系该企业、 经营异常移入 ‑
未公示年报、 经营异常移出、 简易注销、 注销备案、 欠税公告、 及以上 特征的时间序列特 征;
所述行业数据为该 行业中的企业在以上三个维度汇总所 得。
6.根据权利要求1所述的基于知识图谱识别空壳公司的方法, 其特征在于, 所述步骤四
中, 当目标企业被划入某一个社区, 该社区关联特征指数在拟合 曲线上对应的企业活力评
分即为该社区的空壳 阈值, 当企业活力评分小于阈值时, 对目标企业进行空壳预警。
7.基于知识图谱识别空壳公司的系统, 其特征在于, 能够实现权利要求1 ‑6中任意一项
所述的基于知识图谱识别空壳公司的方法, 包括: 社区关联模块、 企业经营活力评价模块、
空壳识别预警模块; 所述社区关联模块用于根据知识图谱中的实体间关系划分社区并生成
每个社区的关联特征指数, 具体实现基于知识图谱识别空壳公司的方法中步骤一和步骤二
的内容; 所述企业经营活力评价模块用于将金融服务平台企业信贷 申请结果作为样本, 运
用机器学习 方法训练企业经营活力评分模型, 生成企业经营活力 分数, 具体实现基于知识
图谱识别空壳公司的方法中步骤三的内容; 所述空壳识别预警模块用于利用空壳样本集,
通过社区的关联特征指数及企业经营活力分数生成社区空壳阈值, 对社区内未达阈值的企
业进行空壳预警, 具体实现基于知识图谱识别空壳公司的方法中步骤四的内容。权 利 要 求 书 2/2 页
3
CN 115115380 A
3
专利 基于知识图谱识别空壳公司的方法及系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:57:51上传分享