说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210932299.9 (22)申请日 2022.08.04 (71)申请人 上海数禾信息科技有限公司 地址 201206 上海市浦东 新区自由贸易试 验区金科路2889弄1号2层201室 (72)发明人 白帆  (74)专利代理 机构 北京市万慧达律师事务所 11111 专利代理师 康丽丽 (51)Int.Cl. G06Q 40/02(2012.01) G06N 5/02(2006.01) (54)发明名称 数据分析方法、 装置及计算机设备 (57)摘要 本发明公开了一种数据分析方法、 装置及计 算机设备, 方法包括: 基于用户关联数据构建关 联图数据, 并基于用户特征数据与所述关联图数 据建立图谱库; 基于输入项数据从所述图谱库中 获取对应的目标用户特征值; 基于所述目标用户 特征值与预设风险模型获得风险分值; 基于所述 风险分值获得用户风险等级; 根据用户关联数据 和用户特征数据构建图谱库, 既利用了图的深度 关联分析, 用户关联数据和特征数据分离又提高 图特征的计算速度, 在需要判断用户风险等级 时, 根据输入项从图谱库中获得对应的用户特征 数据, 再将用户特征数据输入预设风险模型获得 风险分值, 根据风险分值评估用户风险度, 能够 准确对用户贷款申请信息风险进行判断。 权利要求书2页 说明书9页 附图4页 CN 115409595 A 2022.11.29 CN 115409595 A 1.一种数据分析 方法, 其特 征在于, 所述方法包括: 基于用户关联数据构建关联图数据, 并基于用户特征数据与 所述关联图数据建立图谱 库; 基于输入项数据从所述图谱库中获取对应的目标用户特 征值; 基于所述目标用户特 征值与预设风险模型获得风险分值; 基于所述 风险分值获得用户风险等级。 2.根据权利要求1所述的数据分析方法, 其特征在于, 基于用户关联数据构建关联图数 据, 并基于用户特 征数据与所述关联图数据建立图谱库之前, 所述方法还 包括: 从Hive数据库中获取初始数据, 所述初始数据至少包括: 用户关联数据和用户特征数 据; 所述用户关联数据至少包括用户注册手机号、 用户UID; 所述用户特征数据至少包括用 户姓名、 用户UID、 用户设备ID、 用户IP、 用户性别、 用户年龄以及用户收入。 3.根据权利要求2所述的数据分析方法, 其特征在于, 所述用户关联数据至少包括用户 注册手机号和用户UID; 所述基于用户关联 数据构建 关联图数据包括: 以所述用户注 册手机号 为中心点、 以所述用户UID为 点的属性 值构建关联图数据。 4.根据权利要求3所述的数据分析方法, 其特征在于, 所述基于用户特征数据与所述关 联图数据建立图谱库包括: 存储所述用户特 征数据至Redis中; 存储所述关联图数据至GDB数据库; 所述图谱库包括所述Redis和所述GDB数据库。 5.根据权利要求4所述的数据分析方法, 其特征在于, 所述存储所述关联图数据至GDB 数据库包括: 从Hive数据库中调度关联图数据到OS S中以OSS文件形式进行存 储; 基于预设系统应用定时将所述OS S文件导入所述GDB数据库。 6.根据权利要求4所述的数据分析方法, 其特征在于, 所述从Hive数据库中调度关联图 数据到OS S中以OSS文件形式进行存 储包括: 基于AirFlow定时从所述Hive数据库中调度所述关联图数据到OSS中以OSS文件形式进 行存储。 7.根据权利要求6所述的数据分析 方法, 其特 征在于, 所述方法还 包括: 基于消息队列实时写入新增关联图数据。 8.根据权利要求1所述的数据分析方法, 其特征在于, 所述基于所述目标用户特征值与 预设风险模型获得风险分值之前, 所述方法还 包括: 获取历史用户数据, 所述历史用户数据至少包括用户注册信息、 用户业务数据和用户 埋点数据; 基于所述历史用户数据训练风险评估 模型获得 预设风险模型。 9.一种数据分析装置, 其特 征在于, 所述装置包括: 构建模块, 用于基于用户关联数据构建关联图数据, 并基于用户特征数据与所述关联 图数据建立图谱库; 第一获取模块, 用于基于 输入项数据从所述图谱库中获取对应的目标用户特 征值;权 利 要 求 书 1/2 页 2 CN 115409595 A 2第二获取模块, 用于基于所述目标用户特 征值与预设风险模型获得风险分值; 第三获取模块, 用于基于所述 风险分值获得用户风险等级。 10.一种计算机设备, 其特 征在于, 所述设备包括: 一个或多个处 理器; 以及与所述一个或多个处理器关联的存储器, 所述存储器用于存储程序指令,所述程 序指令在被所述 一个或多个处 理器读取 执行时, 执行如下操作: 基于用户关联数据构建关联图数据, 并基于用户特征数据与 所述关联图数据建立图谱 库; 基于输入项数据从所述图谱库中获取对应的目标用户特 征值; 基于所述目标用户特 征值与预设风险模型获得风险分值; 基于所述 风险分值获得用户风险等级。权 利 要 求 书 2/2 页 3 CN 115409595 A 3

PDF文档 专利 数据分析方法、装置及计算机设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据分析方法、装置及计算机设备 第 1 页 专利 数据分析方法、装置及计算机设备 第 2 页 专利 数据分析方法、装置及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。