(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211025116.1
(22)申请日 2022.08.25
(71)申请人 安徽工业大学
地址 243032 安徽省马鞍山市湖东中路59
号
申请人 合肥综合 性国家科 学中心人工智能
研究院 (安徽省人工智能实验室)
(72)发明人 王修君 郭昌 郑啸 张福南
(74)专利代理 机构 南京九致知识产权代理事务
所(普通合伙) 32307
专利代理师 严巧巧
(51)Int.Cl.
G06F 16/2455(2019.01)
(54)发明名称
一种基于差分隐私的数据动态发布方法及
系统
(57)摘要
本发明属于数据处理技术领域, 公开了一种
基于差分隐私的数据动态发布方法及系统。 所述
方法包括: 确定数据的发布格式; 确定一固定长
度的滑动窗口, 并使实时的数据流流过所述滑动
窗口; 同时基于DGIM算法对当前时刻内所述滑动
窗口内所有桶的尺寸进行计数以获得当前时刻
滑动窗口内数据的近似统计结果; 计算当前时刻
与上一时刻的滑动窗口内的相似性结果, 并基于
随机扰动算法为所述相似度度量添加概率扰动
以获得扰动相似性结果; 若所述扰动相似性结果
大于预设的相似阈值, 则确定所述当前时刻 滑动
窗口内数据的近似统计结果的待发布区间以进
行数据的动态发布。 本发明不但时间开销及空间
开销小, 且可有效保证用户的隐私信息, 防止第
三方隐私攻击 。
权利要求书3页 说明书9页 附图2页
CN 115422236 A
2022.12.02
CN 115422236 A
1.一种基于 差分隐私的数据动态发布方法, 其特 征在于, 包括:
确定数据发布格式; 其中, 所述发布格式包括若干发布区间;
确定一固定长度的滑动窗口, 并使实时的数据流流过所述滑动窗口; 同时基于DGIM算
法对当前时刻内所述滑动窗口内所有桶的尺寸进行计数以获得当前时刻滑动窗口内数据
的近似统计结果; 其中, 定义所述桶的尺寸为其内统计的1的个数; 对于相邻两时刻的所述
滑动窗口, 仅有一比特位更新, 并当更新的比特位上的数据为1时创建一新的桶; 并通过时
间戳较早的桶的合并使相同尺寸的桶的个数不超过 预设个数;
计算当前时刻与上一 时刻的滑动窗口内的相似性结果, 并基于随机扰动 算法为所述相
似度度量添加概 率扰动以获得扰动相似性结果;
若所述扰动相似性结果大于预设的扰动相似阈值, 则确定所述当前时刻滑动窗口内数
据的近似统计结果的待发布区间, 并基于差分隐私算法对其处理后进 行数据的更新及动态
发布。
2.根据权利要求1所述的基于差分隐私的数据动态发布方法, 其特征在于, 所述获得当
前时刻滑动窗口内数据的近似统计结果, 包括:
对所有桶的尺寸进行求和以获取第一计数 结果;
计算时间戳 最早的桶的尺寸的一半以获取第二计数 结果;
计算所述第一计数结果与所述第二计数结果间的差值以作为所述当前时刻滑动窗口
内数据的近似统计结果。
3.根据权利要求2所述的基于差分隐私的数据动态发布方法, 其特征在于, 所述相同尺
寸的桶的预设个数, 通过如下步骤确定:
获取第i时刻所述滑动窗口内数据的真实统计结果为Hi=1+(r‑1)(2j‑1); 其中, r为待
确定的相同尺寸的桶的预设个数, 2j为时间戳 最早的桶的尺寸;
确定第i时刻所述滑动窗口内数据的真实统计结果Hi与近似统计结果
间的误差为
其中, 2j‑1为与时间戳 最早桶相邻的桶的尺寸;
计算相同尺寸的桶的预设个数为:
4.根据权利要求1所述的基于差分隐私的数据动态发布方法, 其特征在于, 所述计算当
前时刻与上一时刻的滑动窗口内的相似性结果, 并基于随机扰动算法为所述相似度度量添
加概率扰动以获得扰动相似性结果; 包括:
计算当前时刻i的滑动窗口内的近似统计结果
与上一时刻i ‑1的滑动窗口内最终发
布结果
的相似性结果
基于随机扰动算法获得一随机数, 若所述随机数小于或等于扰动概率, 则确定扰动相
似性结果为区间(0,1)内任一数值; 若所述随机数大于扰动概率, 则判断所述相 似性结果T
是否大于相似性阈值T0;
若T>T0, 则确定扰动相似性结果 为1; 反之则确定扰动相似性结果 为0;
其中, 所述扰动概率为
其中, ε为通过M1算法计算的隐私预算, w为滑动权 利 要 求 书 1/3 页
2
CN 115422236 A
2窗口的长度。
5.根据权利要求1所述的基于差分隐私的数据动态发布方法, 其特征在于, 所述确定所
述当前时刻滑动窗口内数据的近似统计结果的待发布区间, 包括:
采用动态规划分组算法确定所述当前所述当前时刻滑动 窗口内数据的近似统计结果
的待发布区间。
6.一种基于 差分隐私的数据动态发布系统, 其特 征在于, 包括:
第一构建模块, 用于确定数据发布格式; 其中, 所述发布格式包括若干发布区间;
数据统计模块, 用于确定一固定长度的滑动 窗口, 并使实时的数据流流过所述滑动 窗
口; 同时基于DGIM算法对当前时刻内所述滑动窗口内所有桶的尺 寸进行计数以获得当前时
刻滑动窗口内数据的近似统计结果; 其中, 定义所述桶的尺寸为其内统计的1的个数; 对于
相邻两时刻的所述滑动窗口, 仅有一比特位更新, 并当更新的比特位上的数据为1时创建一
新的桶; 并通过时间戳较早的桶的合并使相同尺寸的桶的个数不超过 预设个数;
随机扰动模块, 用于计算当前时刻与上一时刻的滑动 窗口内的相似性结果, 并基于随
机扰动算法为所述相似度 度量添加概 率扰动以获得扰动相似性结果;
动态发布模块, 用于在所述扰动相似性结果大于预设的扰动相似阈值时, 确定所述当
前时刻滑动窗口内数据的近似统计结果的待发布区间, 并基于差分隐私算法对其处理后再
进行数据的更新及动态发布。
7.根据权利要求6所述的基于 差分隐私的数据动态发布系统, 其特 征在于, 包括:
第一计数模块, 用于对所有桶的尺寸进行求和以获取第一计数 结果;
第二计数模块, 用于计算时间戳 最早的桶的尺寸的一半以获取第二计数 结果;
第三计数模块, 用于计算所述第 一计数结果与 所述第二计数结果间的差值以作为所述
当前时刻滑动窗口内数据的近似统计结果。
8.根据权利要求7 所述的基于 差分隐私的数据动态发布系统, 其特 征在于, 包括:
第一计算模块, 用于获取第i时刻所述滑动窗口内数据的真实统计结果为Hi=1+(r‑1)
(2j‑1); 其中, r为待确定的相同尺寸的桶的预设个数, 2j为时间戳 最早的桶的尺寸;
第二计算模块, 用于确定第i时刻所述滑动窗口内数据的真实统计 结果Hi与近似统计结
果
间的误差为
其中, 2j‑1为与时间戳 最早桶相邻的桶的尺寸;
第三计算模块, 用于计算相同尺寸的桶的预设个数为:
9.根据权利要求6所述的基于 差分隐私的数据动态发布系统, 其特 征在于, 包括:
第四计算模块, 用于计算当前时刻 i的滑动窗口内 的近似统计结果
与上一时刻 i‑1的
滑动窗口内最终 发布结果
的相似性结果
第一判断模块, 用于基于随机扰动算法获得一随机数, 若所述随机数小于或等于扰动
概率, 则确定扰动相 似性结果为区间(0,1)内任一数值; 若所述随机数大于扰动概率, 则判
断所述相似性结果T是否大于相似性阈值T0;
第二判断模块, 用于在T>T0时, 确定扰动相似性结果为1; 反之则确定扰动相似性结果
为0。
10.根据权利要求6所述的基于 差分隐私的数据动态发布系统, 其特 征在于, 包括:权 利 要 求 书 2/3 页
3
CN 115422236 A
3
专利 一种基于差分隐私的数据动态发布方法及系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:14:46上传分享