(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211220698.9
(22)申请日 2022.10.08
(71)申请人 广州大学
地址 510006 广东省广州市大 学城外环西
路230号
(72)发明人 廖宏建
(74)专利代理 机构 北京高航知识产权代理有限
公司 11530
专利代理师 覃钊雄
(51)Int.Cl.
G06F 16/906(2019.01)
G06F 16/9536(2019.01)
G06Q 50/00(2012.01)
G06Q 30/02(2012.01)
G06Q 50/20(2012.01)
(54)发明名称
情境驱动的大规模在线学习动态分组方法
(57)摘要
本发明涉及大规模在线学习中的群组划分
领域, 且公开了情境驱动的大规模在线学习动态
分组方法, 包括以下步骤, 首先基于活动理论构
建学习者情境模 型, 并将反映情境指标的多模态
数据转化为情境流; 其次对模糊C均值聚类算法
进行扩展, 使用增量式流处理和动态滑动窗口技
术探测情境流中的概念漂移, 实现基于某一情境
维度的学习群组自适应动态聚类; 最后按混合分
组思路, 对不同情境维度的同质聚类结果进行差
异化组合, 得到异质学习小组, 该情境驱动的大
规模在线学习动态分组方法, 能在学员不断进入
与退出, 以及学习者行为特征发生变化的情形
下, 既能维持分组的连续性, 又能自适应动态调
整。 动态分组在学习者合作倾向、 互惠性等方面
更具备有优势。
权利要求书2页 说明书10页 附图3页
CN 115525810 A
2022.12.27
CN 115525810 A
1.情境驱动的大规模在线学习动态分组方法, 其特 征在于, 包括以下步骤:
第一步: 首先基于活动理论构建学习者情境模型, 并将反映情境指标的多模态数据转
化为情境流;
第二步: 其次对模糊C均值聚类算法进行扩展, 使用增量式流处理和动态滑动窗口技术
探测情境 流中的概念漂移, 实现基于情境维度的学习群组自适应动态聚类;
第三步: 最后按混合分组思路, 对不同情境维度的同质聚类结果进行差异化组合, 得到
异质学习小组。
2.根据权利要求1所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 所述
第一步中的用户情境模型包含三个维度: 由人口统计信息、 人格特质的构成的用户情境, 由
知识水平、 学习投入以及行为链构成的学习情境, 由学习者与同伴交互形成的社会网络关
系构成的社会情境; 其中学习情境与社会情境 为实时情境, 从行为数据流中采集。
3.根据权利要求1所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 所述
第二步中的对模糊C均值聚类算法进行扩展, 使用动态滑动窗口技术和增量式流处理探测
情境流中的概念漂移, 具体步骤如下:
S1: 基于在线学习任务的时间大体均匀分布特点, 采用滑动窗口技术, 对情境流S按数
据点到达先后顺序划分为窗口集 W={W1,W2,...,WT};
S2: 使用普通FCM算法完成第一个窗口的初始聚类, 即估计窗口子集W1的初始簇 数量, 通
过求解以下目标函数计算聚类模型(Up,Cp)
S3: 增量式优化模型J ′(Up,Cp)由当前窗 口聚类结构和前后两个窗口聚类结构的差异值
D组成, 将概念漂移问题集 成到优化模 型中, 以优化模型的解作为检测是否发生概念漂移的
依据;
S4: 比较增量式优化模型中的差异值D, D越小, 表明两个模型的差异性越小;
D值越大, 表明两个前后两个模型的差异性越大, 其聚类结构发生了较大的变化, 出现
了概率漂移现象,则重新计算子集 Wp的簇数量和重新计算聚类模型J ′(Up,Cp)。
S5: 考虑特殊时期大规模在线学习行为日志的潮汐现象, 进一步采用大小可变的动态
窗口机制, 如果检测到漂移发生, 则减少窗口尺寸, 否则增加窗口尺寸加快数据流处理速
度。
4.根据权利要求3所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 所述
滑动窗口处 理包括以下内容:
定义W={W1,W2,...,WT}表示对情境流S按数据 点到达先后顺序划分为大小不同的窗口
集, 对任意p,q(1≤p≠q≤T), 满足
和
滑动窗口Wp中数据样本的个
数记为Np;
对于数据流中第 p个滑动窗口的数据子集Wp流入时, 新的聚类模型应 该在上一个窗口聚
类模型的基础上 更新得到 。
5.根据权利要求3所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 所述
增量式优化模型为:权 利 要 求 书 1/2 页
2
CN 115525810 A
2J′(Up,Cp)=J(Up,Cp)+D(Cp,Cp‑1);
是数据子集Wp的隶属度模型,
是数据子集Wp流入后形成的新聚类模
型, kp表示Cp中类簇的个数, Cp‑1表示前一个数据子集的聚类模型。 D(Cp,Cp‑1)表示新聚类模
型与前一个窗口聚类模型的差异性。
6.根据权利要求3所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 所述
优化模型概念漂移检测包括以下内容:
对增量式优化模型J ′(Up,Cp)=J(Up,Cp)+D(Cp,Cp‑1), 其中
将优化后的聚类目标函数最优值Jo′pt(Up,Cp)作为检测概 率漂移的依据;
参数β >0, 用于调节D值所占的比重, 其中D值越小, 表明两个模型的差异性越小;
D值越大, 表明两个 前后两个模型的差异性越大, 也 即情境流子集Wp‑1向子集Wp演化的过
程中, 其聚类结构发生了较大的变化, 出现了概 率漂移现象。
7.根据权利要求3所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 所述
动态滑动窗口包括以下内容:
定义最大窗口尺寸Nmax和最小窗口尺寸Nmin,设默认窗口大小为Ncurrent, 如果检测到漂移
发生, 则下一个窗口尺寸设为Nmin, 否则设为min(Nmax,2*Ncurrent),加快数据流处理速度, 考
虑到不同窗口大小 数据子集规模的影响, 在 使用最优Jo′pt值检测漂移时, 采用 “单位误差平
方和”来消除窗口数据子集 规模差异的影响, 即使用下述公式作为 最终检测漂移的依据:
Jo′pt(Up,Cp)/Np>θ;
如果检测到漂移, 就使用目标函数定义公式对新进的子集重新聚类。
8.根据权利要求2所述的情境驱动的大规模在线学习动态分组方法, 其特征在于: 情境
映射关系具体为: 用户情境映射为主体、 学习情境映射为客体、 社会情境映射为群体、 规则、
分工。权 利 要 求 书 2/2 页
3
CN 115525810 A
3
专利 情境驱动的大规模在线学习动态分组方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 15:41:17上传分享