(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210546502.9
(22)申请日 2022.05.20
(65)同一申请的已公布的文献号
申请公布号 CN 114637609 A
(43)申请公布日 2022.06.17
(73)专利权人 沐曦集成电路 (上海) 有限公司
地址 201306 上海市浦东 新区中国 (上海)
自由贸易试验区临港新片区环湖西二
路888号C楼
(72)发明人 不公告发明人
(74)专利代理 机构 北京锺维联合知识产权代理
有限公司 1 1579
专利代理师 丁慧玲
(51)Int.Cl.
G06F 9/50(2006.01)G06F 5/06(2006.01)
G06F 12/06(2006.01)
G06K 9/62(2022.01)
G06T 1/20(2006.01)
(56)对比文件
CN 107209681 A,2017.09.26
CN 114428749 A,202 2.05.03
徐金波等.面向多兴趣区域图像处 理应用的
高效无冲突并行访问存 储模型. 《计算机学报》
.2008,第31卷(第1 1期),全文.
肖利亚.Y HFT-DSPX片内存 储器的设计与实
现. 《中国优秀硕士学位 论文全文数据库》 .2012,
第2012卷(第04期),全 文.
审查员 刘启军
(54)发明名称
基于冲突检测的GPU的数据获取系统
(57)摘要
本发明涉及一种基于冲突检测的GPU的数据
获取系统, 包括位于GP U中的冲突检测模块和P个
cache{C1, C2,…CP},其中, Cp表示第p个cache; 冲
突检测模块用于获取M个第一获取数据请求, 通
过冲突检测将其中虚拟地址信息相同的第一获
取数据请求进行融合, 生成N个第二获取数据请
求, 将每一第二获取数据请求定向输出至对应的
cache中, Cp对应的第二获取数据请求队列Lp为
{R1p, R2p,…, RpSp}; P个cache均与memory连接, P
个cache并行处理对应的第二获取数据请求, Cp
用于分配pS个cycle,为每一Rip分配一个cycle
逐个处理Lp中的每一个Rip。 本发明提高了GPU 的
数据获取效率。
权利要求书2页 说明书5页 附图1页
CN 114637609 B
2022.08.12
CN 114637609 B
1.一种基于冲突检测的GPU的数据获取系统, 其特 征在于,
包括位于GPU中的冲突检测模 块和P个cache{C1, C2,…CP},其中, Cp表示第p个cache,p的
取值范围为1到P, P为大于等于2的正整数;
所述冲突检测模块用于获取M个第一获取数据请求, 并通过冲突检测将其中虚拟地址
信息相同的第一获取数据请求进行融合, 生成N个第二获取数据请求, N≤M, 并将每一第二
获取数据请求定向输出至对应的cache中, Cp对应的第二获取数据请求队列Lp为{R1p,
R2p,…, RpSp },pS为Cp对应的第二获取数据请求数量, Rip表示Lp中第i个第二获取数据请
求, 0≤pS≤N, i的取值范围为1到pS;
所述P个cache均与memory连接, 所述P个cache并行处理对应的第二获取数据请求, Cp用
于分配pS个cycle, 为每一Rip分配一个cycle 逐个处理Lp中的每一个Rip;
所述第一获取数据请求包括目标字节数量、 偏移量信息、 cache标识信息和虚拟地址信
息;
所述偏移量信息、 cache标识信息和虚拟地址信息按照预设的格式存储至U位数据中,
其中, 第0 ‑a位用于存储偏移量信息, a+1至b位用于存储cache标识信息, b+1至U ‑1位用于存
储虚拟地址信息, a、 b满足2a=W,2b‑a‑1=P, W为cache的位宽 。
2.根据权利要求1所述的系统, 其特 征在于,
所述冲突检测模块包括Y个比较器、 融合单元和分配单元, Y为M个第一获取数据请求两
两任意组合的组合数量, 每一比较器用于输入一组第一获取数据请求进行冲突检测, 具体
包括比较该组第一获取数据请求中的虚拟地址信息是否相同, 并将判断结果输出至融合单
元;
所述融合单元用于将所有虚拟地址信 息相同的第 一获取数据请求进行融合, 生成一个
第二获取数据请求, 输出至分配单元, 所述第二获取数据请求中包括所有被融合的第一获
取数据请求中对应的偏移 量信息, 共用同一cache标识信息和虚拟地址信息; 所述融合单元
还用于将虚拟地址信息与其他第一获取数据请求的虚拟地址信息均不相同的第一获取数
据请求直接生成为对应的第二获取 数据请求, 并输出至分配单 元;
所述分配单元用于基于每一第二获取数据请求中的cache标识信息将第二获取数据请
求传输至对应的cac he中。
3.根据权利要求1所述的系统, 其特 征在于,
所述P个cache中, 每一cache对应一个物理地址存储区间, 用于从memory中获取对应物
理地址存 储区间中的物理地址对应的数据, P个物理地址存 储区间不重 叠;
每一所述物理地址存储区间包括多个物理地址, 所述cache中包括多个cache line,每
一cache line用于存 储一个物理地址对应的地址标识和数据。
4.根据权利要求1所述的系统, 其特 征在于,
所述P个cac he的宽度和深度均相同。
5.根据权利要求1所述的系统, 其特 征在于,
Cp具体用于:
在Cp分配的第i个cycle中,基于Rip中虚拟地址信息对应的物理地址信息, 判断当前Cp中
是否已经存储有对应的数据, 若存在, 则基于偏移量信息定位到对应的cache line中的起
点, 并从起点开始获取目标字节数量的数据; 若不存在, 则基于对应的物理地址信息生 成第权 利 要 求 书 1/2 页
2
CN 114637609 B
2三获取数据请求, 基于第三获取数据请求从所述memory中获取对应的数据存储至对应的Cp
对应的cache line中, 再基于偏移量信息定位到对应的cache line中的起点, 并从起点开
始获取目标字节数量的数据。
6.根据权利要求5所述的系统, 其特 征在于,
在Cp基于第三获取数据请求从所述memory中获取对应的数据存储至对应的Cp对应的
cache line的过程中, Cp还用于:
判断当前Cp的cache line是否已存满, 若存满, 则从根据存储时间和/或使用频率选择
一个cache line, 将其中的数据清除, 再将从所述memory中获取对应的数据存储至该cache
line中。权 利 要 求 书 2/2 页
3
CN 114637609 B
3
专利 基于冲突检测的GPU的数据获取系统
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:31:19上传分享