期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
Taxonomy of Data Prefetching for Multicore Processors 被引量:1
1
作者 Surendra Byna 陈勇 孙贤和 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第3期405-417,共13页
Data prefetching is an effective data access latency hiding technique to mask the CPU stall caused by cache misses and to bridge the performance gap between processor and memory. With hardware and/or software support,... Data prefetching is an effective data access latency hiding technique to mask the CPU stall caused by cache misses and to bridge the performance gap between processor and memory. With hardware and/or software support, data prefetching brings data closer to a processor before it is actually needed. Many prefetching techniques have been developed for single-core processors. Recent developments in processor technology have brought multicore processors into mainstream. While some of the single-core prefetching techniques are directly applicable to multicore processors, numerous novel strategies have been proposed in the past few years to take advantage of multiple cores. This paper aims to provide a comprehensive review of the state-of-the-art prefetching techniques, and proposes a taxonomy that classifies various design concerns in developing a prefetching strategy, especially for multicore processors. We compare various existing methods through analysis as well. 展开更多
关键词 taxonomy of prefetching strategies multicore processors data prefetching memory hierarchy
原文传递
Adaptive Cache Allocation with Prefetching Policy over End-to-End Data Processing
2
作者 Hang Qin Li Zhu 《Journal of Signal and Information Processing》 2017年第3期152-160,共9页
With the speed gap between storage system access and processor computing, end-to-end data processing has become a bottleneck to improve the total performance of computer systems over the Internet. Based on the analysi... With the speed gap between storage system access and processor computing, end-to-end data processing has become a bottleneck to improve the total performance of computer systems over the Internet. Based on the analysis of data processing behavior, an adaptive cache organization scheme is proposed with fast address calculation. This scheme can make full use of the characteristics of stack space data access, adopt fast address calculation strategy, and reduce the hit time of stack access. Adaptively, the stack cache can be turned off from beginning to end, when a stack overflow occurs to avoid the effect of stack switching on processor performance. Also, through the instruction cache and the failure behavior for the data cache, a prefetching policy is developed, which is combined with the data capture of the failover queue state. Finally, the proposed method can maintain the order of instruction and data access, which facilitates the extraction of prefetching in the end-to-end data processing. 展开更多
关键词 END-TO-END data Processing STORAGE System CACHE prefetchING
下载PDF
深度学习在多核缓存预取中的应用研究综述
3
作者 张建勋 乔欣雨 林炳辉 《计算机应用研究》 CSCD 北大核心 2024年第2期341-347,共7页
当前人工智能技术应用于系统结构领域的研究前景广阔,特别是将深度学习应用于多核架构的数据预取研究已经成为国内外的研究热点。针对基于深度学习的缓存预取任务进行了研究,形式化地定义了深度学习缓存预取模型。在介绍当前常见的多核... 当前人工智能技术应用于系统结构领域的研究前景广阔,特别是将深度学习应用于多核架构的数据预取研究已经成为国内外的研究热点。针对基于深度学习的缓存预取任务进行了研究,形式化地定义了深度学习缓存预取模型。在介绍当前常见的多核缓存架构和预取技术的基础上,全面分析了现有基于深度学习的典型缓存预取器的设计思路。深度学习神经网络在多核缓存预取领域的应用主要采用了深度神经网络、循环神经网络、长短期记忆网络和注意力机制等机器学习方法,综合对比分析现有基于深度学习的数据预取神经网络模型后发现,基于深度学习的多核缓存预取技术在计算成本、模型优化和实用性等方面还存在着局限性,未来在自适应预取模型以及神经网络预取模型的实用性方面还有很大的研究探索空间和发展前景。 展开更多
关键词 深度学习 数据预取 多核架构 缓存优化 神经网络 研究综述
下载PDF
Research on data pre-deployment in information service flow of digital ocean cloud computing
4
作者 SHI Suixiang XU Lingyu +4 位作者 DONG Han WANG Lei WU Shaochun QIAO Baiyou WANG Guoren 《Acta Oceanologica Sinica》 SCIE CAS CSCD 2014年第9期82-92,共11页
Data pre-deployment in the HDFS (Hadoop distributed file systems) is more complicated than that in traditional file systems. There are many key issues need to be addressed, such as determining the target location of... Data pre-deployment in the HDFS (Hadoop distributed file systems) is more complicated than that in traditional file systems. There are many key issues need to be addressed, such as determining the target location of the data prefetching, the amount of data to be prefetched, the balance between data prefetching services and normal data accesses. Aiming to solve these problems, we employ the characteristics of digital ocean information service flows and propose a deployment scheme which combines input data prefetching with output data oriented storage strategies. The method achieves the parallelism of data preparation and data processing, thereby massively reducing I/O time cost of digital ocean cloud computing platforms when processing multi-source information synergistic tasks. The experimental results show that the scheme has a higher degree of parallelism than traditional Hadoop mechanisms, shortens the waiting time of a running service node, and significantly reduces data access conflicts. 展开更多
关键词 HDFS data prefetching cloud computing service flow digital ocean
下载PDF
基于FPGA的分子动力学模拟多流水数据预取系统
5
作者 王鑫 冷文迪 《单片机与嵌入式系统应用》 2023年第5期15-19,共5页
为提高分子动力学模拟中短程力的计算效率,设计并实现了基于FPGA的分子动力学模拟短程力多流水计算系统。针对在短程力多流水计算过程中多个计算模块频繁调用大量的粒子信息导致的高带宽需求和访问内存冲突问题,提出了多流水数据预取系... 为提高分子动力学模拟中短程力的计算效率,设计并实现了基于FPGA的分子动力学模拟短程力多流水计算系统。针对在短程力多流水计算过程中多个计算模块频繁调用大量的粒子信息导致的高带宽需求和访问内存冲突问题,提出了多流水数据预取系统的设计,可减少对粒子数据的重复读取,缓解访问冲突,保证计算模块的效率。本文使用Xilinx Virtex UltraScale+HBM VCU128 FPGA开发板,实验结果表明,与短程力单流水计算系统相比,短程力多流水计算系统的计算效率提高了3.29倍,同时验证了多流水数据预取系统的有效性。 展开更多
关键词 FPGA 并行计算 短程力多流水计算系统 多流水数据预取系统
下载PDF
基于高预测性的稀疏矩阵向量乘法并行计算优化
6
作者 夏天 付格林 +2 位作者 曲劭儒 罗中沛 任鹏举 《计算机研究与发展》 EI CSCD 北大核心 2023年第9期1973-1987,共15页
稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一.在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分... 稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)是广泛应用于科学计算、工业仿真和智能计算等领域的重要算法,是核心的计算行为之一.在一些应用场景中,需要进行多次的SpMV迭代,以完成精确的数值模拟、线性代数求解和图分析收敛等计算要求.受限于SpMV本身的高度随机性和稀疏性所导致的数据局部性极差、缓存效率极低、计算模式非常不规则等问题,导致其计算负载成为当前高性能处理器的优化难点和研究热点.基于现代高性能超标量乱序处理器的架构特征,深入研究SpMV的各类性能瓶颈,并且提出从提升可预测性和降低程序复杂度的角度进行全面的性能优化.其核心思想是:通过构建串行访问的数据结构,提升数据访问的规律性和局部性,大幅度优化数据预取效率和缓存利用效率;通过构建规则的分支跳转条件,提升程序的分支预测准确率,有效提升程序执行效率;通过灵活运用SIMD指令集,有效提升计算资源利用率.通过对以上特性的优化,该方法可以显著缓解性能瓶颈,大幅度提升处理器资源、缓存资源和访存带宽的利用率,并且获得与主流商用计算库MKL相比平均2.6倍的加速比,相比于现有最先进算法获得平均1.3倍的加速比. 展开更多
关键词 矩阵向量乘法 稀疏矩阵计算 矩阵格式 分支预测 数据预取
下载PDF
多级缓存数据预取处理器访存性能测试方法
7
作者 钟伟军 田晨燕 《信息技术与标准化》 2023年第6期25-29,共5页
针对处理器内存访问性能测试缺少对多级缓存数据预取优化而导致测试数据不能真实反映实际性能的问题,分析了多级缓存数据预取优化技术及其对内存访问带宽的影响。提出了一种针对多级缓存处理器的访存性能优化测试方法,该方法充分利用缓... 针对处理器内存访问性能测试缺少对多级缓存数据预取优化而导致测试数据不能真实反映实际性能的问题,分析了多级缓存数据预取优化技术及其对内存访问带宽的影响。提出了一种针对多级缓存处理器的访存性能优化测试方法,该方法充分利用缓存数据预取机制,并避免处理器核间资源竞争,实现访存性能提升。实验数据表明,采用该方法可以得到符合硬件实际访存性能的数据,为准确评估高性能处理器的访存能力提供支持。 展开更多
关键词 多级缓存 缓存数据预取 访存性能 处理器 访存带宽
下载PDF
基于龙芯2F体系结构的BLAS库优化 被引量:13
8
作者 顾乃杰 李凯 +1 位作者 陈国良 吴超 《中国科学技术大学学报》 CAS CSCD 北大核心 2008年第7期854-859,共6页
在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测... 在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750 MHz的龙芯2F处理器(双精度浮点峰值3 Gflops)上HPL实测峰值达到1.47 GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%. 展开更多
关键词 BLAS 龙芯2F KD-50-Ⅰ 数据预取 指令调度
下载PDF
移动环境下支持实时事务处理的数据预取 被引量:8
9
作者 李国徽 杨兵 +1 位作者 陈辉 杜建强 《计算机学报》 EI CSCD 北大核心 2008年第10期1841-1847,共7页
随着移动通信技术的迅速发展,人们提出了新的应用要求:在移动环境下处理实时事务.而移动通信带宽有限性引起较大的数据访问延迟,有时甚至由于网络传输的断接使得事务得不到所需要的数据,数据预取能够很好地解决这个问题.已有的移动环境... 随着移动通信技术的迅速发展,人们提出了新的应用要求:在移动环境下处理实时事务.而移动通信带宽有限性引起较大的数据访问延迟,有时甚至由于网络传输的断接使得事务得不到所需要的数据,数据预取能够很好地解决这个问题.已有的移动环境下数据预取没有考虑到数据的流行性和事务的时间特性.该文分析影响实时事务数据预取的因素,首先考虑数据易变性、活跃性等因素,获得高价值预取数据集合;然后考虑访问预取数据的事务优先级、数据流行性等因素,构造预取数据的选择函数,通过该函数在前面选取的集合中筛选出对满足实时事务截止期更有价值的数据对象进行预取.实验表明,该数据预取策略能降低移动实时事务满足截止期的比率,更好地支持移动实时事务处理. 展开更多
关键词 数据预取 移动实时事务 缓存失效 预取策略
下载PDF
一种自适应的数据预取与缓冲算法 被引量:6
10
作者 朱鸿宇 刘瑰 +1 位作者 唐福华 陈左宁 《计算机工程与应用》 CSCD 北大核心 2006年第24期13-15,42,共4页
在海量数据中进行的直接查找往往耗时巨大,在实际应用中很难满足实时性的需求,因此采用数据预取和缓冲技术实现对查找操作的优化成为实际系统中的重要环节。自适应的数据预取和缓冲算法是通过使用人工智能中的技术来分析用户的查询习惯... 在海量数据中进行的直接查找往往耗时巨大,在实际应用中很难满足实时性的需求,因此采用数据预取和缓冲技术实现对查找操作的优化成为实际系统中的重要环节。自适应的数据预取和缓冲算法是通过使用人工智能中的技术来分析用户的查询习惯,从而实现动态的预取策略并对预取的数据进行缓冲,以达到提高查询速度的目的。文章根据不同的数据查询需求提出了两类智能算法以适应不同的应用场合。在实验中分别针对单个用户的历史查询应用和多用户的并发查询应用分别进行了分析,证明了这两类智能算法分别对不同的应用场合拥有较好的性能。 展开更多
关键词 自适应 数据预取 人工智能
下载PDF
指令级并行编译器的数据预取及优化方法 被引量:8
11
作者 连瑞琦 张兆庆 乔如良 《计算机学报》 EI CSCD 北大核心 2000年第6期576-584,共9页
微处理器芯片的处理能力越来越强 .但是 ,存储器的速度却远远不能与其匹配 ,造成了整个系统的性能不理想 .为解决这个问题 ,编译器发展了局部性优化、数据预取等多种技术 .文中将介绍一种用于 IL P(Instructionlevel Parallelism)优化... 微处理器芯片的处理能力越来越强 .但是 ,存储器的速度却远远不能与其匹配 ,造成了整个系统的性能不理想 .为解决这个问题 ,编译器发展了局部性优化、数据预取等多种技术 .文中将介绍一种用于 IL P(Instructionlevel Parallelism)优化编译器的数据预取技术以及一种利用寄存器堆减少主存访问次数、对程序进行优化的方法 .利用它们可以提高平均存储性能 。 展开更多
关键词 数据预取 寄存器堆 预取优化 指令级并行编译器
下载PDF
网络化移动应用的全局适应性数据预取机制 被引量:4
12
作者 张晓薇 曹东刚 +1 位作者 田刚 陈向群 《软件学报》 EI CSCD 北大核心 2010年第8期1783-1794,共12页
提出一种多目标的数据预取方法(multiple goals oriented data prefetching,简称MGODP)来满足不同用户的数据预取需求.MGODP不仅从用户偏好出发为其预取合适量的数据,而且从服务器角度出发,对于Client/Server模式下的数据访问提出全局... 提出一种多目标的数据预取方法(multiple goals oriented data prefetching,简称MGODP)来满足不同用户的数据预取需求.MGODP不仅从用户偏好出发为其预取合适量的数据,而且从服务器角度出发,对于Client/Server模式下的数据访问提出全局合作的方法,以大幅度提高服务质量.另外,MGODP提供了移动客户端和服务器之间平衡工作负载的合作机制,合理分配系统资源,保障系统性能.通过一系列实验可以看出,MGODP方法能够很好地满足不同用户的需求,并通过全局合作和负载均衡机制在保证用户性能需求的前提下,尽可能地减小对电池电量和网络带宽的消耗. 展开更多
关键词 数据预取 用户偏好 上下文可感知 移动计算 全局协作
下载PDF
面向龙芯3B1500体系结构的DGEMM函数优化 被引量:3
13
作者 刘刚 张恒 +1 位作者 毛睿 陆克中 《小型微型计算机系统》 CSCD 北大核心 2014年第7期1523-1527,共5页
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现... 双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现矩阵乘法的向量化运算,同时针对矩阵乘法中各矩阵的访存特点设计合理分块策略,并运用3B1500的cache锁机制将重复利用率高的分块锁在cache中以减少cache缺失,最后针对矩阵A和B的预取时间大于计算时间这一问题,设计了一种新的矩阵预取算法.该预取算法通过增大核心计算的计算量,将矩阵A和B的预取时间全部掩藏在计算中,并且通过ld指令与$0寄存器的配合使用来实现对C矩阵的预取.优化后的DGEMM函数无论在单线程和多线程时的性能都达到了理论峰值的80%以上. 展开更多
关键词 龙芯3B1500处理器 BLAS DGEMM 矩阵乘法 数据预取
下载PDF
基于龙芯3B处理器的Linpack优化实现 被引量:3
14
作者 刘刚 张恒 +1 位作者 张滇 毛睿 《深圳大学学报(理工版)》 EI CAS 北大核心 2014年第3期286-292,共7页
HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B... HPL是高性能计算广泛采用的Linpack测试软件包.针对龙芯3B处理器体系结构的特点,为Linpack中的核心部分——矩阵乘法设计矩阵分块策略,利用龙芯3B的cache锁机制将频繁调用的数据分块锁在cache中,从而显著降低cache缺失率.同时为龙芯3B处理器中的访存加速部件设计了高效的预取算法,以实现计算时间掩盖访存时间.另外,分别对Linpack所调用的dtrsm和行交换等热点函数进行优化,并通过参数训练来优化Linpack参数.实验结果表明,在龙芯3B处理器上,单节点4核以及双节点8核的Linpack实测性能均达到理论峰值的60%左右,优化后的Linpack性能较优化前提升了10倍左右. 展开更多
关键词 计算机系统结构 龙芯3B处理器 线性系统软件包 矩阵乘法 数据预取
下载PDF
三维网站智能导航系统的设计与实现 被引量:4
15
作者 陈明志 许春耀 余轮 《计算机工程与设计》 CSCD 北大核心 2010年第20期4438-4441,4483,共5页
为解决目前网络虚拟环境下信息交互因缺乏导航理论而产生的各种现实问题,如用户容易产生疲劳感与"迷航"现象,引入智能导航的设计思想。对组成智能导航系统的3个关键技术(信息推荐、路径规划与数据预取)进行了深入地分析与研究... 为解决目前网络虚拟环境下信息交互因缺乏导航理论而产生的各种现实问题,如用户容易产生疲劳感与"迷航"现象,引入智能导航的设计思想。对组成智能导航系统的3个关键技术(信息推荐、路径规划与数据预取)进行了深入地分析与研究;提出了适合网络三维虚拟环境关键技术的相应改进算法;接着整合3种技术,设计了带智能导航功能的三维网站原型系统;最后通过构建网上三维虚拟博物馆,表明智能导航系统的工作性能。 展开更多
关键词 网络虚拟环境 智能导航 信息推荐 路径规划 数据预取
下载PDF
基于马尔可夫模型的数据值预取方案 被引量:5
16
作者 谢学军 叶以正 +1 位作者 邱善勤 喻明艳 《电子学报》 EI CAS CSCD 北大核心 2007年第2期307-310,共4页
根据程序中Load指令的行为特征构造马尔可夫模型,进而提出预取器的结构方案.SPEC仿真结果表明,与采用二级值预测方案以及基于程序语句相关的预取方案相比,在预测指令的覆盖率上分别提高了9.51%和2.02%,在预测精度上分别提高了12.9%和8.... 根据程序中Load指令的行为特征构造马尔可夫模型,进而提出预取器的结构方案.SPEC仿真结果表明,与采用二级值预测方案以及基于程序语句相关的预取方案相比,在预测指令的覆盖率上分别提高了9.51%和2.02%,在预测精度上分别提高了12.9%和8.2%,而在IPC上,则分别提高了16.7%和7.4%. 展开更多
关键词 数据相关 马尔可夫模型 数据值预取
下载PDF
YHFT-DX高性能DSP中Cache失效流水设计 被引量:2
17
作者 郭阳 傅祎晖 +1 位作者 刘胜 李勇 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第6期6-11,共6页
YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问C... YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问Cache的失效请求并进行流水化处理,使多个Cache失效延迟重叠,从而达到降低平均Cache失效代价的目的。将该策略应用到YHFT-DX芯片的一级数据Cache控制器的设计与优化中,使访问Cache失效引起的流水线停顿从8拍降为2拍,显著提升了系统性能。 展开更多
关键词 DSP 失效流水 非阻塞Cache 数据预取
下载PDF
p-HPF并行编译系统核外计算的实现及优化策略 被引量:4
18
作者 丁文魁 汪剑平 +2 位作者 向华 李晓明 许卓群 《计算机学报》 EI CSCD 北大核心 1999年第10期1042-1049,共8页
文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优... 文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优化策略,使并行程序执行核外计算的效率得到了大幅度地提高.文中叙述了核外计算模型及其优化的设计思想与实现。 展开更多
关键词 核外计算 核外数组 数据筛选 并行编译系统
下载PDF
基于CMP的指针数据预取方法 被引量:3
19
作者 朱会东 黄永丽 宋宝卫 《计算机工程》 CAS CSCD 北大核心 2011年第6期71-73,共3页
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理... 针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理器共享高速缓存中以隐藏主线程的存储器延迟。实验结果证明该方法在CMP架构下对以链式结构为主的内存受限程序的性能有一定的改进。 展开更多
关键词 存储墙 链式数据结构 多核多线程 数据预取
下载PDF
基于数据路由的分布式备份数据去重系统 被引量:2
20
作者 姚敏 尹建伟 +1 位作者 唐彦 罗智凌 《计算机工程》 CAS CSCD 北大核心 2017年第2期85-91,共7页
传统数据去重备份系统在大数据应用场景下存在备份存储空间过大和数据吞吐量不足等缺点。为此,基于数据路由设计一种分布式备份数据去重系统。该系统以数据片为去重粒度,具有数据路由和数据预取2个功能。数据路由使用布隆过滤器对需要... 传统数据去重备份系统在大数据应用场景下存在备份存储空间过大和数据吞吐量不足等缺点。为此,基于数据路由设计一种分布式备份数据去重系统。该系统以数据片为去重粒度,具有数据路由和数据预取2个功能。数据路由使用布隆过滤器对需要处理的数据片进行路由查询,数据预取则使用平均取样和基于Jaccard距离的近邻取样方案。通过数据路由分配数据片到相应处理节点进行处理,平均取样得到的数据片哈希码为数据路由提供路由信息,近邻取样得到的数据片哈希码用于系统首次数据去重。实验结果表明,该系统在保证数据去重率的同时,相对全节点查询和定点路由的数据片路由方式数据吞吐量提升明显。 展开更多
关键词 数据去重 数据路由 数据预取 布隆过滤器 Jaccard距离
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部