期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
高性能计算技术的发展现状及趋势 被引量:6
1
作者 韩冀中 韩承德 《中国工程科学》 2000年第1期85-86,共2页
目前,高性能计算技术主要有两个发展方向:在深度上致力于研制具有快速运算能力的高性能计算机;在广度上注重于开发具有广泛应用前景的高性能服务器。高性能计算机的发展水平已经成为衡量一个国家高新科技水平和综合实力的重要标志。高... 目前,高性能计算技术主要有两个发展方向:在深度上致力于研制具有快速运算能力的高性能计算机;在广度上注重于开发具有广泛应用前景的高性能服务器。高性能计算机的发展水平已经成为衡量一个国家高新科技水平和综合实力的重要标志。高性能计算机可以对所研究的对象进行数... 展开更多
关键词 高性能计算机 高性能计算技术 MPP技术
下载PDF
基于高性能I/O技术的Memcached优化研究 被引量:8
2
作者 安仲奇 杜昊 +2 位作者 李强 霍志刚 马捷 《计算机研究与发展》 EI CSCD 北大核心 2018年第4期864-874,共11页
内存对象缓存系统在通信方面受制于传统以太网的高延迟,在存储方面受限于服务器内可部署的内存规模,亟需融合新一代高性能I/O技术来提升性能、扩展容量.以广泛应用的Memcached为例,聚焦内存对象缓存系统的数据通路并基于高性能I/O对其... 内存对象缓存系统在通信方面受制于传统以太网的高延迟,在存储方面受限于服务器内可部署的内存规模,亟需融合新一代高性能I/O技术来提升性能、扩展容量.以广泛应用的Memcached为例,聚焦内存对象缓存系统的数据通路并基于高性能I/O对其进行通信加速与存储扩展.首先,基于日益流行的高性能远程直接内存访问(remote direct memory access,RDMA)语义重新设计通信协议,并针对不同的Memcached操作及消息大小设计不同的策略,降低了通信延迟.其次,利用高性能NVMe SSD来扩展Memcached存储,采用日志结构管理内存与外存2级存储,并通过用户级驱动实现对SSD的直接访问,降低了软件开销.最终,实现了支持JVM环境的高性能缓存系统U2cache.U2cache通过旁路操作系统内核和JVM运行时与内存拷贝、RDMA通信、SSD访问交叠流水的方法,显著降低了数据访问开销.实验结果表明,U2cache通信延迟接近RDMA底层硬件性能;对大消息而言,相较无优化版本,性能提高超过20%;访问SSD中的数据时,相比通过内核I/O软件栈的方式,访问延迟最高降低了31%. 展开更多
关键词 MEMCACHED 远程直接内存访问 NVMe固态硬盘 JAVA虚拟机 用户级IO
下载PDF
数据密集型计算编程模型研究进展 被引量:39
3
作者 王鹏 孟丹 +1 位作者 詹剑锋 涂碧波 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1993-2002,共10页
作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统... 作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统上研发了分布式编程系统.编程模型可以降低开发人员在大规模集群上编程的难度,并让程序充分利用集群资源,但设计这样的编程模型面临巨大挑战.首先说明了数据密集型计算的特点,并指出了编程模型要解决的基本问题;接着深入介绍了国际上代表性的编程模型,并对这些编程模型的特点进行了比较和分析;最后对当前所面临的问题和今后的发展趋势进行了总结和展望. 展开更多
关键词 云计算 数据密集型计算 编程模型 数据并行 海量数据处理 MAPREDUCE
下载PDF
基于Hash索引的高通量基因序列比对并行加速技术研究 被引量:4
4
作者 王文迪 汤文 +3 位作者 段勃 张春明 张佩珩 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2463-2471,共9页
近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程... 近年来随着高通量基因测序技术的迅速发展,测序成本和周期都得到了大幅降低.然而,新一代测序技术海量数据生成能力以及各类测序算法蕴含的高并发性却对现有计算机的运算能力提出了新挑战.以一个基于Hash索引算法实现的开源重测序程序(PerM)为例,研究了在商用多核CPU上加速该应用程序的关键技术.在一个64核SMP系统上的实验结果证明,提出的优化技术可以使Cache缺失率降低90%,性能提升4~11倍.接下来探讨了在一个包含XilinxLX330FPGA的加速卡上设计实现专用并行加速系统的相关问题.作为原型验证系统,在基于FPGA的PCIe加速卡上设计并实现了包含11个处理单元的脉动陈列并行计算系统.和IntelXeonX75508核CPU相比,提出的并行加速器有30~65倍性能功耗比优势. 展开更多
关键词 Hash索引 生物信息学 高通量测序 FPGA 并行加速器
下载PDF
基于定制协处理器的基因重测序加速技术研究
5
作者 汤文 张春明 +2 位作者 谭光明 张佩珩 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1980-1992,共13页
自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进... 自2008年1月高通量测序技术应用以来,测序的通量和成本都在不断下降.然而基因数据的爆发式增长速度已经超过了摩尔定律,对海量数据的计算处理能力成为制约基因测序应用推广的瓶颈.以基于Hash索引的重测序算法为目标,对计算和访存行为进行分析,从而提出了一个现场可编程门阵列(field programmable gate array,FPGA)作为协处理器的架构,并在Convey公司的HC-1ex平台上进行了设计与实现.其基本处理单元内部采用全流水的设计及FIFO隔离计算模块和访存模块,可以完整执行重测序算法的核心流程.通过将基本处理单元和访存端口的一对一绑定,在4块Xilinx Virtex-6LX760上实现了64路并行处理流程,总平均读内存带宽可达22.59GBps.与8核Intel Xeon处理器相比,可以提升28.5倍的性能. 展开更多
关键词 高通量测序技术 短序列比对 Hash索引 现场可编程门阵列 异构体系结构
下载PDF
基于分布式索引和目录聚合的海量小文件存储研究 被引量:5
6
作者 马灿 孟丹 熊劲 《高技术通讯》 CAS CSCD 北大核心 2012年第10期1035-1040,共6页
针对海量小文件访问问题的挑战,提出了用基于分布式索引和目录聚合的分布式文件系统——超虚拟文件系统(HVFS)来管理数十亿个小文件的方法,以支持高并发、高吞吐、低延迟的访问。重点讨论了目录索引、目录存储问题,提出了利用可扩... 针对海量小文件访问问题的挑战,提出了用基于分布式索引和目录聚合的分布式文件系统——超虚拟文件系统(HVFS)来管理数十亿个小文件的方法,以支持高并发、高吞吐、低延迟的访问。重点讨论了目录索引、目录存储问题,提出了利用可扩展哈希索引来降低延迟、提高扩展性,利用日志结构和列存储的目录聚合来提高吞吐率的方法。测试结果表明,HVFS的存储性能能够线性扩展,82节点上峰值创建速度接近百万每秒,与GIGA+相比有200%以上的提升,小文件I/O性能与OrangeFS相比有60倍以上的提升,充分验证了分布式索引和目录聚合方法的有效性。 展开更多
关键词 小文件 海量存储 分布式索引 目录聚合 分布式文件系统
下载PDF
PRNS加法中先行进位算法的研究
7
作者 祝明 滕虹 胡永刚 《计算机研究与发展》 EI CSCD 北大核心 1997年第11期817-821,共5页
PRNS算法是运算器内部的并行机制.在PRNS数母全加器的研制中,找到了一种新的先行进位算法,提出了PRNS先行进位产生器的逻辑结构.
关键词 PRNS 先行进位算法 运算器
下载PDF
天气预报模型WRF中复杂Stencil性能优化
8
作者 邸健强 袁良 +1 位作者 张云泉 张思佳 《计算机科学》 CSCD 北大核心 2024年第4期56-66,共11页
天气研究与预报模式(WRF)是一种应用广泛的中尺度数值天气预报系统,在大气研究和业务预报领域发挥着重要作用。Stencil计算是科学工程应用中一类常见的嵌套循环计算模式,WRF中对大气动力学和热力学方程的数值求解引出了大量空间网格上... 天气研究与预报模式(WRF)是一种应用广泛的中尺度数值天气预报系统,在大气研究和业务预报领域发挥着重要作用。Stencil计算是科学工程应用中一类常见的嵌套循环计算模式,WRF中对大气动力学和热力学方程的数值求解引出了大量空间网格上的复杂Stencil计算,存在多维度、多变量、物理模型边界特殊性、物理和动力学过程的复杂性等模型特征。文中深入剖析了WRF中典型的Stencil计算模式,识别抽象出典型Stencil循环中存在的“中间变量”概念,围绕其设计实现了3种优化方案,即中间变量计算合并、中间变量降维存储以及中间变量提取,有效提高了数据局部性,改善了数据重用率和空间复用率,降低了冗余计算和访存开销。结果表明,经优化方案重构的WRF 4.2典型Stencil热点函数在Intel CPU和Hygon CPU上均可获得良好的性能加速,最高加速比达21.3%和17.8%。 展开更多
关键词 WRF Stencil计算 中间变量 优化方案 数据局部性 热点函数 性能加速
下载PDF
基于链路状态数据库的数据中心网络异常检测算法 被引量:28
9
作者 许刚 王展 +1 位作者 臧大伟 安学军 《计算机研究与发展》 EI CSCD 北大核心 2018年第4期815-830,共16页
目前IDC数据中心内部由于网络攻击或网络配置等原因路由会经常变化,然而由于缺乏有效的监控软件,路由异常、路由抖动难以发现,故障难以定位.数据中心业务出现网络故障时无法确认故障点导致修复时间延长、用户体验降低和运营收入减少等问... 目前IDC数据中心内部由于网络攻击或网络配置等原因路由会经常变化,然而由于缺乏有效的监控软件,路由异常、路由抖动难以发现,故障难以定位.数据中心业务出现网络故障时无法确认故障点导致修复时间延长、用户体验降低和运营收入减少等问题.分析了当前主流数据中心的网络架构、通信协议和路由计算原理,提出了一种基于链路状态数据库(link state database,LSDB)的数据中心网络异常检测方法 LSAP,该方法通过搜集LSDB,使用改进路由算法计算全网路由形成路由择域信息库(routing information base,RIB),根据LSDB快照和RIB快照比对准确关联链路变化和路由变化,发现链路异常、路由异常,能够定位故障.LSAP基于大数据分析平台实时计算路由表,能够实现秒级处理上亿条路由信息,满足当前数据中心对于分析速率的要求.通过在数据中心网络中部署试用,LSAP能够快速发现拓扑变化、复原路由表,统计分析所有路由变化,先于业务发现路由异常、路由攻击,且对网络改动很少,被动搜集数据不影响网络自身稳定性,适用对稳定性要求较高的数据中心部署. 展开更多
关键词 数据中心网络 链路状态数据库 路由表 路由异常 快速定位
下载PDF
提升稀疏目录缓存一致性系统性能的方法 被引量:3
10
作者 张轮凯 宋风龙 +2 位作者 王达 范东睿 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1955-1970,共16页
稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access,ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升... 稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access,ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用(least-recent-used,LRU)算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者(least-sharer-count,LSC)算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录(victim directory),该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录(selective victim directory)技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息(probe messages),从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间. 展开更多
关键词 ccNUMA系统 稀疏目录 替换算法 victim目录 选择性victim目录
下载PDF
中国CAE软件发展的新契机 被引量:7
11
作者 田荣 《计算机辅助工程》 2011年第1期141-143,147,共4页
针对中国超级计算机的发展取得世界瞩目的成绩,但硬件高性能与应用低水平的矛盾比较突出的问题,从计算技术的发展趋势入手,根据千万亿次计算的物理学特点,分析我国面对的历史性机遇,建议充分发挥我国超级计算平台的基础性优势,以突破市... 针对中国超级计算机的发展取得世界瞩目的成绩,但硬件高性能与应用低水平的矛盾比较突出的问题,从计算技术的发展趋势入手,根据千万亿次计算的物理学特点,分析我国面对的历史性机遇,建议充分发挥我国超级计算平台的基础性优势,以突破市场上国外CAE软件在计算规模、分辨率和精度方面的局限以及技术封锁为出发点,发展以高可扩展、可容错的大规模并行计算技术为基本支撑的新一代CAE软件,从而在高端软件市场上实现国家战略诉求和中国CAE软件的自主性. 展开更多
关键词 千万亿次计算 超级计算机 众核 高性能计算 CAE软件
下载PDF
信息处理中的DSP技术 被引量:3
12
作者 张亮 马莉波 《微处理机》 2000年第1期6-7,16,共3页
首先对信息处理中 DSP(Digital Signal Processor)技术的发展历程、主要特点进行了全面的阐述。然后针对 DSP系统设计时遇到的器件选择问题作了比较与分析 ,并得出了通用性的指导方法。最后 ,介绍了目前最好的 DSP的性能及其特点。
关键词 信息处理 数字信号处理器 系统设计 DSP
下载PDF
基于单根I/O虚拟化的多根I/O资源池化方法 被引量:8
13
作者 王展 曹政 +4 位作者 刘小丽 苏勇 李强 安学军 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期83-93,共11页
虚拟化技术在为现代数据中心提供高效的服务器整合能力和灵活的应用部署能力的同时,也对数据中心服务器的I/O系统设计提出了新的需求,现有I/O资源与服务器紧密绑定的I/O体系架构将产生成本上升、资源冗余、I/O连线复杂化等一系列问题.... 虚拟化技术在为现代数据中心提供高效的服务器整合能力和灵活的应用部署能力的同时,也对数据中心服务器的I/O系统设计提出了新的需求,现有I/O资源与服务器紧密绑定的I/O体系架构将产生成本上升、资源冗余、I/O连线复杂化等一系列问题.针对上述问题,提出了一种基于单根I/O虚拟化协议(single root I/O virtualization,SR-IOV)的多根I/O资源池化方法:基于硬件的多根域间地址和ID映射机制,实现了多个物理服务器对同一I/O设备的共享复用,有效减少单体服务器所需的设备数量和连线数量,并进一步提高服务器密度;同时提出虚拟I/O设备热插拔技术和多根共享管理机制,实现了虚拟I/O资源在服务器间的实时动态分配,提高资源的利用效率.提出的方法在可编程逻辑器件(fieid-programmable gate array,FPGA)原型系统中进行了验证,其评测表明,方法能够在实现多根I/O虚拟化共享的同时,保证各个根节点服务器获得近乎本地直连设备的I/O性能. 展开更多
关键词 数据中心 服务器 I/O虚拟化 I/O资源池 PCIe兼容
下载PDF
面向应用服务级目标的虚拟化资源管理 被引量:14
14
作者 文雨 孟丹 詹剑锋 《软件学报》 EI CSCD 北大核心 2013年第2期358-377,共20页
在虚拟环境中实现应用服务级目标,是当前数据中心系统管理的关键问题之一.解决该问题有两个方面的要求:一方面,在虚拟化层次和范围内,能够动态和分布式地按需调整虚拟机资源分配;另一方面,在虚拟化范围之外,能够控制由于虚拟机对非虚拟... 在虚拟环境中实现应用服务级目标,是当前数据中心系统管理的关键问题之一.解决该问题有两个方面的要求:一方面,在虚拟化层次和范围内,能够动态和分布式地按需调整虚拟机资源分配;另一方面,在虚拟化范围之外,能够控制由于虚拟机对非虚拟化资源的竞争所导致的性能干扰,实现虚拟机性能隔离.然而,已有工作不适用于虚拟化数据中心场景.提出一种面向应用服务级目标的虚拟化资源管理方法.首先,该方法基于反馈控制理论,通过动态调整虚拟机资源分配来实现每个应用的服务器目标;同时,还设计了一个两层结构的自适应机制,使得应用模型能够动态地捕捉虚拟机资源分配与应用性能的时变非线性关系;最后,该方法通过仲裁不同应用的资源分配请求来控制虚拟机在非虚拟化资源上的竞争干扰.实验在基于Xen的机群环境中检验了该方法在RUBiS系统和TPC-W基准上的效果.实验结果显示,该方法的应用服务级目标实现率比两种对比方法平均高29.2%,而应用服务级目标平均偏离率比它们平均低50.1%.另一方面,当RUBiS系统和TPC-W基准竞争非虚拟化的磁盘I/O资源时,该方法通过抑制TPC-W基准28.7%的处理器资源需求来优先满足RUBiS系统的磁盘I/O需求. 展开更多
关键词 虚拟化 数据中心 多层应用 资源管理 服务级目标 控制论 线性二次方法 聚类算法
下载PDF
基于距离直方图的最优视点选择 被引量:15
15
作者 曹伟国 胡平 +1 位作者 李华 林宗楷 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第9期1515-1521,共7页
基于物体内蕴几何量,提出一种观察三维物体的最优视点选择方法.首先在三维物体表面均匀采样获取采样点,并计算物体形心,然后利用采样点到物体形心的距离来构造距离直方图,最后计算距离直方图的Shannon熵并将其作为衡量视点优劣的标准.... 基于物体内蕴几何量,提出一种观察三维物体的最优视点选择方法.首先在三维物体表面均匀采样获取采样点,并计算物体形心,然后利用采样点到物体形心的距离来构造距离直方图,最后计算距离直方图的Shannon熵并将其作为衡量视点优劣的标准.根据认知心理学理论,最优视点是存在的,也是恒定的,故文中视点在包围球上选取.实验结果表明,采用该方法获得的最优视点能观察到三维物体更多的功能结构和更显著特征,与其他方法相比更符合人类的感官选择. 展开更多
关键词 最优视点 Shannon熵 距离直方图
下载PDF
千万亿次可扩展可容错自由网格数值模拟系统 被引量:3
16
作者 黎雷生 王朝尉 +2 位作者 马志涛 霍志刚 田荣 《计算机研究与发展》 EI CSCD 北大核心 2015年第4期823-832,共10页
在千万亿次计算能力的驱动下,数值软件的发展进入了一个以海量并行为基本特征的历史转折期,可扩展和可容错成为大规模数值模拟的两大关键技术.petaPar模拟程序是以对传统数值技术形成优势互补的无网格类方法为切入点,面向千万亿次级计... 在千万亿次计算能力的驱动下,数值软件的发展进入了一个以海量并行为基本特征的历史转折期,可扩展和可容错成为大规模数值模拟的两大关键技术.petaPar模拟程序是以对传统数值技术形成优势互补的无网格类方法为切入点,面向千万亿次级计算而开发的下一代新兴通用数值模拟程序.petaPar在统一架构下实现了光滑粒子动力学(smoothed particle hydrodynamics,SPH)和物质点法(material point method,MPM)两种最为成熟和有效的无网格/粒子算法,支持多种强度、失效模型和状态方程;其中MPM支持改进的接触算法,可以处理上百万离散物体的非连续变形和相互作用计算.系统具有以下特点:1)高可扩展.实现单核单Patch极端情形下计算和通信的完全重叠,支持动态负载均衡;2)可容错.支持无人值守变进程重启动,在系统硬件出现局部热故障时可以不中止计算;3)适应硬件体系结构异构架构的变化趋势,同时支持flat MPI和MPI+Pthreads并行模型.程序在Titan千万亿次超级计算机上进行了全系统规模的可扩展性测试,结果表明该代码可线性扩展到26万个CPU核,SPH和MPM的并行效率分别为100%和96%. 展开更多
关键词 千万亿次计算 无网格/粒子模拟 高可扩展 高可容错 多线程 动态负载平衡
下载PDF
T-NBC:透明的MPI非阻塞集合操作 被引量:3
17
作者 李强 孙凝晖 +1 位作者 霍志刚 马捷 《计算机学报》 EI CSCD 北大核心 2011年第11期2052-2063,共12页
在不修改应用程序的前提下,在MPI通信库中将阻塞的集合操作转化为非阻塞的实现可以将集合通信与紧跟在集合操作之后的计算重叠起来,从而提高应用的性能.在应用中,集合操作之后的计算包括集合通信无关的计算和集合通信相关的计算两类.集... 在不修改应用程序的前提下,在MPI通信库中将阻塞的集合操作转化为非阻塞的实现可以将集合通信与紧跟在集合操作之后的计算重叠起来,从而提高应用的性能.在应用中,集合操作之后的计算包括集合通信无关的计算和集合通信相关的计算两类.集合通信可以与前者很好地重叠;由于后者需要访问通信数据,与后者的重叠和集合通信中多个集合子消息的通信顺序密切相关.在该文中,我们实现了对应用透明的非阻塞集合操作T-NBC(Transparent Non-Blocking Collective operations).T-NBC不但将集合通信与集合通信无关的计算充分重叠起来,而且为了进一步增大集合通信与集合通信相关计算的重叠,它可根据应用访问多个集合子消息的顺序赋予这些子消息不同的通信优先级.微基准测试显示,T-NBC可以将绝大部分的集合通信与集合操作之后的计算重叠起来.在NPB(NAS Parallel Benchmarks)测试FT(Fourier Transform)和IS(Integer Sort)中,尽管集合操作之后的计算主要为集合通信相关的计算,但很大部分的集合通信时间被重叠,它们的性能分别提高了5%和36%. 展开更多
关键词 透明 非阻塞 集合操作 重叠 优先级
下载PDF
协作式全局指令调度与寄存器分配 被引量:3
18
作者 吴承勇 连瑞琦 +1 位作者 张兆庆 乔如良 《计算机学报》 EI CSCD 北大核心 2000年第5期493-499,共7页
指令级并行是现代高性能处理器的重要特征 .对于发挥这类处理器所具有的并行处理能力来说 ,编译器有至关重要的影响 .文中讨论指令级并行编译中的核心问题——全局指令调度与寄存器分配 ,并以作者为一种新型的显式并行体系结构微处理器... 指令级并行是现代高性能处理器的重要特征 .对于发挥这类处理器所具有的并行处理能力来说 ,编译器有至关重要的影响 .文中讨论指令级并行编译中的核心问题——全局指令调度与寄存器分配 ,并以作者为一种新型的显式并行体系结构微处理器研制的编译系统为背景 ,介绍了此类编译器后端设计中面临的指令调度与寄存器分配的时序问题 。 展开更多
关键词 指令级并行 全局指令调度 寄存器分配 编译系统
下载PDF
一类等距不变量及其在三维表情人脸识别中的应用 被引量:4
19
作者 胡平 曹伟国 李华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第12期2089-2094,共6页
提出一种适用于三维人脸的等距不变量构造方法.从等距变换的定义和性质出发,选取曲面在等距变换下的最小不变几何基元构造不变核;按照到鼻尖测地距离的不同将三维人脸表面划分成多层次区域;在多层次区域上对不变核进行积分,得到等距不变... 提出一种适用于三维人脸的等距不变量构造方法.从等距变换的定义和性质出发,选取曲面在等距变换下的最小不变几何基元构造不变核;按照到鼻尖测地距离的不同将三维人脸表面划分成多层次区域;在多层次区域上对不变核进行积分,得到等距不变量,并将其用于表情变化的三维人脸识别.实验结果表明,该方法综合考虑了多种曲面内在几何特征,抗噪性强,较Laplace-Beltrami算子等有较高的识别精度. 展开更多
关键词 不变几何基元 等距不变量 多层次区域 三维人脸表情变化
下载PDF
快速反投影软影绘制算法 被引量:4
20
作者 周炜 刘浏 李华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2011年第8期1285-1293,共9页
针对已有的软阴影映射技术允许在使用一张阴影贴图的条件下对复杂的动态场景实时渲染出比较真实的软影,而在处理大面积软影时算法的执行效率不高的问题,通过创建一种新的边界存储结构,提出了一种快速软影生成算法.该算法是一种3遍算法:... 针对已有的软阴影映射技术允许在使用一张阴影贴图的条件下对复杂的动态场景实时渲染出比较真实的软影,而在处理大面积软影时算法的执行效率不高的问题,通过创建一种新的边界存储结构,提出了一种快速软影生成算法.该算法是一种3遍算法:第一遍从光源中心计算场景的深度图;第二遍采用边缘提取算子对深度图进行滤波,找到所有可能的边界点;第三遍查询可能的边界点,计算其对应的轮廓边,再反投影轮廓边到光源区域计算轮廓边的遮挡贡献,最后累积所有边界点的遮挡贡献得到着色点的可见性,生成真实的软影效果.实验结果表明,与现有算法相比,文中算法在现有图形硬件中执行效率更高. 展开更多
关键词 软影 面光源 轮廓边提取 像素着色器
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部