王丹妮
- 作品数:6 被引量:15H指数:3
- 供职机构:辽宁省电力有限公司更多>>
- 相关领域:自动化与计算机技术更多>>
- 大数据环境下的数据治理框架研究及应用被引量:2
- 2018年
- 引言:随着信息技术的不断成熟与发展,信息化建设是各个企业发展的必然趋势,这为各个企业的发展创造了良好的机遇,同时在数据标准、数据质量与安全隐私问题面临着严峻的挑战。在大数据背景下,各个企业都在进行着信息化建设,与此同时,数据也呈现出飞速增长的趋势。因此,提升数据的质量以及对数据中价值的有效挖掘日益凸显出其重要性。本文首先对大数据环境下数据治理框架进行了详细而又充分的阐述,其次,对数据治理的需求与应用进行了研究,这位大数据环境下数据治理水平的提升提供了一定的参考价值与依据。
- 冉冉刘颖胡楠王丹妮曲睿婷
- 关键词:数据环境信息化建设数据质量
- 融合用户信任模型的协同过滤推荐算法被引量:5
- 2016年
- 协同过滤推荐是电子商务系统中最为重要的技术之一.随着电子商务系统中用户数目和商品数目的增加,用户-项目评分数据稀疏性问题日益显著.传统的相似度度量方法是基于用户共同评分项目计算的,而过于稀疏的评分使得不能准确预测用户偏好,导致推荐质量急剧下降.针对上述问题,本文考虑用户评分相似性和用户之间信任关系对推荐结果的影响,利用层次分析法实现用户信任模型的构建,提出一种融合用户信任模型的协同过滤推荐算法.实验结果表明:该算法能够有效反映用户认知变化,缓解评分数据稀疏性对协同过滤推荐算法的影响,提高推荐结果的准确度.
- 杨秀梅孙咏王丹妮李岩
- 关键词:协同过滤信任模型层次分析法推荐系统
- 自底向上构建高效BVH的研究被引量:3
- 2016年
- 光线追踪中,加速结构对于减少光线与几何体求交的计算量起到了不可或缺的作用,找到一种高效的加速结构仍然是本领域的研究热点之一.传统的加速结构如BVH,都是自顶向下的构建方式,由于其本身的限制,构造出的加速结构往往不是最优的.为了改进自顶向下的缺陷,提出了一种自底向上BVH的构建方式,它使用了BVH和空间划分的混合结构,并引入了一种改进的表面积启发代价函数和多个构建参数来优化最后的构建结果.最后实验表明,此文中提出的方式比传统的BVH与KD-Trees有更好的加速效果,可以实现对前两者5%-10%的提速.最后,文中还给出了一些加速方案来减少构建时间.
- 唐宇于放孙咏王丹妮
- 关键词:光线追踪自底向上BVHSAH
- 应用语义相似的海量网页文本去重策略研究被引量:2
- 2016年
- 互联网的高速发展使得信息的获取以及发布几乎变的无成本,因此不免会存在着大量的近似网页,这些网页之间仅仅只有少量的内容是不同的,但其要传递的信息主体却是一致的.而搜索引擎在从互联网上抓取数据时,必须能够准确的检测出近似网页并放弃抓取.主要针对中文网页,改进了提取中文文本内容特征及计算其权值的方法,同时结合词语之间的语义联系,提出利用特征之间的语义相似性生成网页指纹的方法.在大规模真实网页数据集上,利用分布式编程模型进行实验,近似网页检测的效果得到了明显的提升,更加适用于当今海量数据环境下.
- 薛剑吕立孙咏王丹妮
- 关键词:语义相似特征提取
- 面向模拟演练系统的延迟渲染框架
- 2016年
- 模拟演练系统为企业和应急部门提供了强大的服务,然而目前的模拟演练系统中存在缺乏现代图形流水线,多光源情况下存在场景渲染计算量过多,不能充分利用硬件而导致的渲染效果差等问题.为了解决这些问题,本文针对模拟演练系统,设计和实现了延迟渲染流水线,它依据Blinn-Phong光照模型,构建了一种压缩的G-Buffer布局,并使用Light Volume来对光源进行建模.最后实验表明,在多光源情况下,此文中提出的延迟渲染比传统的正向渲染有更高的效率.
- 唐宇于放孙咏王丹妮
- 关键词:LIGHTVOLUME
- 应用位置信息损失的Listwise排序学习方法的研究被引量:3
- 2017年
- 排序学习是机器学习与信息检索相互结合的研究领域,它利用机器学习的方法自动调节参数、综合多种排序特征、同时可以避免过拟合,进而得到新的排序模型用于排序被检索的文档.在排序学习方法中,Listwise方法的排序效果相对较好,但是目前已有的属于此类学习算法也有很多缺点:由于是基于列表所有的置换进行训练,时间复杂度太高;其损失函数并未充分利用极其重要的排序位置信息.本文基于此提出了新的学习算法,引入了位置信息损失因子,构建了新的损失函数,同时使用了效率更高的训练方法.最后在LETOR 4.0数据集上的实验结果表明,新学习算法的排序性能得到了较为明显的提升.
- 薛剑吕立孙咏王丹妮
- 关键词:信息检索损失函数