谢晓芹
- 作品数:33 被引量:193H指数:8
- 供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理核科学技术更多>>
- 一种新颖的医学图像建模及相似性搜索方法
- 图像采集和存储技术的发展导致了相关数据的飞速增长,这些医学图像数据能够有效地辅助医生进行精确的诊断,但由于医学图像在相似性搜索方面要求图像匹配的精度远高于普通图像,所以目前仍没有一种有效的方法解决医学图像的相似性搜索问题...
- 潘海为李鹏远韩启龙谢晓芹张志强高琳琳
- 关键词:数据库系统医学图像
- 基于关联图模型的医学图像Top-k查询方法
- 2015年
- 找到与病人具有相似纹理特征的医学图像,有助于医生结合历史病历信息对病人作出更为准确的诊断.基于此,大量的研究工作围绕如何提高基于内容的医学图像检索技术的准确性展开.然而,现有的基于内容的医学图像检索技术均是基于查询图像与数据库中图像的逐张匹配过程,面对迅速增长的医学图像数量,查询等待时间过长成为医学图像检索领域的另一主要问题.鉴于用户往往只对前k(Top-k)个检索结果感兴趣,提出了一种基于关联图模型的医学图像Top-k查询方法.首先,提出一种关联图模型,使用该模型可以有效地刻画医学图像之间关联关系的模糊性;继而利用关联图模型,提出一系列关联性度量计算方法,从而使得仅需对图像匹配一次即可更新所有图像与查询图像之间的相似度范围.由此,提出Top-k查询方法以及基于游走的查询优化策略.实验证明提出的方法可以有效地减少图像匹配次数,降低时间复杂度.
- 李鹏远潘海为李青韩启龙谢晓芹张志强
- 关键词:关联图TOP-K查询图像检索医学图像
- 基于特征学习的广告点击率预估技术研究被引量:19
- 2016年
- 搜索广告中的点击率预估问题在信息检索和机器学习等领域一直是研究的热点.目前通过设计特征提取方案获得特征和针对用户点击行为建模等方法,并没有充分考虑广告数据具有的高维稀疏性、特征之间存在高度非线性关联的特点,致使信息利用不充分.为了降低数据稀疏性和充分挖掘广告数据中隐藏的规律,该文提出了面向广告数据的稀疏特征学习方法.该方法基于张量分解实现特征降维,并充分利用深度学习技术刻画数据中的非线性关联,以解决高维稀疏广告数据的特征学习问题,实验结果验证了文中提出的方法能够有效地提升广告点击率的预估精度,达到了预期效果.
- 张志强周永谢晓芹潘海为
- 关键词:搜索广告点击率张量分解社交网络社会媒体
- 基于KAP有向图模型的医学图像分类算法被引量:4
- 2016年
- 脑部CT图像拥有良好的纹理特性且图像间纹理角点的位置近似相同.基于此原因,文中提出基于K最近邻纹理角点(KAP)有向图模型的医学图像分类算法.首先提出面向纹理的角点提取方法;然后针对提取的角点,结合医学图像的固有特点,提出KAP有向图模型用于描述医学图像;最后基于KAP有向图模型提出医学图像分类算法.实验表明,文中算法在时间复杂度和准确度方面都取得较好结果.
- 吴枰潘海为高琳琳韩启龙谢晓芹冯晓宁
- 关键词:医学图像纹理角点图模型
- 一种针对社会化导购的橙领推荐方法研究被引量:1
- 2016年
- 社交网络和网络购物的发展普及导致了社会化导购的产生和发展,也催生了通过在社交网络中推荐产品从而获取利润的"橙领".通过对橙领相关技术的研究,能更透彻地了解基于社会网络的产品营销机制以及探索社会化导购的底层模式.目前国内外少有这方面研究.因此,文中针对橙领的自身定位问题和面向用户或商家的橙领推荐问题,提出一种针对社会化导购的橙领推荐方法,主要包括3个算法:橙领定位算法、面向用户的橙领推荐算法OCRA4U(Orange Collar Recommending Algorithm for User)和面向商家的橙领推荐算法OCRA4S(Orange Collar Recommending Algorithm for Shop).橙领定位算法依据橙领的推荐历史对橙领进行定位特征向量化描述,最终转化为一个聚类问题进行解决.OCRA4U考虑了橙领在社交网络中的影响力和橙领与用户需求的匹配度,得到橙领推荐列表.OCRA4S结合橙领在网络中的影响力以及橙领的历史推荐产品,推荐出最符合商家产品需求的橙领列表.基于新浪微博数据集和DBLP数据集,文中设计并实现了3个相关实验:橙领定位算法实验、橙领推荐实验以及社会化数据影响实验,实验结果验证了所提算法的准确性和可行性.
- 谢晓芹韩帅吕斌张志强潘海为
- 关键词:网络影响力社会媒体社交网络推荐系统
- 一种有效的本体排序算法MIDSRank被引量:6
- 2011年
- 本体已经在很多的领域中得到了广泛的应用,网络上的本体也越来越多,为了节约本体构建的成本避免从头构建本体,人们经常首先从网络上获取候选者,然后再以此为基础构建自己的本体.而随之而来的本体排序问题则成为一个研究热点.通过对现有本体排序算法的总结与分析,将现有本体排序算法划分为两大类,分别阐述了其基本思想以及存在的问题.然后,提出了一种经过改进的本体排序方法,该方法结合了原有方法的优点并提高了本体搜索的质量.最后讨论了未来研究的方向和注意事项.
- 张志强宋伟涛谢晓芹
- 关键词:本体
- 众包质量控制策略及评估算法研究被引量:59
- 2013年
- 随着Internet技术的快速发展,众包作为一种灵活有效的解决问题方式,开始受到人们越来越多的关注.由于众包的自由松散组织模式,使得如何有效地控制任务完成质量,并将欺骗类型工作者识别出来,成为目前众包研究中一个急需解决的问题.文中基于对众包工作者提交结果的评估与分析,提出了一种阶段式的动态质量控制策略,同时给出了一个组合式众包结果质量评估方法框架.经过实际数据的测试,文中提出的质量控制策略和众包结果质量评估方法具有较好的效果.
- 张志强逄居升谢晓芹周永
- 关键词:检测点
- 利用控制关系分析优化不确定数据Top-k查询
- 2012年
- 由于概率维的存在,使得准确高效地处理不确定数据的Top-k查询成为一个急需解决的难题。提出了一种利用控制关系分析(dominate relationship analysis,DRA)的不确定数据Top-k查询算法。该算法通过分析元组之间的控制关系,将那些最有可能成为Top-k查询结果的元组选择出来,这样大大减少了参加运算的元组数量,显著提升了查询效率。并且在数据库更新时,能够判断出此更新是否影响到之前得到的查询结果,从而决定是否需要重查,减少了重查的计算量。
- 张志强魏小燕谢晓芹
- 关键词:不确定数据
- 个性化的社会标签查询扩展技术研究被引量:8
- 2010年
- 随着互联网上的信息日益增长,个性化的搜索需求越来越迫切,由于用户兴趣的不同和行为的差异,如何为不同的用户提供不同的检索结果成为一个具有挑战性的问题。首先对现有搜索引擎的个性化信息检索和查询扩展技术进行了分类总结,分析了它们各自的优缺点。然后提出了基于社会化标签的个性化查询词扩展方法。这些方法通过从用户所收藏的社会化标签或标签所对应的网页中提取出和用户查询词相关的词,来对用户的初始查询进行扩展。最后利用Delicious网站上的用户数据,对比研究了这几种个性化查询扩展算法。通过与Google进行对比分析实验,结果表明所提出的社会化标签的个性化查询词扩展方法能够较好地满足用户的个性化需求,检索结果比Google的检索结果更接近用户需求。
- 张志强孟庆海谢晓芹
- 关键词:个性化搜索查询词扩展社会化标签
- 一种新颖的医学图像建模及相似性搜索方法被引量:4
- 2013年
- 医学图像采集和存储技术的发展导致了相关数据的飞速增长,这些医学图像数据能够有效地辅助医生进行精确的诊断,但由于医学图像在相似性搜索方面要求图像匹配的精度远高于普通图像,所以目前仍没有一种有效的方法解决医学图像的相似性搜索问题.文中首先提出一种不确定定点图模型(ULG,Uncertain Locationgraph),并针对脑部CT图像的固有特点,提出一种基于脑部CT图像纹理的从图像到不确定定点图的建模方法,继而提出一种基于不确定定点图的相似性搜索算法,并通过一种有效的索引结构,有效地减少了无意义的查询处理,降低了搜索时间.实验结果表明,该方法可以更精确地找出具有相似纹理的脑部CT图像.
- 潘海为李鹏远韩启龙谢晓芹张志强高琳琳
- 关键词:图像建模医学图像相似性搜索