房祥
- 作品数:3 被引量:20H指数:3
- 供职机构:北京拓尔思信息技术股份有限公司更多>>
- 发文基金:北京市教委科技发展计划国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文专利文献术语抽取被引量:10
- 2013年
- 为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
- 徐川施水才房祥吕学强
- 基于特定目标的Radon变换模糊图像研究被引量:5
- 2013年
- 对运动模糊图像进行恢复处理需要两个关键参数的支持:模糊角度和模糊长度。为此,提出了一种时间复杂度比传统Radon变换更低的新方法对频域中的图像进行角度检测。根据傅里叶频谱的特性,新方法以扇形方式展开,扫描出一条穿过圆心且亮度最大的直线,该直线的倾斜角度为频域图像中平行条纹的倾斜角度;利用Radon变换的性质将先前求得的模糊角度进行投影求和得到模糊长度。实验结果表明,新方法不仅降低了时间复杂度,还提高了模糊角度和模糊长度检测的准确性。
- 杨梅施水才房祥吕学强
- 关键词:RADON变换
- 基于改进的潜在语义分析的文本聚类被引量:5
- 2012年
- 文本聚类中不同文本表示方法获得的聚类效果不尽相同。引入潜在语义分析模型对文本进行表示,重新给出了针对潜在语义分析的特征权重计算方法,并提出了截断奇异值分解中K值的选取方法,达到了"词-文本"空间的降维去噪目的。鉴于K-means算法中初始聚类中心选取具有一定的随机性,应用相似性初始聚类中心选取方法确定了K-means的初始聚类中心,避免了随机选取聚类中心对聚类效果的影响。基于改进的潜在语义分析方法极大的降低了文本空间的维度,经实验证明改进后的方法在聚类问题中聚类效果显著。
- 宋涛施水才房祥吕学强
- 关键词:潜在语义分析奇异值分解K-MEANS文本聚类