中央高校基本科研业务费专项资金(2010HGXJ0714)
- 作品数:2 被引量:10H指数:2
- 相关作者:胡学钢刘应玲王海平谢飞侯宝剑更多>>
- 相关机构:合肥工业大学合肥师范学院中国科学技术大学更多>>
- 发文基金:中央高校基本科研业务费专项资金中国博士后科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于通配符和长度约束的近似模式匹配算法被引量:6
- 2013年
- 针对近似模式匹配算法在处理带有灵活通配符和长度约束近似模式匹配(APMWL)问题时只能解决替换操作,提出一种基于动态规划的编辑距离矩阵(EDM)构造方法,设计了基于EDM的近似模式匹配算法APM,可以处理近似匹配中的三种编辑操作,即插入、替换和删除操作。此外,根据文本中字符是否允许被重复使用的约束条件,设计APM-OF算法。实验结果表明,APM和APM-OF与同类算法相比具备显著的优势:与Sail_Approx匹配算法实验对比,获取解的平均增长率分别达到8.34%和12.37%;将APM-OF算法应用至模式挖掘中,挖掘出的频繁近似模式个数为OneoffMining算法的2.07倍。
- 黄国林郭丹胡学钢
- 关键词:通配符
- 基于后缀树的带有通配符的模式匹配研究被引量:7
- 2012年
- 由于在生物序列分析、文本索引、网络入侵检测等领域的应用需求,带有通配符的模式匹配问题一直是研究的热点。针对已有的研究工作中通配符和长度约束具有较强的局限性问题,研究带有灵活通配符的模式匹配问题,其中通配符可以在模式的任意两子串间出现且可以指定灵活的长度约束。采用非线性数据结构——后缀树,设计了求解模式所有解的完备算法PAST。预处理阶段采用在线增量式算法构建具有文本先验知识的后缀树,搜索阶段结合动态规划的思想,逐个匹配模式中字符,最终得到完备解。在基因序列上的实验表明,PAST比其他算法具有更好的时间性能。
- 侯宝剑谢飞胡学钢刘应玲王海平
- 关键词:通配符后缀树