丁菲菲
- 作品数:3 被引量:1H指数:1
- 供职机构:安徽工业大学计算机科学与技术学院更多>>
- 发文基金:安徽省高校省级自然科学研究项目国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于平均信息熵的中文问句关键词提取被引量:1
- 2014年
- 关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于TFIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在停用词过滤的基础上计算问句中每个词的平均信息熵,以词的信息熵值直接体现该词在问句中的重要性;同时在关键词提取过程中,通过设定不同提取比例,并在不同提取比例下观察评价标准值,以最佳提取比例获取更为合适的关键词。实验结果表明,与传统的TFIDF等其他方法相比,该方法的查准率、查全率以及F1测度值都得到显著提高。
- 丁菲菲杨思春刘仁金
- 关键词:关键词提取TFIDF
- 面向中文问答社区的问题去重技术研究
- 2014年
- 基于《知网》语义知识资源,提出一种基于问句相似度计算的问答社区问题去重方法。通过计算已有问题集合中问题间的语义相似度,将其中重复度较高的问题进行筛选并去除,从而提高用户获取所需信息的效率,改善用户体验。在"爱问知识人"的真实问题集上的实验结果表明:该方法获得了较好的去重效果。
- 彭月娥杨思春李心磊丁菲菲向恒月
- 关键词:相似度相似度计算
- 基于冲突对象集的决策系统分配约简算法
- 2015年
- 目前对不一致不完备决策系统的粗糙集属性分配约简研究较少,研究不一致不完备决策系统的分配约简更具有实际应用价值。基于此,提出一种基于冲突对象集的不一致不完备决策系统分配约简方法。通过定义冲突对象集的概念,给出计算核属性集和属性重要性的方法;在此基础上,给出求解不一致不完备决策系统分配约简的算法。理论分析和实例结果表明,该方法显著降低了分配约简求解的空间复杂度,更加适合大规模数据库。
- 向恒月杨思春丁菲菲王雷
- 关键词:决策系统分配约简