案例推理技术已经成为故障诊断、管理辅助决策、专家系统等实现的重要手段.现有的案例推理算法针对海量案例集时,普遍存在检索效率不高问题.设计了一种带权重的多维案例推理算法(Weighted DimensionReduction and R-tree,WDRR),该算法结合案例的多维特征权重,将多维案例降维成二维案例点,并在此基础上建立R树空间索引;案例检索时首先借助R树索引,确定案例的二维点所在,再结合二次权重和K近邻(KNN)算法进行精确过滤,根据相似度阈值输出案例推理的结果,并完成案例学习和索引修正.实验证明该方法针对海量案例集的检索效率和准确率都有较大的提升.
采用分布式来实现SPARQL(Simple Protocol and RDF Query Language)查询是解决海量RDF(Resource Description Framework)查询的一种新思路。目前实现的基于Hadoop的RDF查询都要启用多个MapReduce来完成任务,浪费时间。为了克服此缺点,提出MRQJ(using MapReduce to query and join)算法,用以实现SPARQL的分布式查询。该算法分为连接计划生成与SPARQL查询执行两个部分:连接计划生成采用贪心策略,生成最优的连接方案;在SPARQL查询执行中只需结合一次MapReduce计算即可得到查询结果。在LUBM数据集上进行的测试实验表明:在查询语句较为复杂的情况下,MRQJ方法的查询效率具有明显的优势。