国家自然科学基金(61003311) 作品数:37 被引量:168 H指数:7 相关作者: 郑啸 方木云 王小林 邰伟鹏 刘辉 更多>> 相关机构: 安徽工业大学 东南大学 中国矿业大学 更多>> 发文基金: 国家自然科学基金 安徽省高校省级自然科学研究项目 安徽省教育厅重点基金 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 更多>>
改进的基于知网的词语相似度算法 被引量:39 2011年 词语相似度计算在文本分类、问答系统、机器翻译、文本聚类等有着广泛的应用。词语相似度计算的研究工作一般都是基于《知网》的义原的层面上,根据义原之间的距离和义原本身的层次深度,进行词语相似度的计算。基于以上研究,提出了一种新的改进的词语相似度算法,首先根据义项中各类义原的个数不同,提出了一种新的变系数义项相似度计算方法;其次从词性的角度,认为词语义项中的不同词性对词语相似度的贡献度不同,剔除不同词性义项之间的组合。实验结果证明,改进的算法结果在原有基础上得到较好的提升,大幅度降低了相似度计算的复杂度,提高了运算效率。 王小林 王义关键词:词语相似度 知网 词性 一种新的三环网络TL(N;1,s,s+1)直径求解方法 被引量:3 2012年 基于多环网络的直径是衡量网络效率的重要指标,提出了一种新的有向三环网络TL(N;1,s,s+1)的直径求解方法——等价三叉树方法,并得到了一种新的直观图——三叉树.采用C#语言和SQL Server2000仿真实现了三叉树的结构模型.研究了该三叉树的性质,给出了三叉树的构造算法.找到了该族三环网络直径d(N;1,s,s+1)最大值、最小值的分布规律.仿真结果表明:直径的最大值随N值的增加呈有规律的锯齿状波动增加,直径的最小值随N值的增加呈有规律的阶梯状增加,并给出了直径d(N;1,s,s+1)的上界与下界的显式公式. 邰伟鹏 岳建华 方木云关键词:三环网络 三叉树 直径 有向三环网络的六角环模型构造法 2014年 多环网络的直径是衡量网络效率的重要指标,提出一种新的有向三环网络TL(N;s1,s2,s3)(其中N=s1+s2+s3,s1≠s2≠s3,gcd(N;s1,s2,s3)=1)构造方法,得到其直观模型———六角环.研究并证明了六角环的一些性质,给出了有向三环网络直径d(N;s1,s2,s3)的显式公式.利用C#和SQL SERVER2008仿真出若干结果,实验结果显示该三环网络的构造方法实用有效.通过对仿真结果的分析,得到了一类特殊的三环网络TL(N;s1,s2,s3),当N=1+6(1+…+c),s1=c2,s2=(c+1)2,s3=N-s1-s2时,其直径d(N;s1,s2,s3)=2c,宽直径为d3(N;s1,s2,s3)=2c+2.该构造方法较传统的超L型瓦方法简单,又较三叉树构造法实用,在二维平面上就能得到一个简单、直观模型,并且仅需要分析环数c与位数pos这2个参数,就能求解出有向三环网络的直径. 邰伟鹏 徐宏 王小林关键词:直径 仿真 双环网络G(N;1,s)的L形瓦仿真算法改进 被引量:1 2012年 利用仿真来研究双环网络L形瓦,在国内外文献中尚不多见,文献[1]提出了一种仿真算法,文献[2]使用数组对文献[1]的算法作了改进.其不足之处是使用了过多过长的中间数组,影响了仿真速度.针对这一不足,根据L形瓦的h边特性,使用了更少更短的数组改进了文献[2]的算法,实验结果表明,改进的算法极大地提高了仿真速度.此外还给出了L形瓦的h边分布特点,并作了进一步分析. 苏小虎 方木云 邰伟鹏 郑啸关键词:双环网络 仿真 紧优 基于本体的Web服务可靠性动态评估方法 被引量:4 2012年 为解决现有Web服务可靠性评估方法中存在的语义支持问题,构建了Web服务可靠性本体。在此本体的基础上,提出了基于贝叶斯网络的Web服务可靠性评估方法。该评估方法可解决Web服务可靠性缺乏语义描述的问题,也能通过贝叶斯网络推理对原子服务可靠性进行评估,为Web服务的自动发现、组合和执行奠定基础。3组实验结果表明,该评估方法可行、实用且有效。 王广正 王喜凤 夏敏关键词:WEB服务 可靠性 本体 贝叶斯网络 改进的TF-IDF关键词提取方法 被引量:18 2013年 在TF-IDF算法基础上,提出新的基于词频统计的关键词提取方法。利用段落标注技术,对处于不同位置的词语给予不同的位置权重,对分词结果中词频较高的同词性词语进行词语相似度计算,合并相似度较高的词语,通过词语逆频率TF-IWF算法,按权值排序得到关键词。这种改进算法解决了传统中文关键词提取方法中对相似度高的词的不重视而导致关键词提取精度不高的问题。实验结果表明,改进的算法结果在准确率和召回率上较原有的TF-IDF算法上都得到较好的提升,使得提取的关键词集合能较好体现文本内容。 王小林 杨林 王东 镇丽华关键词:知网 词语相似度 TF-IDF 关键词提取 Phishing detection method based on URL features 被引量:2 2013年 In order to effectively detect malicious phishing behaviors, a phishing detection method based on the uniform resource locator (URL) features is proposed. First, the method compares the phishing URLs with legal ones to extract the features of phishing URLs. Then a machine learning algorithm is applied to obtain the URL classification model from the sample data set training. In order to adapt to the change of a phishing URL, the classification model should be constantly updated according to the new samples. So, an incremental learning algorithm based on the feedback of the original sample data set is designed. The experiments verify that the combination of the URL features extracted in this paper and the support vector machine (SVM) classification algorithm can achieve a high phishing detection accuracy, and the incremental learning algorithm is also effective. 曹玖新 董丹 毛波 王田峰一种基于Markov随机场的图像分割方法 2012年 提出一种基于Markov随机场图像分割方法。在K-Means图像分割的基础上,建立标记场和特征场,构造Markov随机场模型,再利用条件迭代模型(ICM)算法逐点更新图像标记,实现图像的最大后验概率(MAP)估计,从而实现图像的有效分割。实验结果表明,该方法比直接采用Markov方法有着更好的分割效果。 任然 刘宏申关键词:图像分割 MARKOV随机场 最大后验概率 基于节点相似度的社团发现算法 被引量:3 2014年 对现有的社会网络社团发现算法进行研究,发现存在算法时间复杂度高、准确率低和没有充分利用节点属性信息等问题,提出了一种基于节点相似度的社团发现算法以解决这些问题。综合考虑图的拓扑结构和节点属性信息,结合构造属性扩展图的思想和基于结构情境相似度的思想得到节点的相似度,利用改进的K-means算法对所有节点进行聚类得到社团结构。编程实验结果表明,使用该算法得到的社团准确率较高,算法的时间复杂度为线性的,在带属性的数据集上和不带属性的数据集上的测试结果均验证了算法的有效性。 程泽凯 张佳玉关键词:社会网络 社团发现 三维直角坐标系下三环网络的超L型瓦仿真 2012年 传统的超L型瓦仿真算法主要采用穷举的方法,效率较低,且有一定的局限性。针对上述问题,将三维直角坐标系引入三环网络,在三维直角坐标系下,提出广义三环网络G(N;s1,s2,s3)的超L型瓦仿真算法,利用C++和OpenGL实现超L型仿真,并求得其相关参数l、m、n,以及三环网络的直径D。实验结果表明,该算法具有较高的执行效率和更强的通用性。 苏小虎 邰伟鹏 方木云关键词:三环网络 直径