国家教育部博士点基金(200801830021)
- 作品数:10 被引量:49H指数:5
- 相关作者:左万利赫枫龄王英彭涛朱会峰更多>>
- 相关机构:吉林大学北京科技大学吉林财经大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金中央级公益性科研院所基本科研业务费专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 主题爬行中的隧道穿越技术被引量:11
- 2010年
- 由于网络环境的复杂性和网页内容的多主题性,要想得到更多的特定主题相关网页,就要穿越那些主题不相关网页来获取更多的主题相关网页,即隧道穿越.将隧道穿越分为灰色隧道穿越和黑色隧道穿越.对于灰色隧道,在爬行过程中,将一个多主题Web页面分割成数量不多的内容块分别处理来避免由于网页整体主题不相关给该块所带来的影响.对于黑色隧道的穿越,将隧道中主题不相关网页根据其父亲页面的主题相关性赋予一个深度值,然后根据其深度值的大小进行取舍,来达到扩展主题爬行区域的目的.实验结果显示,这两种方法都达到了预期效果,所以方法是有效、稳健和实用的.
- 彭涛孟宇左万利王英胡亮
- 关键词:主题爬行网页分块TARGETLENGTH
- 本体定义及本体代数被引量:3
- 2010年
- 基于现有的本体定义,采用函数式描述语言精确定义了本体建模基元,给出一种新的本体形式化描述,并给出了本体间近义关联的定义,在新本体形式化描述和本体间近义关联定义的基础上,提出一种具有封闭性的本体代数定义,同时结合函数式描述语言,给出了其形式化描述.
- 王俊华左万利赫枫龄王英
- 关键词:形式化描述
- 基于多分类器的Deep Web入口发现
- Deep Web入口发现是Deep Web数据集成的关键问题之一,本文应用主题爬行技术和本体技术,构造网页分类器(WPC)、表单结构分类器(FSC)和表单内容分类器(FCC),实现特定领域Deep Web入口表单的自动发...
- 王英左万利王鑫彭涛
- 关键词:本体主题爬行决策树
- 文献传递
- 传统Item-Based协同过滤推荐算法改进
- 传统item-based协同过滤算法根据项目之间的相似性来选取最近邻居.然而,现存的几种相似性度量方法都存在相应的弊端,因此只根据相似性无法找到准确可靠的最近邻.根据对两项目共同评分的用户个数,建立项目近邻等级,提出了结...
- 李雪左万利赫枫龄王英
- 关键词:协同过滤推荐系统
- 文献传递
- 免疫算法优化的大气质量评价模型及其应用被引量:9
- 2011年
- 针对传统免疫克隆选择算法搜索精度不高的不足,提出了一种改进的免疫克隆选择算法,即引入疫苗接种策略和局部高斯变异算子的免疫克隆选择算法.在疫苗提取、选取和接种过程中引入轮盘赌选择、二进制位基因位选取和接种策略,克服了传统免疫克隆选择算法没有抗体基因交叉的现象,提高了产生优良抗体的比率;通过引入局部高斯变异算子,利用高斯变异的小步长不断地自适应调整,提高了算法的局部搜索能力.此外,算法还采用了扩大搜索空间策略,避免算法陷入局部极值,提高了算法的全局搜索能力.在此基础上,提出了基于免疫克隆选择算法的大气质量评价模型,并将其应用于大气质量评价领域.实验结果表明,该算法有效地提高了求解问题的精度和执行效率,提出的评价模型具有较好的实用性和应用前景.
- 韩旭明左万利王丽敏时小虎
- 关键词:免疫克隆选择算法疫苗接种参数优化
- 使用机器学习对汉语评论进行情感分类被引量:5
- 2009年
- 针对汉语评论的多种特征使用机器学习方法(如贝叶斯、最大熵和支持向量机),解决了汉语评论的情感分类问题.实验结果表明,机器学习方法对汉语评论的分类效果较好,支持向量机的表现最好.句子级别和评论级别的准确率分别达到88.26%和91.79%.
- 白鸽左万利赵乾坤曲仁镜
- 关键词:情感分类贝叶斯分类器最大熵支持向量机
- 基于本体增量学习的主题爬行
- 2010年
- 在面向领域的信息搜索中,本体作为相关的领域知识往往有助于改善搜索效果,在信息检索中被广泛应用。基于本体增量学习的主题爬行技术的研究工作主要包括:首先,利用本体对领域概念及关系的描述作为网页主题判定的依据;其次,在爬行过程中,将学习得到的新概念和关系加入到本体中,以丰富完善领域本体,进而提高主题爬虫的收获率;最后,经过大量的实验数据分析,在词条提取准确率、收获率和响应速度等多个指标方面,证明了所提出的方法是可行的并且是高效的。
- 王鑫王英
- 关键词:主题爬虫概念树
- 基于多核环境的并行性双向枚举连接
- 2014年
- 基于多核处理器,结合自底向上和自顶向下两种算法,提出一种图遍历驱动的双向优化算法,该算法充分利用两种遍历算法的优点,并发挥多核环境的优势,实现了最优查询计划的高性能并行构建,解决了并行双向枚举连接问题.实验结果表明,该算法的性能优于已有算法,可明显提高数据库查询速度.
- 陈永恒左祥麟
- 关键词:多核查询优化动态规划
- 基于启发式信息的Deep Web查询接口属性抽取
- 电子商务网站以查询接口的方式提供商务信息,查询接口也是隐藏在后端的Deep Web数据库模式信息的载体.有效解析查询接口是访问Deep Web资源的第1步,但是由于查询接口在不同的设计模式和开发语言下实现,所以导致了属性...
- 梁浩左万利任斐赫枫龄
- 关键词:电子商务查询接口语义关系启发式信息
- 文献传递
- Deep Web查询转换研究
- 由于Web数据库具有自治性和异构性的特点,造成了各查询接口在内容、形式以及查询能力上都不尽相同,使得用户的查询请求受限于其给定的查询接口的表达能力,这给查询转换的准确性带来了更大的挑战。因此,对Deep Web查询转换进...
- 王英左万利王鑫彭涛
- 关键词:本体查询转换
- 文献传递