马亮
- 作品数:14 被引量:307H指数:8
- 供职机构:清华大学软件学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种自适应的网页分类策略
- 网络信息资源的快速膨胀,使得传统的人工分类检索的方法力不从心,而信息的实时性和动态性又使得静态的分类方法显得不适应。本文提出了一种能够自动适应网络信息更迭特点,主动发掘新信息类型的自适应分类策略。该策略通过改进的Rocc...
- 孙学刚陈群秀马亮
- 关键词:自适应分类
- 基于ABC法的工作流仿真模型的设计与实现被引量:5
- 2006年
- 仿真是工作流技术的重要组成部分之一,其目的是检查过程模型中可能存在的错误,优化过程模型。该文对以活动网络图为基础建立的工作流模型,提出了一种基于ABC法的工作流仿真模型的设计与实现。
- 顾玉春马亮顾明
- 关键词:ABC法仿真模型网络图
- 基于时空分析的线索性事件的抽取与集成系统研究被引量:32
- 2006年
- 信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度;(2)利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并;(3)文档发生事件转移时对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。初步实验结果表明:本文采用的方法和策略是有效的。
- 吴平博陈群秀马亮
- 关键词:计算机应用中文信息处理信息抽取时空信息
- 智能Web信息检索相关研究
- 本文介绍了近期在Web信息检索领域所进行的研究工作.首先,在自适应文本信息过滤研究中,采用了基于多次反馈的增量学习机制来构造过滤模型,并在模型自适应学习过程中引入特征衰减等调节因素.相应的试验系统在相关的国际比赛中取得了...
- 马亮陈群秀谭伟
- 关键词:信息检索兴趣点检测
- 文献传递
- 智能Web中文主题信息收集系统IRobot的设计被引量:15
- 2002年
- 本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性,系统采用了对待收集URL进行相关度预测为主,对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中,深入考虑了Web主题信息结构和组织特性的多种因素,综合提高了系统的性能。相比已有的研究,系统的精度和收集效率更高,且更为稳定,并能够自动获得主题领域内重要资源的列表。
- 马亮陈群秀王俊徐国伟
- 关键词:IROBOT信息检索相关度评价中文信息处理系统设计
- 线程池技术研究与应用被引量:67
- 2005年
- 线程池技术为线程创建、销毁的开销问题和系统资源不足的问题提供了很好的解决方案,在服务器软件中得到了广泛的应用。将线程池技术应用于工作流引擎后,系统的响应速度和整体性能得到了很大的提高。
- 王华马亮顾明
- 关键词:线程池服务器工作流引擎
- 一种改进的自适应文本信息过滤模型被引量:30
- 2005年
- 自适应信息过滤技术能够帮助用户从Web等信息海洋中获得感兴趣的内容或过滤无关垃圾信息.针对现有自适应过滤系统的不足,提出了一种改进的自适应文本信息过滤模型.模型中提供了两种相关性检索机制,在此基础上改进了反馈算法,并采用了增量训练的思想,对过滤中的自适应学习机制也提出了新的算法.基于本模型的系统在相关领域的国际评测中取得良好成绩.试验数据说明各项改进是有效的,新模型具有更高的性能.
- 马亮陈群秀蔡莲红
- 关键词:信息检索WEB自适应信息过滤LANGUAGEMODEL
- 基于时空分析的线索性事件的抽取与集成系统研究
- 信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本...
- 吴平博陈群秀马亮
- 关键词:信息抽取时空信息
- 文献传递
- 基于特征串的大规模中文网页快速去重算法研究被引量:56
- 2003年
- 网页检索结果中 ,用户经常会得到内容相同的冗余页面 ,其中大量是由于网站之间的转载造成。它们不但浪费了存储资源 ,并给用户的检索带来诸多不便。本文依据冗余网页的特点引入模糊匹配的思想 ,利用网页文本的内容、结构信息 ,提出了基于特征串的中文网页的快速去重算法 ,同时对算法进行了优化处理。实验结果表明该算法是有效的 ,大规模开放测试的重复网页召回率达 97 3% ,去重正确率达 99 5 %。
- 吴平博陈群秀马亮
- 关键词:计算机应用中文信息处理特征串去重算法
- 基于事件框架的事件相关文档的智能检索研究被引量:35
- 2003年
- 在事件相关文档的检索中 ,事件主题的迁移和分化与相似事件的干扰是影响系统性能的两个主要因素。本文提出了一种基于事件框架知识和事件主体信息的检索方法。该方法对事件相关评价函数进行了的改进 :首先 ,从事件语料中提炼出事件的框架知识、从事件文档中挖掘出表达事件主体的信息 ,然后将这些知识和信息进行向量化 ,最后利用向量化的结果对相关度评价函数进行优化。实验结果表明该方法是有效的 ,明显提高了事件相关文档的检索性能。
- 吴平博陈群秀马亮
- 关键词:计算机应用中文信息处理