国家自然科学基金(60673041)
- 作品数:65 被引量:210H指数:7
- 相关作者:朱巧明周国栋朱艳琴李培峰罗喜召更多>>
- 相关机构:苏州大学江苏省计算机信息处理技术重点实验室铜陵学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术电子电信哲学宗教文化科学更多>>
- 语义角色标注中有效的识别论元算法研究被引量:2
- 2008年
- 语义角色标注中论元识别的结果对论元分类任务起着很重要的作用。以句法成分的中心词为依据,对论元识别算法进行研究,在训练集上识别出了98.78%的论元,在测试集识别出了97.17%的论元,并大大减少了不承担角色的训练样例。在此基础上以句法成分为标注单元,在自动句法分析上抽取和组合有用的特征,用支持向量机的方法进行学习分类,在测试集上获得77.84%的F1值。此结果是目前报告的基于单一句法分析的最好结果之一。
- 丁金涛周国栋王红玲朱巧明
- 关键词:语义角色标注支持向量机
- 基于依存句法分析的中文语义角色标注
- 依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。本文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统。该系统针对中文依存关系树,采用有效的剪枝算法和特征,使...
- 王步康王红玲袁晓虹周国栋
- 关键词:语义角色标注最大熵分类器
- 文献传递
- 基于树核函数的实体语义关系抽取方法研究被引量:30
- 2009年
- 该文描述了一种改进的基于树核函数的实体语义关系抽取方法,通过在原有关系实例的结构化信息中加入实体语义信息和去除冗余信息的方法来提高关系抽取的性能。该方法在最短路径包含树的基础上,首先加入实体类型、引用类型等与实体相关的语义信息,然后对树进行裁剪,去掉修饰语冗余和并列冗余信息,并扩充所有格结构,最后生成实体语义关系实例。在ACE RDC 2004基准语料上进行的关系检测和7个关系大类抽取的实验表明,该方法在较大程度上提高了实体语义关系识别和分类的效果,F值分别达到了79.1%和71.9%。
- 庄成龙钱龙华周国栋
- 关键词:计算机应用中文信息处理实体关系抽取树核函数语义信息
- 指代消解中语义角色特征的研究被引量:8
- 2009年
- 该文实现了一个基于机器学习的指代消解平台,并在此基础上着重研究了语义角色特征对指代消解的影响。该文使用ASSERT①语义角色标注系统得到语义角色标注信息,然后在原型系统的基础上加入语义角色特征。为了分析语义角色特征对指代消解的影响,该文还分析了语义角色特征和指代链特征以及代词细化特征的结合对系统的影响。通过把先行语和照应语在句子中所作的语义角色特征加入机器学习系统中进行研究,该文发现语义角色特征能够显著提高系统的性能,特别是对代词的消解有很好的效果。在ACE 2003 NWIRE基准语料上的所有类型名词短语的指代消解测试表明,召回率提高了3.4%,F值提高了1.8%。
- 王海东胡乃全孔芳周国栋
- 关键词:计算机应用中文信息处理指代消解语义角色
- 基于树核函数的实体关系抽取方法研究
- 实体关系抽取是信息抽取中的一个关键任务,其目的是找出文本中实体对之间的语义关系。本文描述了一种改进的基于树核函数的实体关系抽取方法,在路径包含树的基础上,加入了与实体相关的语义信息,并对原有的树进行裁剪,消除一些冗余结构...
- 庄成龙钱龙华周国栋
- 关键词:实体关系抽取树核函数裁剪语义信息
- 文献传递
- 面向不良文本信息的中文网页分类方法被引量:1
- 2008年
- 结合Internet不良文本信息的特点,运用贝叶斯理论设计了一种面向该类信息的网页分类方法,该方法兼顾分类效率与分类精度,对特征项选取以及权重计算的方法进行了优化,降低了分类特征维数,简化了分类过程的处理.实验数据表明,该方法保持了良好的性能,提高了效率.
- 黄旭朱艳琴罗喜召
- 关键词:信息安全文本分类贝叶斯理论
- 面向服务网格的自调度算法优化技术
- 2009年
- 将自调度引入到面向语言文字信息处理的服务网格中,并结合语言文字信息处理和自调度的特点,提出了一种服务网格环境下的自调度算法优化方案。该方案从数据的传输、子节点的处理方式这两个方面入手,用socket传输数据及子节点采用生产者—消费者模式来优化经典的自调度算法。实验证明,该方案能比原有的自调度算法在总响应时间上平均缩短5%以上。
- 吉勤李培峰朱巧明许兰
- 关键词:自调度服务网格套接字
- 基于部分广播通道的可验证秘密共享方案
- 2009年
- 借鉴Amos方案中重构秘密的思想对Rei方案进行了完善,提出一种基于部分广播通道的可验证秘密共享方案。在该方案的秘密分发阶段,秘密分发者与参与者之间使用部分广播通道进行通信,秘密重构阶段使用广播通道进行通信。该方案可处理不诚实秘密分发者与参与者情况,具有可验证性。通过对该方案的分析可知,该方案的通道数和总的通信量比已知的两个方案具有明显的优势。此外,该方案中各参与者的秘密份额可反复使用。
- 王家玲朱艳琴罗喜召
- 关键词:秘密共享可验证秘密共享拉格朗日插值
- 基于相似树的MPLS多播标记聚合算法
- 2009年
- 为了减少多协议标记交换(MPLS)网络多播标记的占用空间,文中提出了一种基于相似树的求解算法,将与同一共用树相似的多播组进行标记聚合.首先运用模糊聚类的方法生成共用树,然后以共用树为基础进行多播树的构建和组成员的更新.动态多播组成员的变化大多只会造成标记边缘路由器(LER)节点类型的转换,不需要重新分配标记.实验结果表明,此算法可以大大缩小MPLS标记的占用,在λ元素数量大于最大数量的1/2、相似度阈值为0.75时,能够将大于50%的多播组进行标记聚合,而平均每组多用的节点数小于0.50.
- 李领治朱艳琴杨哲
- 关键词:多播多协议标记交换
- 基于双向共享树的MPLS多播流聚合算法被引量:1
- 2010年
- 可扩展性是影响多播在MPLS网络大规模使用的主要问题,为解决该问题提出了一种基于双向共享树的多播流聚合算法。它根据节点之间的关系计算多播流的可聚合度,然后将标记边缘路由器聚类生成共享树的叶子节点集,并由树管理服务器计算双向共享树的拓扑结构,最后将可聚合度大于指定阈值的多播流汇聚到树中。实验结果表明,该算法可以大幅缩小MPLS标记的占用,简化中间节点的处理过程,减少路由器的转发状态,大大提高了MPLS多播的可扩展性。
- 李领治朱艳琴杨哲
- 关键词:多播MPLS