谢志鹏 作品数:21 被引量:76 H指数:4 供职机构: 复旦大学计算机科学技术学院 更多>> 发文基金: 国家自然科学基金 上海市自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 语言文字 电子电信 更多>>
一种基于跨语言监督的上下位关系检测方法 本发明属于自然语言处理技术领域,具体为一种基于跨语言监督的上下位关系检测方法。本发明利用数据丰富的源语言中的上下位数据训练得到数据匮乏的目标语言中的上下位关系检测器,包括:将源语言中有标注的上下位词对翻译成目标语言上的词... 谢志鹏 谢水文献传递 一种传感器网络最大化生命周期数据收集算法(英文) 被引量:32 2005年 从理论上分析了最大化网络生命周期的数据收集问题.主要做了以下4项工作:(1)分析了简化的静态路由模式,其中只有一棵路由树用于收集数据.(2)分析了真实的动态路由模式,其中有一系列的路由树用于收集数据.(3)提出了一种近似最优的最大化网络生命周期的数据收集和聚集算法MLDGA,MLDGA一方面试图最小化每轮数据收集中所消耗的总能量,另一方面试图最大化每轮数据收集中所使用的路由树的生命周期.(4)用Java语言实验模拟了MLDGA算法,并与现有的算法进行比较.实验结果表明,无论基站的位置还是传感器的初始能量发生变化,MLDGA都取得良好的性能,而现有的数据收集算法只适应于特定的变化. 张卿 谢志鹏 凌波 孙未未 施伯乐关键词:无线传感器网络 数据收集 数据聚集 一种在无线移动自组织网络中基于节点生命周期的服务选择方法 本发明属于自组织网络技术领域,涉及一种无线移动自组织网络中的服务选择方法。本方法通过Cost函数综合考虑网络中节点的服务数量、中继节点传输服务请求包耗费的能量、服务执行节点执行服务耗费的能量三个因素,选取最合适的服务提供... 孙未未 张卓瑶 鲁仲阳 陈炜于 周曦 谢志鹏文献传递 基于简单树匹配算法的Web页面结构相似性度量 被引量:15 2007年 网页结构相似性的度量是Web信息处理中的一项重要任务,在数据抽取和搜索引擎等研究领域有着潜在的重要研究价值.好的相似性度量方法可以提高数据抽取的准确率和速度,还可以提高搜索引擎的速度,提高返回数据的质量,减少大量冗余数据占据的存储空间.实现该任务的已有算法往往存在着计算复杂度过高的问题,针对这一问题研究HTML文档标签特点,减少传统算法中使用的算子,进而采用简单树匹配算法来计算Web文档之间的结构相似度.简单树匹配不允许结点的替换和跨层匹配,从而大大提高了算法的运行效率.实验结果表明,所提出的方法不论在速度还是精度上都优于著名的Bag of XPaths方法. 何昕 谢志鹏关键词:树匹配 结构相似度 一种基于弱证据聚合的常识因果推理方法及系统 本发明提供了一种基于弱证据聚合的常识因果推理方法及系统,利用弱因果证据以及常识因果知识对用户的因果推理问题进行推理,从而得到因果句子对,其特征在于,包括如下步骤:获取因果推理问题,并根据该因果推理问题确定对应的问题类型、... 谢志鹏 李国荣文献传递 一种在无线移动自组织网络中基于节点生命周期的服务选择方法 本发明属于自组织网络技术领域,涉及一种无线移动自组织网络中的服务选择方法。本方法通过Cost函数综合考虑网络中节点的服务数量、中继节点传输服务请求包耗费的能量、服务执行节点执行服务耗费的能量三个因素,选取最合适的服务提供... 孙未未 张卓瑶 鲁仲阳 陈炜于 周曦 谢志鹏一种基于弱证据聚合的常识因果推理方法及系统 本发明提供了一种基于弱证据聚合的常识因果推理方法及系统,利用弱因果证据以及常识因果知识对用户的因果推理问题进行推理,从而得到因果句子对,其特征在于,包括如下步骤:获取因果推理问题,并根据该因果推理问题确定对应的问题类型、... 谢志鹏 李国荣无线Ad Hoc网络最大生命周期路由算法的诚实机制(英文) 被引量:3 2009年 将已有的生命周期路由算法分成两类:普通Max-Min(GMM)算法和条件Max-Min(CMM)算法,然后为这两类算法分别提出它们的诚实机制.通过给予中继节点适当的报酬,这些诚实机制可以确保已有的算法在面对自私节点的时候也可以实现它们的设计目标.说明生命周期路由算法的本质可以使这种报酬率相对较低且比较稳定,实验结果也进一步证明了这一点. 谢志鹏 张卿关键词:无线AD HOC网络 基于图模型的Web表格中视觉并列关系的研究 2014年 Web不仅包含海量文本信息,还包含大量表格数据.与自由格式的文本信息相比,Web表格所包含的信息更为精练并且结构化,便于数据挖掘.Web表格挖掘已成为一个热点研究问题.为挖掘Web表格的行列结构、背景、颜色、文本字体、字号等视觉信息所蕴含的语义,一种图结构模型以及构造方法被提出.基于图模型,Web表格的视觉并列关系被形式化定义.一种自动抽取Web表格的视觉并列关系的算法被提出.实验表明所提取的视觉并列关系与语义相似度之间存在着显著的正相关性,Web表格视觉并列关系的提取将有助于其他语义分析工作. 李雯琴 谢志鹏关键词:视觉要素 图模型 基于预训练语言模型和标签指导的文本复述生成方法 2023年 文本复述生成是自然语言处理中一项重要且具有挑战性的任务。最近很多工作将句子不同粒度的句法结构信息用于指导复述生成过程,取得了一定的效果,然而这些方法大多比较复杂,迁移使用困难。另外,预训练语言模型因学习到大量语言知识而在各项自然语言处理任务中表现出了较好的性能,然而将其用在复述生成任务中的工作较少。针对这些问题,文中提出了基于预训练语言模型和标签指导的复述生成方法。该方法在复述任务上微调预训练语言模型以提升效果,同时用简单的标签插入方式为复述生成模型提供句法结构指导。实验结果表明,这种标签插入结合预训练语言模型的方法在ParaNMT和Quora数据集上的性能优于传统Seq2Seq方法,并且用该方法做数据增强能为下游任务带来效果提升。 梁佳音 谢志鹏