朱鉴
作品数: 8被引量:0H指数:0
  • 所属机构:深圳市腾讯计算机系统有限公司
  • 所在地区:广东省 深圳市

相关作者

刘怀军
作品数:27被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司
研究主题:文本 用户 词语组合 词语 词义
姚伶伶
作品数:66被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司
研究主题:存储介质 服务器 广告 相似度 准确率
叶莎妮
作品数:2被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司
研究主题:文本 准确率 特征词
王迪
作品数:46被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司
研究主题:标签 文本 词表 聚类 搜索
李珩
作品数:2被引量:0H指数:0
供职机构:深圳市腾讯计算机系统有限公司
研究主题:词典 分词系统 分词 自定义 特定语境
一种中文复合词的提取方法及提取系统
本发明涉及一种中文复合词的提取方法,该方法包括:获取预置的复合词集合与待处理的文本;间隔所述复合词集合与所述文本中的各词语,分别统计上述各词语在所述复合词集合的各复合词构成中不同位置的概率数据;为所述文本语句中的各词语标...
刘怀军朱鉴
文献传递
一种针对发布文本的行业分类方法和系统
本发明公开了一种针对发布文本的行业分类方法和系统,方法包括:进行一级行业类别特征词集合挖掘和二级行业分类模型训练,并依此构建由一级行业类别特征词集合和二级行业类别特征词集合组成的两级的层次类别体系;根据两级的层次类别体系...
叶莎妮姚伶伶朱鉴王迪
文献传递
一种中文复合词的提取方法及提取系统
本发明涉及一种中文复合词的提取方法,该方法包括:获取预置的复合词集合与待处理的文本;间隔所述复合词集合与所述文本中的各词语,分别统计上述各词语在所述复合词集合的各复合词构成中不同位置的概率数据;为所述文本语句中的各词语标...
何慧刘怀军朱鉴
文献传递
一种汉语文本的大、小粒度切分实现方法和装置
本发明公开了一种汉语文本的大、小粒度切分实现方法,包括如下步骤:设置大粒度切分方式和小粒度切分方式;根据输入的粒度需求,采用相应的粒度切分方式对汉语文本进行切分处理,并输出切分后的汉语文本。本发明还公开了一种汉语文本的大...
朱鉴李闪
文献传递
一种针对发布文本的行业分类方法和系统
本发明公开了一种针对发布文本的行业分类方法和系统,方法包括:进行一级行业类别特征词集合挖掘和二级行业分类模型训练,并依此构建由一级行业类别特征词集合和二级行业类别特征词集合组成的两级的层次类别体系;根据两级的层次类别体系...
叶莎妮姚伶伶朱鉴王迪
文献传递
一种汉语文本的大、小粒度切分实现方法和装置
本发明公开了一种汉语文本的大、小粒度切分实现方法,包括如下步骤:设置大粒度切分方式和小粒度切分方式;根据输入的粒度需求,采用相应的粒度切分方式对汉语文本进行切分处理,并输出切分后的汉语文本。本发明还公开了一种汉语文本的大...
朱鉴李闪
文献传递
自定义词管理装置、方法
本发明公开了一种自定义词管理装置、方法及分词系统。该装置包括:接收模块,用于接收用户输入的自定义词及其属性;词典生成模块,用于根据所述自定义词及其属性,生成自定义词典;词典加载模块,用于将所述自定义词典中的自定义词及其属...
朱鉴李珩
文献传递
自定义词管理装置、方法及分词系统
本发明公开了一种自定义词管理装置、方法及分词系统。该装置包括:接收模块,用于接收用户输入的自定义词及其属性;词典生成模块,用于根据所述自定义词及其属性,生成自定义词典;词典加载模块,用于将所述自定义词典中的自定义词及其属...
朱鉴李珩
文献传递