马博
- 作品数:72 被引量:117H指数:6
- 供职机构:中国科学院新疆理化技术研究所更多>>
- 发文基金:中国科学院西部之光基金国家自然科学基金新疆维吾尔自治区重点实验室开放课题基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信语言文字更多>>
- 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质
- 本发明公开了一种基于注意力机制多特征融合的虚信息检测方法、装置、电子设备及存储介质,获取微博和推特数据集,对所述微博和推特数据集中文本和图片进行预处理;将预处理得到的文本数据输入到BERT预训练模型中获取语义信息提取文本...
- 马博地力夏提·阿布都热依木杨雅婷王磊周喜董瑞
- 文献传递
- 一种小样本槽值提取方法、装置、设备及存储介质
- 本发明公开了一种小样本槽值提取方法、装置、设备及存储介质,该方法获取槽值提取数据集,对数据集进行处理,构建小样本槽值提取数据集;利用辅助集上的全部数据,训练基础领域上的槽值提取模型,获得历史信息编码器;将生成的历史信息特...
- 周喜杨奉毅杨雅婷马博董瑞艾比布拉·阿塔伍拉
- 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质
- 本发明公开了一种基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质,涉及信息处理领域,尤其涉及文本过滤、内容监管领域。具体实现方案为:利用汉维双语将汉语关键词翻译为维吾尔语关键词;对获得的维吾尔语关键词进行...
- 杨雅婷艾孜麦提·艾尼瓦尔董瑞马博王磊周喜
- 文献传递
- 基于transformer的场景图像文字修改方法、装置、电子设备及存储介质
- 本发明公开了一种基于transformer的场景图像文字修改方法、装置、设备以及存储介质,利用基于深度卷积神经网络的编码器和解码器,对原始风格图像进行前景风格特征提取,将其文字字体,字体颜色,文字形状等前景风格迁移到目标...
- 艾孜麦提·艾尼瓦尔杨雅婷马博董瑞王磊周喜
- 面向连续时空加油数据的异常检测方法
- 本发明涉及一种面向连续时空加油数据的异常检测方法,该方法涉及面向多个加油站的实时采集数据,基于统计与机器学习相结合,通过预置的基于无监督的时序数据异常检测模块、基于半监督的时序数据异常检测模块和基于多视图的时空深度异常检...
- 马博蒋同海周喜杨雅婷王磊马玉鹏赵凡王轶
- 文献传递
- 维吾尔语口语语音语料库的设计与研究
- 在分析维吾尔语语音语料特点的基础上,结合实际语料库建设需求和地域语言特色,提出了适用于维吾尔语口语语音语料库建设的语料库设计规范、语科内容、语音采集和标注方法,并就不同信道对语音特征参数的影响进行分析。研究拟建立时长30...
- 杨雅婷马博王磊吐尔洪·吾司曼李晓
- 关键词:维吾尔语口语语料库特征参数
- 文献传递
- 维吾尔语语音识别中发音变异现象被引量:5
- 2011年
- 维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。
- 杨雅婷马博王磊王磊李晓
- 关键词:语音识别维吾尔语数据分析
- 基于去中心化存储数据的索引建立方法
- 本发明涉及一种基于去中心化存储数据的索引建立方法,该去中心化存储数据的索引建立方法包括:选取对数据区分度高的词作为关键词;使用训练好的词向量模型将选取的关键词转为词向量表示;将词向量降维,得到关键词的哈希表示;将词哈希与...
- 周喜石秋娥王轶马博王磊马玉鹏
- 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
- 本发明公开了一种基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质,具体实现方案为:获取训练样本数据集;对所述的样本数据集进行预处理。针对已有的源语言或目标语言语料,分别训练基于Transformer...
- 杨雅婷陈玺董瑞马博王磊周喜
- 多发音字典在维吾尔语方言语音识别中的应用被引量:5
- 2011年
- 基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。
- 杨雅婷马博王磊王磊李晓
- 关键词:语音识别维吾尔语