蔡瑞初 作品数:311 被引量:412 H指数:10 供职机构: 广东工业大学计算机学院 更多>> 发文基金: 国家自然科学基金 广东省自然科学基金 广东省科技计划工业攻关项目 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 电子电信 更多>>
一种基于图神经网络的大规模数据可视化降维方法 本发明提出一种基于图神经网络的可视化降维方法,涉及深度学习、大规模数据处理的技术领域,解决了现有降维技术中,模型无法进行大规模数据训练、非参数式可视化降维模型无法处理未知数据点的可视化以及参数式可视化降维模型的可视化结果... 杨易扬 张景彬 任成森 巩志国 蔡瑞初 郝志峰 陈炳丰文献传递 一种提升推荐系统准确性的方法 本发明公开了一种提升推荐系统准确性的方法,首先构建三个数据子集,然后在构建的数据子集上分别应用本发明构建的基于高斯混合分布的评分模型,标记各个数据子集中的无标签数据,获得各个教练集,并将获得的教练集中被标记的原始无标签数... 郝志峰 成英超 蔡瑞初 温雯文献传递 基于低秩矩阵补全的单幅图像去雨算法 被引量:3 2020年 提出一种基于低秩矩阵补全的单幅图像去雨算法,该算法采用检测、修补、优化的三阶段策略。在检测雨阶段,利用雨的亮度先验信息构建检测雨模型;在修补阶段,先采用相似块匹配算法构造相似块矩阵,再利用其具有低秩属性的特点,将去雨问题转化为低秩矩阵补全问题;在优化阶段,提出修正策略进一步提升去雨效果和客观度量值。在合成雨图和真实雨图上验证算法,实验结果表明,该算法表现出较好的去雨效果,且对大雨图像的处理也较为满意,相比其他方法在客观度量值和主观视觉上均有一定的优势。 朱鉴 刘培钰 陈炳丰 蔡瑞初基于图生成过程的跨领域推荐 被引量:1 2022年 推荐系统在各方各面得到充分的应用,时刻影响着日常生活。要训练出一个良好的推荐系统往往需要大量的用户-商品交互数据,但是实际情况下获得的数据往往是十分稀疏的,这往往会使得训练出来的模型过拟合,最后难以获得理想的推荐效果。为了解决这个问题,跨领域推荐系统应运而生。目前大部分的跨领域推荐系统工作都是借鉴传统领域自适应的方法,使用基于特征对齐或者对抗学习的思想将领域不变用户兴趣从有丰富数据的源域迁移到稀疏的目标域上,例如豆瓣电影迁移到豆瓣图书。但是由于不同推荐平台的网络结构有所不同,现有方法暴力提取的领域不变的语义信息容易和结构信息耦合,导致错配现象。而且,现有方法忽略了图数据本身存在的噪声,导致实验效果进一步受到了影响。为了解决这个问题,首先引入了图数据的因果数据生成过程,通过领域特征隐变量和语义特征隐变量、噪声隐变量解耦出来,通过使用每个节点的语义隐变量进行推荐,从而获得领域不变的推荐效果。在多个公开数据集上验证了该方法,并取得了目前最好的实验效果。 蔡瑞初 吴逢竹 李梓健关键词:解耦 领域自适应 推荐系统 一种融合语法信息的句子压缩方法 2020年 英文句子压缩任务由于词典容量等限制,使用深度学习方法容易造成压缩后的句意与原句不同并一定程度影响语法逻辑。针对这一问题,文中提出一种融合语法信息的句子压缩方法。首先通过两组编解码器来对单词和词性分别进行编解码,在解码阶段通过带有语法注意力机制的长短期记忆网络(Syntax-LSTM)融合单词和词性信息产生语法注意力机制进而引导输出结果。与现有方法相比,实验结果表明该算法的F1值在领域数据集上达到了0.7742,在跨领域数据集上达到了0.4186,证明了其输出具有更好的可读性和鲁棒性。 郝志峰 陈诚 蔡瑞初 温雯 王丽娟关键词:鲁棒性 一种基于跨平台基因表达数据的基因调控网络重建方法 本发明涉及一种基于跨平台基因表达数据的基因调控网络重建方法,根据跨平台基因表达数据的特点,通过获取来自p个测序平台基因表达数据,并进行预处理,然后从每个基因样本中抽取n个基因表达量,并基于偏相关系数的混合型条件独立性测试... 蔡瑞初 林殷娴 郝志峰 温雯 谢峰 许柏炎 陈薇 陈炳丰基于图编码网络的社交网络节点分类方法 被引量:9 2020年 针对如何融合节点自身属性以及网络结构信息实现社交网络节点分类的问题,提出了一种基于图编码网络的社交网络节点分类算法。首先,每个节点向邻域节点传播其携带的信息;其次,每个节点通过神经网络挖掘其与邻域节点之间可能隐含的关系,并且将这些关系进行融合;最后,每个节点根据自身信息以及与邻域节点关系的信息提取更高层次的特征,作为节点的表示,并且根据该表示对节点进行分类。在微博数据集上,与经典的深度随机游走模型、逻辑回归算法有以及最近提出的图卷积网络算法相比,所提算法分类准确率均有大于8%的提升;在DBLP数据集上,与多层感知器相比分类准确率提升4.83%,与图卷积网络相比分类准确率提升0.91%。 郝志峰 柯妍蓉 李烁 蔡瑞初 蔡瑞初 温雯关键词:社交网络 图表示 一种大规模跨平台基因表达数据分类方法 本发明公开了一种大规模跨平台基因表达数据分类方法,包括以下步骤:S1、获取训练集,初始化分类器;S2、对训练集进行数据转换;S3、根据训练集计算相对偏移表;S4、生成候选偏序对,并计算出候选偏序对中的top偏序规则r;S... 蔡瑞初 侯永杰 郝志峰 温雯 王丽娟 许柏炎 陈炳丰一种基于关联规则与支持向量机的基因表达数据分类模型 2014年 通过研究基因表达数据发现与特定疾病相关的关联规则,对疾病辅助诊断有重要的意义。针对现有分类结果可解释性的不足,提出一种基于关联规则的基因表达数据分类模型ASSO-SVM(ASSOciation rule based Support Vector Machine)。在该模型中,关联规则作为一种特征选择方法,用于提取基因之间的非线性关联。通过这些非线性关联所获取的先验知识有利于提高分类结果的可解释性。另外,针对基因表达数据高维、小样本的特性,该方法采用支持向量机作为对基因表达数据的分类器,获得较高的分类精度。ASSO-SVM结合了基因表达关联规则以及支持向量机分类的优点。在实际基因表达数据集上与现有分类模型的对比实验验证了该方法的有效性。 王美华 苏雄斌 蔡瑞初 罗静关键词:关联规则 基因表达数据 支持向量机 一种面向金融事件的混合型因果关系发现方法 本发明公开了一种面向金融事件的混合型因果关系发现方法,首先对文本事件因果关系进行抽取;然后结合文本事件所对应的关键词在百度指数上找出事件对应时间序列的关注指数的变化趋势,即搜索指数曲线,并运用传递熵进行时序事件因果关系的... 林海涛 蔡瑞初