张惠然
- 作品数:21 被引量:92H指数:4
- 供职机构:上海大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金上海市教育委员会重点学科基金更多>>
- 相关领域:自动化与计算机技术一般工业技术金属学及工艺农业科学更多>>
- 一种材料性质的机器学习规则提取与评估的方法及装置
- 本发明涉及一种材料性质的机器学习规则提取与评估的方法及装置,方法包括以下步骤:获取材料性质的数据集;从数据集中提取机器学习的规则;对规则进行有效性验证,计算子群相似性分数,根据子群相似性分数判断规则性质;根据规则性质,制...
- 张惠然代猛猛戴东波
- 一种基于词频幂律分布特性的文本关键词权重计算方法
- 本发明公开了一种基于词频幂律分布特性的文本关键词权重计算方法,具体步骤如下:S1:打开文本进行预处理,包括去除停用词和分词,余下的词作为候选关键词;S2:以候选关键词为节点,词频为节点权重,词共现为边,词共现频率为边权重...
- 陈雪郭峻材王小飞乐金雄王鹏骆祥峰魏晓张惠然
- 融合LBP纹理和局部灰度特征的材料图像分割被引量:3
- 2016年
- 为了提高材料图像的分割精度,提出了融合局部灰度特征和LBP纹理的谱聚类分割算法。针对LBP算子无法区分邻域灰度差值幅度,提出几种改进的T-LBP算子,以表示图像纹理变化程度。构造邻域向量差用以描述局部特征;利用灰度直方图选取样本点;融合T-LBP特征与像素灰度特征及局部特征构造相似性矩阵;利用谱聚类算法进行图像分割;采用线检测方法抑制具有方向性的纹理噪声。对陶瓷材料图像和合成图像的实验结果表明,算法分割精度高、抗噪性强,具有较高的正确分类率。提出的融合LBP特征和灰度特征的谱聚类分割算法弥补了现有材料图像分割算法的不足,提高了材料图像的分割精度,适用于区域繁多、纹理复杂的材料图像;与其他算法实验结果的对比验证了该算法的有效性。
- 赵曌丁广太樊明磊张惠然王路陈琳
- 关键词:图像分割谱聚类算法灰度特征
- 基于embedding属性相似度的材料工艺流程匹配方法
- 本发明提供了一种基于embedding属性相似度的材料工艺流程匹配方法。本方法首先获取工艺实体和属性关系向量嵌入,计算工艺实体特征相似度;再根据工艺实体特征相似度进行实体对齐,计算工艺属性特征相似度;结合预设标准工艺流程...
- 魏晓钱权丁聪张惠然
- 文献传递
- 基于consR的并行图匹配方法
- 2015年
- 随着社交网络、生物网络规模的迅速扩大,能够快速、高效地实现对这些网络的匹配、查询等工作已经成为许多应用领域的迫切需求。给定两个网络图,图匹配的过程即为对图G1中的每个节点在图G2中找到唯一一个相对应的最为相似的节点,使得给定的两个图的匹配边的数量最多。文中基于大图匹配方法 consR,进行了两方面的优化:当图的节点数目较少时,优化了图G1、G2的相似性矩阵计算策略,从而使得图匹配的计算更加快捷;当图的节点数目较大时,针对匹配过程中最为耗时的步骤进行并行优化处理。实验结果表明,在与consR方法计算出的匹配结果保持一致的情况下,一定程度上缩短了图匹配计算时间。
- 田豪爽戴东波张惠然谢江
- 关键词:图匹配并行化
- 基于纹理的材料图像各成份区域分割
- 材料的形貌、结构和性能三者之间关系的揭示,有助于高效地开发新材料;在开发新材料过程中,设计、建模及表征这三个环节紧密围绕着材料形貌处理。传统的材料图像分析主要由人工完成,近年来,随着计算机技术的快速发展,计算机图像处理技...
- 韩越兴赖传滨钱权张惠然戴东波
- 基于Python的新浪微博数据爬虫被引量:61
- 2014年
- 目前很多的社交网络研究都是采用国外的平台数据,而国内的新浪微博没有很好的接口方便研究人员采集数据进行分析。为了快速地获取到微博中的数据,开发了一款支持并行的微博数据抓取工具。该工具可以实时抓取微博中指定用户的粉丝信息、微博正文等内容;该工具利用关键字匹配技术,匹配符合规定条件的微博,并抓取相关内容;该工具支持并行抓取,可以同时抓取多个用户的信息。最后将串行微博爬虫工具和其并行版本进行对比,并使用该工具对部分微博数据作了一个关于流感问题的分析。实验结果显示:并行爬虫拥有较好的加速比,可以快速地获取数据,并且这些数据具有实时性和准确性。
- 周中华张惠然谢江
- 关键词:爬虫PYTHON大数据
- 基于自然语言处理的材料领域知识图谱构建方法被引量:3
- 2022年
- 如何将材料领域知识与机器学习技术相结合是材料智能研究迫切需要解决的问题.知识图谱(knowledge graphs,KGs)作为一种高效的知识组织模型,可以有效地对材料领域知识进行表示、组织和推理,从而提升材料机器学习算法的智能水平.研究了基于自然语言处理技术的材料领域知识自动获取方法,提出了基于双向门控循环单元-图神经网络-条件随机场(bidirectional-gated recurrent unit-graph neural network-conditional random field,Bi-GRU-GNN-CRF)的材料实体关系联合抽取方法,以及基于改进TextRank算法的材料工艺知识抽取方法,实现了从专利、论文等材料文献中自动获取材料实体、关系、工艺流程等材料领域知识.实验结果表明,所提出的材料知识获取方法具有较好的精度和召回率,能够有效提升材料知识图谱的知识覆盖度.基于该方法构建的材料领域知识图谱的知识覆盖率达到了80%,能够为材料智能研发提供更加全面的知识支撑.同时,构建了非调制特殊钢、铝基复合材料、热障陶瓷涂层材料3个材料领域知识图谱,并进行了应用探索,进一步验证了知识图谱为材料研发提供知识支撑的可能性.
- 魏晓王晓鑫陈永琪张惠然
- 关键词:自然语言处理知识图谱
- 基于机器学习的材料属性缺失数据的插补方法
- 胡红青张惠然郑伟达韩越兴丁广太戴东波钱权
- 基于SISSO和机器学习方法的钙钛矿结构的稳定性预测:新型容许因子建立与验证
- 2020年
- 由于钙钛矿型材料具有广泛的应用前景,因此对其结构及物理、化学性质的研究一直是材料研究领域的热点之一。其中,利用容许因子(Tolerance factor)来预测钙钛矿型材料的结构稳定性可以帮助研究者发现更多的新型功能材料,而传统的基于离子半径定义的容许因子tIR存在一定的局限性。本文基于SISSO(Sure independence screening and sparsifying operator)方法和键价模型提出一种新型的容许因子τBV,其可以有效地避免由离子半径带来的局限性。本工作使用机器学习中的决策树算法建立容许因子验证模型,实验结果表明,新型容许因子τBV可以很好地预测ABO3型化合物是否具有钙钛矿结构,并大大提高了预测精度。
- 胡红青吴邵刚郭治廷周高锋戴东波魏晓张惠然
- 关键词:钙钛矿