殷丽凤
- 作品数:38 被引量:54H指数:7
- 供职机构:大连交通大学更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信理学交通运输工程更多>>
- 粗糙XML函数依赖及其推理规则被引量:1
- 2014年
- 随着XML成为网络信息表示和交换的标准以及不确定数据的广泛存在,不确定XML数据库管理技术成为了当今研究的热点。基于粗糙集理论提出了XML信息系统模型、粗糙XML树信息系统、粗糙冗余等定义,基于粗糙XML信息系统的上近似、下近似给出了粗糙XML函数依赖的定义及推理规则,并对推理规则的正确性进行了证明。为粗糙XML数据库理论的进一步研究奠定了基础。
- 殷丽凤邱占芝
- 关键词:粗糙集
- 利用函数拟合对DeepFM算法的改进研究
- 2023年
- DeepFM模型是基于FM模型与Wide&Deep模型的改进,该推荐算法主要基于深度学习通过已知特征来预测用户点击某一按钮的概率。但随着电子商务的发展,不仅需要通过横向特征预测用户点击某一按钮的概率,还要纵向考虑该按钮在不同时间段的点击概率变化。文中对DeepFM进行了改进,引用了拟合函数的方法,通过各个拟合的函数计算出点击概率变化的函数图像,延展该图像得知该按钮被点击概率随着第三维坐标时间值的变化,从而实现了各种用户在不同时间对于不同商品需求的预测。该算法运用了相对平滑的函数曲线来拟合模型计算的结果,提高了模型的精确度。
- 殷丽凤苗子宇
- 关键词:函数拟合
- 基于Python网上招聘信息的爬取和分析被引量:11
- 2019年
- 针对Python语言的大数据爬取和分析,采用以纯python语言编写爬虫脚本的方式,通过爬取51job上招聘信息为“python”和“数据分析”两个词条的数据信息和简要分析,得出python爬虫编写中各类问题的解决方法,最后对规范数据做了进一步分析,分析结果为应聘人才做决策提供了有价值的信息。
- 殷丽凤张浩然
- 关键词:PYTHON语言网络爬虫数据预处理规范数据数据分析
- XML强闭包依赖的研究被引量:9
- 2008年
- XML闭包依赖是基本的完整性约束。当XML文档出现不完全信息时,XML闭包依赖同样对于阻止XML数据的更新异常、查询优化以及索引设计具有重要的意义。提出了在不完全信息环境下基于一致路径集合的XML强函数依赖和XML强闭包依赖的定义,研究了XML强闭包依赖的判定定理。在提出XML强闭包依赖推理规则的基础上,对其有效性和完备性进行了证明。最后分析了XML强闭包依赖和XML强函数依赖的关系。
- 殷丽凤郝忠孝
- 关键词:不完全信息
- 基于贝叶斯网络的隐私数据研究
- 2023年
- 随着大数据技术在各个领域的广泛应用,如何保护个人隐私已经成为了需要解决的问题,在个人隐私保护方面,差分隐私保护模型已经成为对隐私数据保护的首选模型。将贝叶斯网络与差分隐私保护模型结合起来可以对数据提供有效的保护。针对贝叶斯网络随机选择首结点的问题进行改进,在PrivBayes的基础上提出了改进算法I-PrivBayes,对数据中的各个属性引入独立性权重,快速准确地选出首结点。通过实验表明方法能大幅度提升数据的准确性和隐私安全性。
- 石雪松殷丽凤
- 关键词:贝叶斯网络
- 一种概率XML Twig查询的计算
- 2009年
- 传统数据库只管理确定性信息,但在许多应用中涉及大量不确定数据。本文把概率数据引入XML文档中,提出概率XML文档树、概率XML模式树、概率XML文档树符合概率XML模式树的定义;给出了概率XML Twig查询树和概率XML Twig查询匹配的定义,最后提出了计算概率XML Twig查询结果概率的定理。
- 金宇殷丽凤
- 关键词:TWIG查询
- 启发式k-means聚类算法的改进研究
- 2024年
- 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。
- 殷丽凤栗庆杰
- 关键词:聚类算法K-MEANS启发式算法局部异常因子离群点
- 一种文本分类方法
- 本发明提供了一种文本分类方法,属于文本分类技术领域,包括:将文本中的词转化为词向量;将文本的词向量转化为文本图后,将文本图输入到图神经网络层中,利用图神经网络输出标签向量;将文本的词向量输入到多头自注意力神经网络中进行特...
- 殷丽凤潘鹏程刘震郑广海任洪海
- 一种概率XML数据模型和查询代数
- 2013年
- 传统数据库只管理确定性信息,但在许多应用中涉及大量不确定数据。该文把概率信息引入XML数据库中,给出概率XML模式树,概率XML数据树等相关定义,以此为基础,提出了概率XML数据树的查询代数,如选择操作,投影操作。研究成果为概率XML数据库的查询奠定了基础。
- 金宇殷丽凤邱占芝
- 关键词:可扩展标识语言概率数据库数据模型查询代数
- 不完全信息环境下XML Schema规范化研究被引量:2
- 2009年
- 为了解决不完全信息环境下XML模式设计中XML文档的数据冗余和操作异常,研究了不完全信息环境下XML Schema的规范化问题,提出了XML Schema和符合XML Schema的不完全XML文档树等概念;基于节点等价、节点相容、节点信息等价和节点信息相容等概念提出了XML强函数依赖的定义,给出了相应的推理规则;给出了求路径集强闭包和成员籍问题的算法,并对算法的正确性进行了证明,对其时间复杂度进行了分析。提出了不完全信息环境下XML范式和相应的规范化算法。研究成果较好地解决了数据冗余问题,避免了更新异常现象,更好地实现了XML
- 殷丽凤郝忠孝
- 关键词:不完全信息