王梅
- 作品数:79 被引量:131H指数:6
- 供职机构:东华大学更多>>
- 发文基金:国家自然科学基金上海市自然科学基金上海市“科技创新行动计划”更多>>
- 相关领域:自动化与计算机技术医药卫生文化科学化学工程更多>>
- 基于海量搜索历史数据的用户兴趣模型被引量:3
- 2014年
- 针对互联网搜索引擎环境中,基于海量搜索历史数据分析用户兴趣的问题,提出一种改进的用户兴趣模型。该模型根据用户搜索的历史数据,结合向量空间模型(VSM)和TF-IDF算法,递归地回溯出用户兴趣权重列表。为解决用户兴趣变化和时间性能的问题,该模型引入时间遗忘机制进行动态更新,并在Hadoop分布式系统架构下利用Map Reduce分布式编程模型进行实现。实验结果表明,改进的用户兴趣模型的查准率和召回率都能达到50%,具有较好的可行性和可用性。
- 詹天晟陈德华乐嘉锦王梅
- 关键词:向量空间模型TF-IDFHADOOPREDUCE用户兴趣模型
- 基于依存句法分析的病理报告结构化处理方法被引量:10
- 2016年
- 病理检查报告中的文本通常为非结构化数据,不利于计算机自动分析和处理.目前文本结构化主要采用信息关系抽取方法,然而病理检查报告所具有的语义特殊性,给中文信息关系抽取带来了挑战.为解决上述问题,设计了一种针对病理检查报告的结构化方法,首先通过神经网络语言模型获得病理报告中的同义词表,合并一义多词现象;在此基础上,生成病理检查报告文本的依存关系树,并提出切分短句和信息标注的剪裁策略,以简化初始生成的依存关系树结构,从而使语法关系更加清晰,提高结构化结果的准确度;进而,利用依存句法分析结果从中文检查报告中提取指标及对应指标值,并自动生成结构化模板.实验采用医生真实使用的医疗病理检查报告进行验证,其结果表明:该方法在指标词和对应指标值提取任务中的准确率可以分别达到82.91%和79.11%,为相关研究打下了基础.
- 田驰远陈德华王梅乐嘉锦
- 关键词:医疗数据病理报告依存句法分析
- HCLOPE:一种处理分类数据的优化层次聚类算法被引量:2
- 2016年
- 随着分类数据规模的快速增长,关于分类数据聚类方法的研究日趋重要。在现有的算法中,CLOPE在运行速度、内存开销和聚类结果方面要优于同类算法,但是它的聚类质量并没有达到最优,而且受到输入数据顺序的影响,显现出不稳定性。基于此原因,提出一种处理分类数据的层次聚类算法HCLOPE,采用自底向上的凝聚法生成稳定的聚类结果。此外,还定义了聚簇间全局最大的收益差值作为聚类的合并准则,并引入无向图的结构优化聚类合并迭代过程。在蘑菇数据集上运行的实验结果显示HCLOPE的聚类质量更优。
- 李晔锋乐嘉锦王梅
- 关键词:分类数据层次聚类稳定性无向图
- APWAH:一种自适应划分字对齐的混合位向量压缩技术
- 在对海量数据的查询执行中,高效地存储中间结果是提高查询效率的重要手段之一.现有的列存储系统大都主要关注于如何选择合理的物化时机来提高查询效率,而忽略了对中间结果的有效管理.首先,为了减小查询执行过程中中间结果的大小,提出...
- 丁祥武李清炳王梅
- 关键词:位运算
- 文献传递
- 疾病AI诊疗中的用药采集与规范平台的研究与实现
- 2021年
- 目的伴随着慢性病患者的增加,药物的联合应用已经成为常态。在联合用药的背景下,为了保障患者的健康和临床治疗效果,需要对患者的自主用药提供及时的监督与指导。另一方面,患者的实际用药信息对医院来说难以跟踪获取,为联合用药分析带来困难,因此需要提供更加有效的用药信息采集方式。方法借助知识图谱技术以及时间规划算法,通过结合移动医疗的应用形式构建用药采集与规范平台。结果本文提出并实现了集用药信息采集、规范患者用药于一体的原型App,包括对于患者处方信息的录入、用药提醒、用药信息的采集与上传等功能,并且在用药提醒功能中,为了解决冲突药品之间的安全服用时间规划问题,本文提出了一种基于贪心和分治思想的安全时间段规划算法。结论本文提出的原型App对疾病AI诊疗中两个方面的问题进行了处理。对于患者层面的联合用药,通过规范和监督的方式提升了患者的用药依从性。同时,为医生层面的联合用药分析提供了有效的数据采集渠道。
- 周昊林王梅
- 关键词:知识图谱ANDROID
- 面向“卓越计划”的软件工程专业认识实习课程改革
- 2014年
- 针对"卓越计划"在人才培养上对创新实践能力的要求,分析目前软件工程专业实习课程现状,基于校企合作探索认识实习实践教学环节,提出改革方法和措施,结合软件工程专业认识实习课程建设的具体实施,说明课程改革有利于培养和提高软件工程卓越工程师的实践创新能力。
- 王梅夏小玲柴大平
- 关键词:软件工程专业
- 基于反事实的归因激活图引导的可解释方法系统
- 本发明涉及一种基于反事实的归因激活图引导的可解释方法系统,针对已经训练好的图像目标检测深度学习模型,使用该模型对图像进行预测获得预测结果,根据预测结果使用Grad‑CAM方法得到检测结果在原始图像上的归因热力激活图以展示...
- 陈德华鲍承转潘乔王梅
- k-匿名数据上的聚集查询及其性质
- 2014年
- k-匿名数据中存在大量的有用信息,如何从k-匿名数据中得到有用的知识是目前亟待解决的问题。OLAP是知识发现的主要手段,聚集查询是OLAP的关键操作。为了解决k-匿名数据聚集查询问题,首先,给出了描述k-匿名数据的数据模型。其次,将聚集查询分为两个阶段,在第一阶段,给出k-匿名数据满足的性质和独立属性集的概念,利用k-匿名的性质和独立属性集给出求解满足查询约束的值和概率集合的算法,并将该集合作为第二阶段的输入。在第二阶段,给出聚集查询的语义。为了满足用户不同的查询需求,给出WITH子句约束及不同WITH子句约束的语义,作为聚集查询的第一阶段的补充。最后,讨论了聚集查询的性质,并用实验验证了查询的有效性。
- 张君宝刘国华王碧颖王梅王羽婷石丹妮翟红敏
- 关键词:数据共享OLAP隐私保护K-匿名聚集查询
- 一种分类数据聚类算法及其高效并行实现被引量:4
- 2017年
- 针对大规模、高维、稀疏的分类数据聚类,CLOPE算法相比于传统的聚类算法在聚类质量及运行速度上都有很大的提升。然而CLOPE算法存在聚类的质量不稳定、没有区分每维属性对聚类的贡献度、需要预先指定排斥因子r等问题。为此,提出基于随机顺序迭代和属性加权的分类数据聚类算法(RW-CLOPE)。该算法利用"洗牌"模型对原始数据进行随机排序以排除数据输入顺序对聚类质量的影响。同时,根据信息熵计算各个属性的权重,以区别每维属性对聚类的贡献度,极大地提升了数据聚类的质量。最后,在高效的集群平台Spark上,实现了RW-CLOPE算法。在三个真实数据集上的实验结果表明:在数据集乱序后的份数相同时,RW-CLOPE算法比p-CLOPE算法取得更好的聚类质量。对蘑菇数据集,当CLOPE算法取得最优聚类结果时,RW-CLOPE比CLOPE取得高68%的收益值,比p-CLOPE取得高25%的收益值;针对大量数据,基于Spark的RW-CLOPE算法比基于Hadoop的p-CLOPE算法执行时间更短;计算资源充足时,随机顺序的数据集份数越多,执行时间的提升越明显。
- 丁祥武谭佳王梅
- 关键词:分类数据SPARK
- 面向数据开放共享的数据划分与组织方法
- 本发明提供了一种面向数据开放共享的数据划分与组织方法。本发明提供了一种在面向大数据的数据开放共享应用中通过分析数据分布的广度和深度模式,估计数据分布模式满足不同应用需求的价值关系,以此为基础对原始数据划分,生成新的用于共...
- 王梅乐嘉锦朱扬勇陈德华潘乔郝茜
- 文献传递