广州市科技计划项目(2002Z3-E0017)
- 作品数:6 被引量:48H指数:5
- 相关作者:印鉴周祥福戴东波张国荣黄文涛更多>>
- 相关机构:中山大学中山大学附属第三医院广州美术学院更多>>
- 发文基金:广东省科技计划工业攻关项目广州市科技计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- 结合使用挖掘和内容挖掘的web推荐服务被引量:14
- 2005年
- 随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。
- 戴东波印鉴
- 关键词:WEB使用挖掘WEB内容挖掘
- 应用等距变换处理聚类分析中的隐私保护被引量:5
- 2006年
- 针对聚类分析时如何保护隐私的问题,提出了一种称为IBT(基于等距变换的数据转换)的算法。IBT先随机选择属性向量对,然后对属性向量对进行等距变换。变换过程中,根据所要求的相对隐私保护度来确定变换角度θ的选择范围,最终在符合要求的范围中随机选择变换的角度。实验结果表明,IBT能保持两点间距离不变,很好地扭曲了数据,保护隐私信息,且对聚类的结果没有影响。
- 张国荣印鉴
- 关键词:数据挖掘隐私保护聚类分析等距变换
- 不完整数据库中的数据挖掘被引量:6
- 2006年
- 数据挖掘是从数据中提取有用知识的过程。在现实生活中,数据丢失的情况是很常见的,尤其是在商业数据库中,由于文件错误、纪录缺失、存储策略的改变等都会引起数据丢失而造成数据库的不完整。这种不完整性会影响关联规则的挖掘过程,因为在有数据缺失时对规则的支持度以及可信度的计算都得不到确定值。把Apriori算法应用于不完整数据库,基于期望支持度和期望可信度,给出了一个挖掘不完整事务数据库中关联规则的算法。
- 印鉴周祥福杨敏
- 关键词:数据挖掘关联规则
- 应用正交变换保护数据中的隐私信息被引量:6
- 2006年
- 针对聚类分析时如何保护隐私的问题,从传统的数据安全度评价标准出发,重新拓展了一般实数上有限维欧氏空间中隐私保护度的评价指标,提出了一种称为OBT(基于正交变换的数据转换方法)的算法,OBT中正交矩阵的选择不依赖于具体数据,能够很好地应用于大容量的数据库上,在应用正交变换保护数据中的隐私信息时不需要进行大量的运算。
- 张国荣印鉴
- 关键词:数据挖掘隐私保护聚类分析正交变换
- p53、p21、Ki-67和VEGF与膀胱癌分级、分期以及预后的关系被引量:16
- 2007年
- 目的:探讨p53、p21、Ki-67和VEGF的表达与膀胱癌的病理分级、分期以及预后是否相关。方法:应用免疫组织化学染色的方法,对40例手术证实的膀胱移行细胞癌患者的病理切片进行p53、p21、Ki-67和VEGF的化学染色。将免疫组化结果与病理分级、分期以及预后情况进行分析。结果:在40个肿瘤标本中,p53、p21、Ki-67和VEGF的表达有改变的分别有31个(77.5%),22个(55.0%),16个(40.0%),17个(42.5%);其中至少1个标记物表达异常35例(87.5%),而4个标记物均表达异常者有7例(17.5%)。患者平均随访51个月。除了Ki-67、VEGF与病理分级以及Ki-67与分期之间无统计学意义外,4个标记物多少都与膀胱癌的病理分级、分期相关。p53(+)/p21(-)以及4个标记物同时异常是与疾病相关死亡率有关的独立因素(P<0.05,P<0.01)。而Ki-67、VEGF均不是膀胱癌相关死亡率的独立因素(P>0.05)。越多标记物表达异常,则膀胱癌的死亡率增加。结论:p53、p21、Ki-67和VEGF多少都与膀胱癌的病理分级、分期相关。联合检测p53、p21、Ki-67和VEGF可以更加准确地预测膀胱癌的预后。
- 温机灵周祥福冯智英黄文涛张涛蔡育彬高新
- 关键词:膀胱肿瘤预后
- 结合访问序列和内容挖掘的预取技术被引量:2
- 2005年
- 提出了一种结合用户访问序列和Web页面内容的数据挖掘方法来形成预取技术。该技术充分考虑了Web页面的内容语义和内容大小,既可以在一定程度上提高命中率,又可以减少服务器的负载。
- 戴东波印鉴梁华金
- 关键词:WWW数据挖掘预取技术