国家自然科学基金(60473071)
- 作品数:60 被引量:436H指数:14
- 相关作者:唐常杰段磊乔少杰李川左劼更多>>
- 相关机构:四川大学成都中医药大学成都信息工程大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金四川省青年软件创新工程基金更多>>
- 相关领域:自动化与计算机技术理学环境科学与工程更多>>
- 基于朴素基因表达式编程的函数自动建模被引量:8
- 2008年
- 为了进一步提高GEP的函数自动建模的效率,提出了朴素基因表达式编程模型(Na ve GEP)NGEP;提出了原子基因片断的概念,以保护进化良好的基因片段;引入了基因嫁接操作,实现了NGEP原型。实验表明:NGEP在函数自动建模的收敛速度是标准GEP的2~4倍。
- 朱明放唐常杰陈瑜向勇代术成
- 关键词:基因表达式编程
- 社会网络分析和社团信息挖掘的三项探索——挖掘虚拟社团的结构、核心和通信行为被引量:39
- 2006年
- 社会网络分析是数据挖掘的新热点。文中综述了社会网络分析研究动态,介绍了作者近期在社会网络挖掘方面的三项探索,包括:(a)虚拟社团的结构挖掘,讨论了初始社团生成、权重计算,社团树生成和社团结构挖掘算法。(b)基于六度分割和最短路径社团核心成员挖掘,讨论了计算节点间的最短路径,根据六度分割定理的剪枝,基于SPLINE算法和中心度挖掘犯罪子团伙中的核心的技术。(c)基于用户属性的通信行为挖掘,讨论了用户个性和通信行为关系的量化描述,采用911事件解密数据来建立社会网络,用于模拟恐怖分子间邮件的收发。
- 唐常杰刘威温粉莲乔少杰
- 关键词:社会网络分析最短路径知识发现
- 基于基因表达式编程的知识发现的三项新技术——转基因,重叠基因表达和回溯进化被引量:21
- 2005年
- 介绍了在研发基于基因表达式编程(GEP)的知识发现的三项新技术,包括:(a)转基因技术,通过注入转基因,引导进化方向,控制知识发现过程;(b)重叠基因表达,借鉴生物基因片段重叠表达,引入重叠基因概念,节约了表达空间;(c)回溯进化,借鉴生物“返祖现象”,引入回溯检查点概念和可回溯GEP算法、设计了等比递增检查点序列和加速递增检查点序列,约束回溯过程。实验表明,三项技术在一定的场合下分别提高了知识发现的性能1至2个数量级。
- 唐常杰彭京张欢钟义啸
- 关键词:知识发现基因表达式编程转基因
- 基于基因表达式编程的递归函数挖掘被引量:3
- 2007年
- 传统基因表达式编程(GEP)无法发现递归函数。为此,分析了传统GEP算法在函数挖掘方面不足的深层次原因,提出了基于递归染色体的基因表达式编程算法GEP-RecurMiner和动态进化策略(DSCMS)。理论分析和实验证明了GEP-RecurMiner极大地扩充了传统GEP函数挖掘方法的求解空间,能精确地发现传统GEP无法发现的递归函数,同时实验表明动态进化策略有效地提高了GEP-RecurMiner函数挖掘算法的效率,挖掘成功率提高20%,平均进化代数下降10%。
- 吴江唐常杰姜玥叶尚玉段磊李太勇
- 关键词:基因表达式编程递归函数函数挖掘
- 基于基因表达式编程的信用评估模型挖掘方法被引量:7
- 2007年
- 提出了一种基于基因表达式编程(GEP)的信用评估模型挖掘方法GEP-CREDIT。该方法基于客户信贷数据,利用GEP算法自动进行属性筛选,并进行属性融合,在此基础上训练和建立信用评估模型。在德国信用数据库真实数据集上做的实验和性能分析表明,基于GEP的信用评估模型挖掘方法较Nave Bayes算法的预测精度提高了3%;较SVM算法的预测精度提高了1.6%;较KNN(K=17)算法的预测精度提高了6.83%。
- 吴江唐常杰段磊李太勇
- 关键词:数据挖掘基因表达式编程信用评估
- 一种基于频度路径树的XML缓存模型被引量:1
- 2006年
- 提出并实现了一种新的称为频度路径树的XML缓存模型,FTree Cache.新模型根据频繁查询路径模式对源XML文件进行投影,生成相应的缓存文件.对用户提交的查询进行判断,提取相应的缓存文件来响应.通过对XML的投影缓存,可以有效降低查询的响应时间和大大减少内存的占用量.实验表明了方法的有效性,对内存的占用大约是原来的20%,响应时间约为原来的43%.
- 金朋纬唐常杰胡明耀孙茜陈宇
- 提高基因表达式编程发现知识效率的回溯策略被引量:13
- 2006年
- 传统基因表达式编程(GEP)编码简单,适应性强,但可能陷入局部最优的“早熟”陷阱.因此,作者借鉴生物界的“返祖现象”,提出了基于回溯的基因表达式编程方法.主要工作包括:(1)在传统GEP算法中引入回溯机制,提出基于回溯策略的GEP算法GEPBS(GEP withBacktracking Strategy);(2)提出回溯检查点概念,设计等比递增检查点序列和加速递增检查点序列,约束回溯过程;(3)扩充基于回溯的GEP算法,设计了退化因子(RF),提出了按比例回溯策略GEPPBS(GEP with Proportional Backtracking Strategy);(4)通过两个实验验证了新算法的有效性,在相同条件下较传统算法的适应度最大提高了49.2%,成功率最高提高了4倍.
- 钟义啸唐常杰陈宇段磊魏大刚
- 一种松耦合的生物医学命名实体识别算法被引量:3
- 2007年
- 生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。
- 胡俊锋陈蓉陈源陈浩于中华
- 关键词:隐马尔科夫模型
- MAuct:一个基于Web服务技术的移动拍卖系统被引量:1
- 2006年
- Web服务是移动电子商务的有效解决方案.作者开发实现了一个基于Web服务技术的移动拍卖系统MAuct.主要工作包括:(1)分析了系统实现过程中的特殊困难和采用的特殊技术;(2)将MAuct系统成功地移植到无线移动设备中;(3)实验证明,作者提出的对移动拍卖系统应用程序进行优化的新方法可使系统整体性能提高约30%.
- 乔少杰唐常杰彭京彭舰朱明放曾涛韩楠
- 关键词:WEB服务
- 基于集对分析的综合评价方法及其应用被引量:14
- 2007年
- 基于集对分析(SPA)的原理和方法,在介绍集对分析的思想和联系度有关概念后,提出评价系统各指标为连续型的等级综合评价方法,并用之对水稻高产性状和长江水质评价系统中,与相关文献的评价结果作对比,有一致的结论,从而验证方法的有效性。文中所用理论方法可推广应用于其他领域进行类似的评价。
- 任艳玲朱明放
- 关键词:SPA联系度