叶丹
作品数: 78被引量:575H指数:7
  • 所属机构:中国科学院软件研究所
  • 所在地区:北京市
  • 研究方向:自动化与计算机技术
  • 发文基金:国家高技术研究发展计划

相关作者

刘杰
作品数:197被引量:636H指数:12
供职机构:中国科学院软件研究所
研究主题:ND 光学 被动调Q LD抽运 二极管泵浦
马志柔
作品数:25被引量:24H指数:3
供职机构:中国科学院软件研究所
研究主题:相似度量 语义搜索 词频统计 词库 传统数据库
魏峻
作品数:260被引量:875H指数:16
供职机构:中国科学院软件研究所
研究主题:中间件 WEB应用 WEB服务 分布式 分布式系统
黄涛
作品数:209被引量:1,219H指数:17
供职机构:中国科学院软件研究所
研究主题:中间件 WEB应用 WEB应用服务器 分布式 虚拟机
虞海江
作品数:21被引量:18H指数:3
供职机构:中国科学院软件研究所
研究主题:数据集成 中间件 结点 数据集成中间件 数据仓库
一个数据同步系统的设计及实现被引量:6
2008年
越来越多的企业应用中涉及到数据的同步,我们自主研发了一个数据同步系统,解决了分布式环境下,异构数据源数据间的同步问题。本文介绍了该同步系统的体系结构,给出了两种数据源(数据库和普通文件)同步方法的设计及实现,同时结合某供应链平台,给出了数据同步方案。
时俊苓叶丹
关键词:数据同步触发器适配器异构数据源
一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法
本发明涉及一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法,通过知识匹配和语义推理方法来实现对履历信息提取,得出履历中所隐含的工作时间、工作地点、工作单位、工作职位等信息;并可在此基础上对提取结果按照一定规则...
马志柔刘杰伍海江叶丹吴怀林钟华
文献传递
基于发布订阅模式的数据集成中间件系统设计实现被引量:3
2007年
随着企业信息化的发展,对数据集成系统提出了大规模、动态改变和按需集成数据的需求。针对该应用需求,本文借鉴发布/订阅技术的思想,提出了一种基于发布/订阅的数据集成框架,并设计和实现了基于发布/订阅的数据集成系统。该系统由两部分构成:具有发布订阅功能的数据集成服务器和代理服务器。该方案提供了一种松散耦合的柔性化集成方式,系统应用表明它能适用于大规模的数据集成。
虞海江马建刚叶丹李建峰
关键词:数据集成元数据
ONCE:一种基于XML的虚拟企业运行支撑平台
2004年
虚拟企业是由多个伙伴企业依据市场需求共同组建的,具有分布性、动态性和异构性等特性。ONCE(Open Network Computing Environment)正是一种支持虚拟企业信息系统运行的一组中间件集合,它以XML作为虚拟企业信息交换的主要载体,提供多种中间件服务,包括可靠消息中间件、数据转换中间件、数据集成中间件、流程管理系统、企业信息门户、能够适应虚拟企业信息系统的异构性、动态性和分布特性,并方便地实现与企业内遗留系统的有效集成。在该平台研究的基础上,文章总结归纳了基于该平台的虚拟企业应用模式,为组建虚拟企业信息系统提供参考依据。
徐罡叶丹黄涛
关键词:虚拟企业企业信息门户异构性
基于XML的电子商务平台
李京冯玉琳顾明林学练范国闯郭陟冯文澜叶丹魏峻薛伟何云涛宋靖宇李剑虞海江
XML具有可扩展性、内容和表现分离、自我描述等特性,已经成为电子商务系统中数据交换最主要的标准。文章介绍了XML相关概念及电子商务平台的发展过程,分析了基于XML的电子商务平台的实现方法及优势。研发面向企业信息集成、过程...
关键词:
关键词:电子商务软件平台XML
语义增强的多策略政策术语抽取系统
2022年
针对政策术语具有时效性、低频度、稀疏性和复合短语的特点,传统术语抽取方法难以满足需求的问题,设计实现了语义增强的多策略政策术语抽取系统.该系统从频繁项挖掘和语义相似度两个维度对政策文本特征进行建模,融合多种频繁模式挖掘策略选取特征种子词,利用预训练语言模型增强语义匹配来召回低频且稀疏的政策术语,实现了从无词库冷启动到有词库热启动半自动化的政策术语抽取.该系统能够提升政策文本分析效果,为建设智慧政务服务平台提供技术支持.
曹秀娟马志柔朱涛张庆文杨燕叶丹
关键词:术语抽取
基于数据流程变换的Mashup性能优化方法被引量:1
2011年
Mashup是一种流行的web2.0应用,由开发者将互联网上多个web数据源的数据进行聚合构建而成.大多数mashup工具支持通过可视化的数据流程设计来开发mashup,但是缺少编程经验的终端用户设计的数据流程可能执行效率很低,当处理较大规模数据时mashup的响应时间会大幅增加.本文研究如何通过数据处理操作的合并拆分、次序交换、并行化等技术实现mashup的数据流程优化,提高mashup的性能及可扩展性.本文提出一种新的mashup性能优化方法,对多样化的mashup组件标注其操作语义特征属性及代价模型,定义适用于mashup的流程变换规则,针对用户设计的mashup数据流程生成所有与其语义等价的流程,并提出算法建立流程之间的代价偏序关系图从而快速选择执行代价最小的流程.文中实现了一个mashup工具,实验表明该方法可以有效提高终端用户设计的mashup的执行效率.
刘杰魏峻叶丹黄涛
关键词:MASHUP数据流程WEB2.0WEB服务
一种可追溯可验证的软件工程数据归档方法
本发明提供一种可追溯可验证的软件工程数据归档方法,涉及软件工程数据领域,基于数据单元和数据卷组织软件工程数据,保存数据单元间的衍生关系及衍生环境构建脚本和数据衍生脚本,提供自动化的数据再衍生和一致性验证机制。本发明实现了...
朱家鑫陈伟吴国全窦文生魏峻叶丹
文献传递
一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统
本发明公开了一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统,本方法为:1)对中医病案中的数据信息进行标准化和分词处理操作;其中数据信息标准化处理是指依据中医术语词表为病案中出现的症状名称、疾病名称、证型名称、证候名...
白琳任晋宇周志阳钟华刘杰叶丹
一种基于Spark SQL的分布式全文检索系统及方法
本发明涉及一种基于Spark SQL的分布式全文检索系统及方法,包括SQL翻译层、数据源管理层、并行计算层、分布式存储层,在SQL翻译层中提出了基于SQL的全文检索文法以及全文检索SQL语句在SQL翻译层各模块间的翻译过...
许利杰崔光范刘杰马志柔吴怀林叶丹