路霞
- 作品数:2 被引量:14H指数:2
- 供职机构:南京理工大学经济管理学院更多>>
- 发文基金:国家自然科学基金江苏省“青蓝工程”基金更多>>
- 相关领域:文化科学更多>>
- 基于模型检测方法的中文专利法律状态数据清洗研究被引量:8
- 2018年
- [目的/意义]专利法律状态信息具有时序特征,其清洗工作要求保证法律状态个体的正确性和状态之间时序关系的合理性,文章设计了一个时序关系数据清洗框架,识别出专利法律状态数据中所隐藏的时序逻辑问题。[方法/过程]利用模型检测方法对法律状态信息数据库建模,构建基于时序关系的法律状态分类体系、法律状态信息数据库模型,设计专利法律状态信息清洗框架;对专利法律状态信息时序演变关系进行抽取、描述和检测。结合实证研究对提出的框架进行验证,发现专利法律状态信息在时间序列方面的常见错误模式。[结果/结论]文章设计的数据清洗框架能够将抽象的计算模型与复杂的数据清洗流程进行有机结合,为数据清洗的自动化和智能化提供了新的视角。[局限]文章设计的数据清洗框架对于出错原因的分析依赖人工参与,后续研究可关注对专利法律状态出错原因的自动分析。
- 吴鹏张叙路霞
- 关键词:数据清洗数据质量
- 中文专利数据地址信息清洗框架及实现被引量:6
- 2016年
- 文章旨在构建中文专利数据清洗框架。采用文献分析法探究数据清洗概念框架,根据实地调查法进行专利数据清洗的需求分析,进而设计得到针对专利地址信息相关的中文专利数据清洗框架,针对专利地址信息处理提出相关算法,并利用对照法对该框架进行验证优化。采用UML建模技术构建专利清洗系统模型,实现中文专利数据清洗系统以验证本文专利数据清洗框架的有效性。
- 路霞吴鹏王曰芬张金柱
- 关键词:专利数据专利信息