石勇
- 作品数:77 被引量:678H指数:13
- 供职机构:中国科学院更多>>
- 发文基金:国家自然科学基金中国科学院研究生院院长基金北京市自然科学基金更多>>
- 相关领域:经济管理自动化与计算机技术社会学理学更多>>
- 专题:大数据与信用评价系统被引量:4
- 2017年
- 阐述了ISO 8000数据质量标准产生的背景,将ISO 8000与已有的产品质量标准ISO 9000进行对比,分析了实施ISO 8000可以为企业带来的优势,并举例介绍了ISO 8000的应用方式。分析了我国数据质量现状,并对我国在金融和医疗领域实施ISO 8000数据质量标准提出了实施建议。旨在帮助我国在大数据、数据质量等前沿研究和工业领域找到国际化标准契合点,推进大数据和数据质量建设。
- 石勇李建平
- 关键词:ISO
- 信用评分基本理论及其应用被引量:10
- 2017年
- 信用评分是市场交易的基础,以大数据分析与挖掘为支撑的现代信用评分系统在当今全球经济发展中起着不可估量的作用。各行业与领域的信用评分系统将成为实现我国"十三五"规划中国家大数据战略的首要目标。主要介绍了金融信用评分系统的发展、相关技术、应用案例,并对大数据信用评分的发展进行了展望。
- 石勇孟凡
- 关键词:数据挖掘
- 我国高校体育场馆管理发展的思考和探索——以河海大学西康路校区体育场馆为例
- 随着时代的发展,高校体育场馆应该与时俱进,以满足新时代体育教育、全民健身和体育强国的需求。同时让高校的体育场馆更好地面对大数据时代以及新型冠状病毒肺炎疫情情况。本文以河海大学西康路校区体育场馆为例,全面从体育场馆的规模、...
- 唐岸达桂冰石勇
- 关键词:高校体育场馆场馆管理
- “东数西算”战略与问题的分析研究被引量:13
- 2023年
- 2021年3月,“十四五”规划正式发布,加快数字化发展、建设数字中国是未来数字经济发展模式的目标。作为数字经济的基础,国家发布了多项规定来统筹规划、促进大数据中心一体化和算力枢纽节点(即“东数西算”)的整体建设,服务于数字经济的发展。本刊的“东数西算”专题中,根据对八大节点的实地调研情况,详细分析各地特点及面临的一系列问题。同时,基于调研结果和研究成果从地方建设和就业收益平衡、网络基础建设、政府指导和市场化并举、大数据自主软硬件评价体系、涉外数据交流和监管、人才队伍培养6个方面提出了发现的问题和相应的建议,以助力高质量地加快实施全国一体化大数据中心。
- 石勇寇纲李彪
- 关键词:大数据数字经济自主创新
- 电子商务企业全要素生产率变化及影响因素分析被引量:8
- 2017年
- 本文运用DEA Malmquist生产率指数模型,从效率变化、规模变化和技术变化的动态视角,探讨了电子商务企业的全要素生产率变化及其影响因素.研究结果显示,电子商务企业生产率增长经常伴随着技术进步、效率提升和规模扩张,这表明电子商务企业全要素生产率的变化源于以上三种要素的组合,但技术变化在驱动全要素生产率变化中起着更为关键的作用.从电子商务商业模式的角度来说,B2C电子商务模式比B2B电子商务模式和在线旅游OTA业务有更高的技术创新能力和全要素生产率水平;在线旅游OTA业务虽然实现了技术效率的改进和规模的扩张,但技术能力下滑导致其全要素生产率水平下滑;B2B电子商务模式全要素生产率水平下降的原因则在于效率、技术和规模的同步下滑.这些发现启示企业管理者应该正确处理技术、规模和效率之间的关系,同时应针对不同的商业模式采取不同的全要素生产率提升策略.
- 杨卓凡石勇
- 关键词:电子商务DATA全要素生产率
- 信用评估中的鲁棒赋权自适应L_p最小二乘支持向量机方法被引量:13
- 2010年
- 消费者信用评估是金融风险管理和信用产业竞争的一个重要方面。信用评估数据中常带有噪声点,并且其类别是不均衡的。最小二乘支持向量机是一个被广泛应用的分类模型,其模型简单,求解速度快,但鲁棒性差。本文提出了一个鲁棒赋权自适应Lp最小二乘支持向量机模型,能够适应信用评估样本数据库类别不均衡的特点,可以有效处理信用评估数据中带有噪声点的问题。在仿真数据和三个信用数据库上的实证分析表明,本文所提出的模型具有较好的鲁棒性和分类能力。
- 刘京礼李建平徐伟宣石勇
- 关键词:信用评估鲁棒自适应最小二乘支持向量机
- L2损失大规模线性非平行支持向量顺序回归模型被引量:5
- 2019年
- 顺序回归是一种标签具有序信息的多分类问题,广泛存在于信息检索、推荐系统、情感分析等领域.随着互联网、移动通信等技术的发展,面对大量具有大规模、高维、稀疏等特征的数据,传统的顺序回归算法往往表现不足.非平行支持向量顺序回归模型具有适应性强,在性能上优于其他基于SVM的方法等优点,该文在此模型基础上提出基于L2损失的大规模线性非平行支持向量顺序回归模型,其中线性模型的设计可处理大规模数据,基于L2的损失可使标签偏离较大的样本得到更大惩罚.此外,该文从模型的两种不同角度分别设计了信赖域牛顿算法和坐标下降算法求解该线性模型,并比较了两种算法在性能上的差异.为验证模型的有效性,该文在大量数据集上对提出的模型及算法进行了分析,结果表明,该文提出的模型表现最优,尤其采用坐标下降算法求解的该模型在数据集上获得了最好的测试性能.
- 石勇李佩佳汪华东
- 关键词:支持向量机
- 基于医疗数据挖掘的患者住院天数预测研究被引量:2
- 2020年
- 目的探索数据挖掘技术在预测住院天数上的应用,为医院管理提供辅助数据支持。方法采集某三级甲等医院2015―2016年病案首页数据,通过单因素分析结合专家建议筛选特征属性,使用支持向量机对住院天数进行分类预测实验。结果筛选出10个属性作为实验特征属性,住院天数分为极短期(1天),短中期(2至14天),中长期(15至28天),长期(28天以上)。在四分类预测中,极短期,短中期及长期住院患者预测效果较好;二分类预测中,短中期与长期住院患者预测效果较好。结论预测结果可以为医院前置综合管理提供决策支持,如病区医疗资源分配、床位周转、异常住院天数人群干预等。
- 庞震孙静李佩佳张欣阳石勇杨宇飞
- 基于数据科学的商业银行客户信用评分理论及系统研究
- 石勇周宗放寇纲彭怡曾勇田英杰马红兵
- 该成果在一系列理论研究的基础上,针对中国实际,将多目标线性规划理论应用于数据挖掘,并在数据挖掘的算法和模型上进行创新,应用于中国商业银行客户信用评分,在国内开创了在中国用多目标线性规划理论和数据挖掘算法和模型进行客户信用...
- 关键词:
- 关键词:数据挖掘算法
- 京津冀都市圈经济增长的空间极化及其模拟研究被引量:57
- 2010年
- 在利用空间极化指标对京津冀都市圈1993—2007年的空间极化变化趋势进行测算的基础上,采用GIS空间分析技术的二维和三维空间表达形式,对近15年来京津冀都市圈经济极化增长进行空间模拟,从时间和空间两个维度分析京津冀都市圈空间极化过程。得出的主要结论:①京津冀都市圈经济增长极化随时间呈上升趋势。②京津冀都市圈经济增长自经济中心向外围的变化趋势并不完全遵循距离衰减规律,离经济增长中心80km处是京津冀都市圈经济增长的低谷点。③从京津冀都市圈立体趋势面分析,北京和天津是京津冀都市圈的两大极核,且空间极化趋势面随时间呈扩大趋势。
- 马国霞田玉军石勇
- 关键词:空间极化经济增长京津冀都市圈