方宇
- 作品数:20 被引量:42H指数:4
- 供职机构:西南石油大学计算机科学学院更多>>
- 发文基金:国家自然科学基金四川省教育厅重点项目四川省教育厅青年基金更多>>
- 相关领域:自动化与计算机技术文化科学石油与天然气工程语言文字更多>>
- 面向大图的Top-Rank-K频繁模式挖掘算法
- 2024年
- 频繁模式挖掘(Frequent Pattern Mining,FPM)在社交分析中扮演重要角色,能从海量社交数据中挖掘用户行为的模式和规律,为社交网络的研究提供新的认识和决策支持.然而,对于一个FPM任务,设置一个合适的支持度阈值不容易;此外,FPM作为一个NP-hard问题,不存在多项式时间的算法.针对上述问题,提出一种无须用户设置初始支持度阈值的算法ItrMiner.该算法使用一种新的兴趣度指标对模式进行评估,综合考虑模式的大小和支持度,挖掘Top-Rank-K频繁模式.同时,为了解决去除初始支持度阈值后在算法剪枝阶段遇到的困难,提出基于树模式优先识别的策略和模式扩展约束策略,减少非必要候选模式的生成.在真实图和人工合成图数据集上进行了广泛的实验,证明ItrMiner在执行效率和可扩展性方面表现出色,尤其在稠密的数据集上,其时间开销仅为基线算法Top-K Graph Miner的13.2%.另外,提出的模式扩展约束策略的有效性较高,和无扩展约束优化的ItrMiner_(nopt)算法相比,效率提升最高可达9.5倍.
- 邹杰军王欣石俊豪兰卓方宇张翀谢文波沈玲珍
- 关键词:频繁模式挖掘支持度阈值兴趣度
- 基于SPOC+翻转课堂的国际生计算机基础课程混合教学方法探索被引量:5
- 2019年
- 分析国际生计算机基础课程教学过程中出现的若干问题及其背后原因,阐述基于SPOC+翻转课堂的混合教学模式特点,提出基于SPOC+翻转课堂的国际生计算机基础混合教学模式,并介绍该模式下的教学设计过程。
- 温柳英方宇何玉婉
- 关键词:计算机基础混合教学
- 国际学生计算机类课程教学模式研究与实践
- 2018年
- 本文论述了西南石油大学对来华学历国际学生培养过程中面临的问题和挑战,对计算机类课程建设和实践提出了新需求,对教学进行了创新设计与改革。本文从国际学生必修课程《计算机基础》出发,探讨了适合国际学生的计算机类课程教学新思维,通过改革和实施,为国际学生搭建了计算机课程学习的框架,形成了一套具有国际视角和专业特色的教学模式,为国际学生后续的学习“铺好路,打好桩”,从而能较好地促进高校国际学生教育持续健康发展。
- 方宇刘忠慧王杨闵帆牟聃
- 关键词:SEMINAR计算机基础
- 三支残差修正的燃气负荷预测被引量:1
- 2022年
- 燃气负荷的准确预测对于燃气调度、规划燃气使用有着重要的意义。单一的预测模型在燃气负荷预测中不能取得很好的预测效果,故基于燃气负荷数据的特点设计了一种三支残差修正的燃气负荷组合预测模型。首先基于燃气负荷数据特点,采用鲁棒局部加权回归对负荷序列进行了分解,针对分解后的趋势项、周期项、余项设计了ARIMA(autoregressive integrated moving average)和LightGBM(light gradient boosting machine)的组合预测模型,然后结合三支决策理论设计了三支残差修正法对LightGBM的预测结果进行修正。实验结果表明该组合模型的表现良好,预测效果优于常见单一模型。
- 王兵吴思琪方宇
- 关键词:燃气负荷预测ARIMA
- 三支边缘过采样的不平衡文本情感分类
- 2024年
- 在实际应用中,少数类样本往往包含重要信息,而传统机器学习方法通常对少数类样本的分类准确率低,且误分类代价较高。针对不平衡文本数据的情感分类问题,以三支采样(three-way sampling, 3WS)与过采样为基础,提出了三支过采样算法(three-way SMOTE,3WOS)和三支边缘过采样算法(three-way borderline-SMOTE,3WOBS),3WOS能够更好地识别边界区域上的数据,3WOBS可以增强边界区域所蕴含的信息。首先,将文本数据构建为超球,获得超球边缘的支持向量。其次,3WOS对边缘上的支持向量直接进行过采样以生成合成新样本并更新样本集,3WOBS则在生成合成新样本后根据给定条件判断是否获得该新样本并更新样本集。最后,将更新的样本集放在不同的基分类器上进行对比实验。实验采用了3个不平衡数据集,并保证了不同的不平衡比。同时,在数据集训练过程中引入粒计算思想,确保模型的鲁棒性。实验结果表明,3WOS-ITSC与3WOBS-ITSC准确率较高且代价低于其他模型,为不平衡文本分类问题提供了新思路。
- 余啟煬方宇李昭宸刘畅杨梅
- 关键词:情感分类不平衡数据采样粒计算
- 三支残差修正的时间序列预测
- 2023年
- 时间序列预测是大数据发展背景下的重要研究课题,具有广泛的应用前景,其主要任务是根据时序数据反映的发展规律去推测未来某阶段的走势,但大多数预测模型未能充分考虑残差带来的影响,无法取得更优的预测结果 .提出一种三支残差修正的融合时序预测模型,能够有效地将残差圈定在一定范围内,提高时间序列的预测精度.首先,利用时间序列分解算法STL (Seasonal-Trend Decomposition Procedure Based on Loess)将时间序列分解为趋势项、周期项和余项;其次,针对分解后的三个分量,设计轻量级梯度提升机(Lightweight Gradient Boosting Machine,LightGBM)和时间卷积网络(Temporal Convolutional Network,TCN)的融合预测模型;最后,结合三支决策理论设计了三支残差修正算法,修正余项预测过程中产生的残差,进而修正时间序列的预测结果 .实验结果证明,提出的模型在绝大多数情况下优于其他对比模型,预测效果更好.
- 方宇贾春虹吴思琪闵帆
- 关键词:STLTCN
- 基于粗糙集理论的非英语专业少数民族大学生英语词汇学习策略应用研究
- 2015年
- 针对非英语专业少数民族大学生英语词汇的培养问题,建立了粗糙集评价模型。通过问卷调查和统计收集了成都某师范学院非英语专业少数民族大学生词汇学习策略的运用数据。利用属性约简方法对数据进行了处理,分析了学习策略中的关键策略,从而给出了该学习群体的英语词汇学习策略组合,对所建立的模型的改进工作做了进一步讨论。
- 牟聃方宇
- 关键词:粗糙集少数民族大学生英语词汇形式图式
- 基于决策粗糙集的广义序贯三支决策方法被引量:7
- 2018年
- 三支决策是求解动态不确定性问题的有效方法之一。相比传统的二支决策,序贯三支决策方法在信息不充分或证据不足时能有效平衡决策结果代价和过程代价。在研究多层次的粒结构、多选择的处理对象和多样化的代价结构的基础上,提出了一种基于决策粗糙集的广义序贯三支决策模型。该模型在每一层都考虑了7种不同的对象处理方式。最后,通过实验对比分析了该模型中7种方法的效率和性能。
- 杨新李天瑞刘盾方宇王宁
- 基于粒计算的支持向量数据描述分类方法被引量:2
- 2022年
- 分类学习效果与有限训练样本的分布情况密切相关。支持向量数据描述(Support vector data description,SVDD)作为单一边界求解模型,不能良好刻画数据实际分布特征,从而导致部分目标对象落在超球以外。为了提高其分类能力,本文提出一种基于粒计算的支持向量数据描述(Granular computing-driven SVDD,GrC-SVDD)分类方法,构造多粒度层次的属性集合以及相应的多粒度超球。首先通过邻域自信息对当前粒度层的属性集合重要度进行计算,然后选择最佳属性集合对上一粒度层未达到纯度阈值的超球再训练,直到所有超球满足条件或者属性耗尽。实验部分讨论了算法参数对分类性能的影响,并通过学习获得超参数。结果表明,与SVDD及流行的分类算法相比,本文方法具有较好的分类性能。
- 方宇曹雪梅杨梅王轩闵帆
- 关键词:粒计算支持向量数据描述超球
- 多示例学习的自适应密度分布挖掘与三视角嵌入集成
- 2023年
- 多示例学习(Multi-Instance Learning,MIL)的处理对象是包含若干示例的包,包有标签而示例通常没有标签.MIL的主要任务是学习已有包的特征信息以训练分类器.基于嵌入的MIL方法的主要策略是选择代表样本,将包嵌入到新的特征空间.然而,现有的大多数算法通常难以适应多样的数据分布,且单视角的嵌入可能导致向量在新特征空间中的特征值较弱.本文提出了多示例学习的自适应密度分布挖掘与三视角嵌入集成算法,包含3个关键技术:(1)自适应密度分布示例选择技术用于挖掘负示例空间的密度分布特征,将密度较大且相连的核心示例聚类成任意形状的簇,从而获得负代表示例集合;再根据正负示例间相似性最小化原则获得正代表示例集合.(2)三视角嵌入技术用于挖掘包的正、负和整体特征信息,并将包转为三个视角下的单向量.(3)集成技术分别基于三个视角下的向量训练3个单示例分类器,并通过硬投票集成这些分类器,从而获得最终MIL模型.在实验中,我们使用了来自4个领域的30个数据集,并与7个前沿MIL算法进行对比.结果表明ADTE算法在数据集上的平均准确性高于其它对比算法,尤其在文本分类和网页推荐数据集上取得了较好的效果.
- 陈天霖杨梅闵帆杨梅
- 关键词:聚类多示例学习