李仁德
- 作品数:41 被引量:64H指数:4
- 供职机构:上海理工大学图书馆更多>>
- 发文基金:国家自然科学基金上海市教育委员会创新基金上海市教育委员会科技发展基金更多>>
- 相关领域:文化科学经济管理自动化与计算机技术自然科学总论更多>>
- 基于LDA模型的网络刊物主题发现与聚类被引量:4
- 2019年
- 随着智能终端的普及,文本的主题挖掘需求也越来越广泛,主题建模是文本主题挖掘的核心,LDA生成模型是基于贝叶斯框架的概率模型,它以语义关联为基础,很好地解决了文本潜在主题的提取问题。对文本聚类过程的核心技术LDA生成模型、数据采样、模型评价等作了较为深入的阐述和解析,结合网络教育平台的2794篇学习刊物进行了主题发现和聚类实验,建立了包含3800个词项的词库,通过kmeans算法和合并向量算法(UVM)分两步解决了主题聚类问题。提出了文本挖掘实验的一般方法,并对层次聚类中文本距离的算法提出了改进。实验结果表明,该平台刊物的主题整体相似度比较好,但主题过于集中使得许多刊物的内容不具有辨识度,影响用户对主题的定位。
- 杨传春张冰雪李仁德郭强
- 关键词:LDA模型主题发现层次聚类文本挖掘
- 基于四阶奇异值分解的推荐算法研究被引量:3
- 2019年
- 三阶奇异值分解推荐算法可以综合考虑用户、物品标签和物品三部分信息,挖掘三者之间的潜在关系进行推荐,然而该方法并没有引入其他方面的有效信息,如用户情感。为了考虑更多维度的信息,本文在三阶奇异值分解推荐算法的基础上,提出了一种加入用户情感信息的四阶奇异值分解推荐算法。该方法基于从评论中的emoji表情提炼出的用户情感偏好,再引入四阶张量模型,存储用户、用户情感、物品标签和物品四元组数据,应用四阶奇异值分解,从而进行个性化推荐。在某在线互联网教育的实证数据集上的实验结果表明,该方法比三阶奇异值分解推荐算法以及传统推荐算法在准确率和召回率性能指标上都有明显提升,其中进行Top-1推荐时,准确率和召回率可以达到0.513和0.339。本文的工作为移动通信端的个性化推荐提供了借鉴。
- 郭强岳强李仁德刘建国
- 关键词:多维信息奇异值分解
- 基于文本挖掘的互联网教育课程主题发现与聚类研究被引量:7
- 2018年
- 如何通过有效的数据挖掘对互联网教育平台中的课程主题进行挖掘、聚类是当前互联网教育亟待解决的问题之一。实验基于文本信息对某互联网教育平台的1 472门课程体系的主题分布及类别进行了分析。采集了某平台1 472门课程的描述信息,进而通过自建词典和停用词库对文本进行切词分词,并通过TF-IDF对词频权重进行处理。利用LDA主题模型对课程的主题分布进行识别,发现了230个主题,并得到了每门课程在这230个主题下的文档–主题分布以及主题–词分布。进一步基于分布相似性函数对课程进行层次聚类,发现基于不同抽象层次主题的课程相互关联。最后将16个主题信息进行了可视化,这些主题分别从内容和数量两个角度反映出了课程的主题特征以及课程的聚合分布情况。
- 李梦杰刘建国郭强李仁德汤晓雷
- 关键词:主题发现层次聚类互联网教育文本挖掘
- 引入用户情感的高阶奇异值分解推荐算法研究
- 2018年
- 传统的三阶奇异值分解推荐算法(HOSVD)通过挖掘用户、物品标签和物品三者之间的潜在关系进行推荐,然而该方法并没有将用户的情感考虑进来。基于从评论中emoji表情提炼出的用户情感偏好,提出了一种引入用户情感的HOSVD推荐算法。该方法将emoji表情分成积极、中立和消极三类,分别给每类情感赋予不同的权重,之后计算不同类emoji表情数量的加权和来表征用户的情感;再引入三阶张量模型,应用HOSVD分解进行个性化推荐。在某在线互联网教育的实证数据集上的实验结果表明,该方法比基于物品的协同过滤算法、PersonalRank算法和采用用户-社刊分类-社刊三元组信息的HOSVD算法在准确率和召回率性能指标上都有明显提升,其中进行Top-1推荐时,准确率和召回率可以达到0.353和0.281。这为移动通信端的个性化推荐提供了借鉴。
- 郭强岳强李仁德刘建国
- 一种适用于高饱和度交叉口的公交优先信号配时优化方法
- 本发明提出了一种适用于高饱和度交叉口的公交优先信号配时优化方法,针对采用公交优先的高饱和交叉口,在其采用绿灯时间延长策略后,对其信号配时进行优化,即对后续的各个流向也采用绿灯延长,使排队长度能在三个周期内恢复到零,减少由...
- 舒仕杰赵靖韩印吴静婷李仁德龚德风
- 我国证券评论信息供给效果的统计分析
- 自中国证券市场建立以来,证券评论一直伴随着证券市场的运行而存在。证券评论运用电视、报纸、网络媒介的手段传播证券评论信息,搭起沟通市场和信息的桥梁。可以这么说,中国证券市场发展的二十年,方兴未艾的证券评论起着重要的作用。其...
- 李仁德
- 关键词:统计分析
- 高校图书馆服务与研究型读者需求的关联模式分析
- 图书馆作为高等院校中知识交流的中心以及教育教学的支持机构,在推动人才培养上起着至关紧要的作用。本文从图书馆建设与研究型读者之间的关系入手,通过高校图书馆信息资源供给与研究型读者的信息需求的主要特点与内容、深入分析两者之间...
- 李仁德张勤
- 关键词:研究型读者
- 一种基于社交行为特征的交互对象预测方法
- 本发明涉及一种基于社交行为特征的交互对象预测方法,社交行为特征,即用户与好友交互的相对频率。随着时间的变化,用户的社交行为特征分布具有稳定性。通过对在线社交网络中的交互特征的挖掘,本发明在找到交互特征的基础上,可以仅通过...
- 李仁德刘建国郭强
- 文献传递
- 一种适用于高饱和度交叉口的公交优先信号配时优化方法
- 本发明提出了一种适用于高饱和度交叉口的公交优先信号配时优化方法,针对采用公交优先的高饱和交叉口,在其采用绿灯时间延长策略后,对其信号配时进行优化,即对后续的各个流向也采用绿灯延长,使排队长度能在三个周期内恢复到零,减少由...
- 舒仕杰赵靖韩印吴静婷李仁德龚德风
- 文献传递
- 新媒体视阈下高校突发事件舆情分析及舆论引导——以S高校禁止外卖车辆入校事件为例
- 新媒体环境下,针对高校突发事件的舆情分析和舆论引导是维护学校形象、稳定校园秩序的关键。本文基于裂变式病毒传播理论,分析了高校突发事件传播特征和传播主体的嬗变;基于信息传播的S曲线扩散模型,论述了舆论传播的形成期、爆发期、...
- 徐梦琪李仁德
- 关键词:高校突发事件新媒体舆情分析舆论引导