上海市博士后科研资助计划资助(10R21421900)
- 作品数:11 被引量:32H指数:3
- 相关作者:魏芳朱鲲鹏费仲超胡俊华倪萍更多>>
- 相关机构:上海贝尔股份有限公司复旦大学大连理工大学更多>>
- 发文基金:上海市博士后科研资助计划资助更多>>
- 相关领域:自动化与计算机技术社会学经济管理更多>>
- 移动互联网视频传输优化的架构研究被引量:2
- 2012年
- 随着3G移动互联网的快速发展,在手机等移动终端上看视频成为一种日常应用。但互联网上的大部分视频对于移动用户而言,其码率相对较大,而且移动用户的可用带宽受环境影响变化大,不稳定,影响了用户观看视频的体验。提出一种针对移动互联网的视频传输优化解决方案的系统架构,该架构从缓存和压缩两个方面入手,通过缓存缓解运营商的骨干网流量压力,通过视频压缩降低视频码率以满足用户的实际接入带宽。该架构既为运营商节约了带宽、降低了运营成本,同时也保证用户观看视频的连续性,提高用户体验。
- 张世乐魏芳费仲超
- 关键词:移动互联网缓存视频压缩
- 基于文档相关度计算的网页预测模型被引量:3
- 2012年
- 基于网络日志挖掘的网页预测系统可以有效地分析用户未来的网络访问请求,从而达到智能推荐、改善网络性能等目的。针对目前的预测模型缺乏有效的语义处理的问题,将词语语义信息和统计语言模型相结合,提出一种基于文档相关度计算的网页统计预测模型。通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为预测的依据。实验表明,该技术使预测模型的性能获得了较大的提高。
- 朱鲲鹏魏芳
- 关键词:统计语言模型日志挖掘
- 口语对话中非名词指代的消解
- 2012年
- 代词指代消解是全面理解口语对话不可缺少的一部分。根据口语不同于书面语的特点以及非名词指代先行项的特点,在前人工作的基础上提出了一套适合于在口语对话生语料上消解非名词指代的算法。算法基于非名词指代的右边界规则理论,给出了判断候选先行项属于"线性紧邻"还是"层次紧邻"的判别方法,同时给出了候选先行项的过滤规则。算法在公开发布的口语对话语料Tran is-93上进行了测试,实验结果表明,算法提高了消解的正确率和召回率,能消解更多不同的代词,且适用于口语对话生语料。
- 费仲超魏芳朱鲲鹏
- 关键词:指代消解
- 基于PESQ算法的彩铃铃音质量评估系统被引量:4
- 2012年
- 提出一种基于PESQ算法的彩铃铃音质量评估系统,将通过网络传输后录制的音频文件与上传到彩铃平台上的对应的音频文件通过音质评价模块进行算法比较,得出客观评价,预知传输网络对该彩铃的影响到底有多大,从而得出该铃音是否适合作为彩铃铃音使用的结论。同时,通过对录制铃音的主观评价以及通过该系统对铃音的客观评价对比,最后确定该系统的主观和客观相关度达到95%以上,证明该系统可以以较高的准确率判断某音乐文件是否适合在某一地区作为彩铃铃音使用。
- 倪萍魏芳
- 关键词:PESQ
- 移动社会性网络中基于朋友关系的社区服务
- 2012年
- 移动社会性网络服务引领了网络发展的新时代,是以帮助人们建立社会性网络为目的的互联网应用服务,受到了广大用户的喜爱。但是这些网站繁多,用户登录所有的网站不太方便。针对社会性网络,运用种子扩展的算法对网络用户所有的社交关系进行归纳分析,构造出"好友圈子",为用户提供社区服务。对某大学的产品调研表明好友圈子为用户提供了便捷、聚合性的服务,为商家寻求盈利模式提供了新的关注焦点,具有较高的商业价值。
- 魏芳刘钦朱鲲鹏
- 关键词:社会性网络服务
- WSAM:互联网UGC文本主观观点挖掘系统被引量:3
- 2012年
- 互联网上的用户生成内容UGC(User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值。设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分。分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型。挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断。算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点。实验验证,WSAM系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opin-ion Mining)等相关应用,同样也能达到较好的结果。
- 费仲超朱鲲鹏魏芳
- 关键词:用户生成内容UGC自然语言处理情感分析
- 基于用户日志挖掘的查询扩展方法被引量:13
- 2012年
- 查询扩展可以有效地消除查询歧义,提高信息检索的准确率和召回率。通过挖掘用户日志中查询词和相关文档的连接关系,构造关联查询,并在此基础上提出一种从关联查询中提取查询扩展词的查询扩展方法。同时,还提出一种查询歧义的判别方法,该方法可以对查询词所表达的检索意图的模糊程度进行有效度量,也可以对查询词的检索性能进行预先估计。通过对查询歧义的度量来动态调整扩展词的长度,提高查询扩展模型的灵活性和适应能力。
- 朱鲲鹏魏芳
- 关键词:查询扩展日志挖掘信息检索
- 基于代理的互联网用户行为分析研究被引量:1
- 2011年
- 在互联网智能化的过程中,互联网用户行为的分析是一个必要的工作。通过架设网络代理,记录用户在互联网上发出的HTTP请求,建立用户行为日志库,并根据Web访问的特性对用户行为日志进行过滤、聚类,缩减数据规模,最后利用开放式分类目录ODP(Open Directory Project)对用户行为进行分类统计,将没有语义信息的用户Web访问记录转化为体现用户偏好的统计直方图。该分析结果可用于互联网信息的个性化推荐,如新闻、商品、广告等,具有较高的商业价值。
- 张世乐魏芳费仲超
- 关键词:用户行为聚类
- 一种提高无线传感网络数据模式可读性的方法被引量:1
- 2012年
- 无线传感网络目前在智能建筑中得到大规模的应用,从而产生大量的历史数据。提出一种提高无线传感网络中数据模式可读性的方法,包括两个步骤:(1)通过数据预处理的方式使得数据在预处理后再利用经典FP-Growth关联规则挖掘算法得到的模式更符合人的常识;(2)在产生的模式中利用状态图对模式进一步压缩,得到可读并且易于理解的模式集合。
- 倪萍魏芳
- 关键词:智能建筑无线传感网络数据清洗
- 3G无线网络条件下的用户行为分析被引量:6
- 2012年
- 随着无线通信技术和计算机网络技术的快速发展,通过移动手持设备快速有效地接入互联网成为广大用户的迫切需求,了解和分析无线用户的行为模式显得十分必要。对一个小区内通过3G无线上网用户的数据进行记录,处理后以此为基础估计数据之间的关系,得出流量、IP数和用户数之间随着时间变化的潜在关系,进一步得出反映无线互联网用户行为习惯的活跃指数。分析结果为无线互联网的性能的改进和提高,以及无线网络服务商合理决策提供了数据依据,具有重要的商业价值。
- 胡俊华魏芳平金玉
- 关键词:用户行为分析