柯勇
- 作品数:4 被引量:12H指数:2
- 供职机构:中国科学院计算机网络信息中心更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种MongoDB应用优化策略被引量:4
- 2017年
- 为了解决不断增长的文件存储需求,和高流量高并发的访问量,增强系统的响应性能,提出一种Web应用优化策略,通过MongoDB Grid FS对网站文件存储容量、可用性和可靠性进行扩展,并且通过Nginx和Keepalived,对后台访问进行负载均衡和双机热备,优化并发性能.实验表明,当并发访问数上升至80以上时,平均访问响应时间缩短9%.文件通过Nginx Gridfs进行高并发上传时非常稳定,在较大文件下载时比直接通过本地文件系统EXT4下载速度更高.
- 卢至彤李翀柯勇孙健英
- 关键词:MONGODBNGINXCONCURRENCY
- 一种海量数据文件高效持续受控共享分发方法及系统
- 本发明公开了一种海量数据文件高效持续受控共享分发方法,其步骤包括:1)选取多个服务器作为接收数据的文件服务器,选取一服务器作为中央服务器,其上设置一数据库,包含一数据文件信息表、一用户表、一用户数据文件类别授权表、一用户...
- 何晓涛刘学敏李翀柯勇曾丹
- 一种分布式用户浏览点击模型算法被引量:8
- 2019年
- 为从海量搜索点击日志中快速挖掘用户行为,提出一种分布式用户浏览点击模型(UBM)算法。原始UBM算法求出的检验度参数E只与搜索结果文档所在排序位置以及上一文档的点击位置有关,且非常稳定,基于此特性,将EM迭代求解转换为抽样估计检验度以求解吸引度的分布式UBM算法。在Spark数据平台上进行仿真,结果表明,与原始UBM算法相比,该算法能够解决点击日志中存在的严重数据倾斜问题,且运行效率较高。
- 张浩盛伦李翀柯勇张士波
- 关键词:搜索引擎
- 一种海量数据文件高效持续受控共享分发方法及系统
- 本发明公开了一种海量数据文件高效持续受控共享分发方法,其步骤包括:1)选取多个服务器作为接收数据的文件服务器,选取一服务器作为中央服务器,其上设置一数据库,包含一数据文件信息表、一用户表、一用户数据文件类别授权表、一用户...
- 何晓涛刘学敏李翀柯勇曾丹