您的当前位置:首页正文

基于大数据分析技术的用户行为分析平台设计与实现

2021-10-15 来源:年旅网
ISSN1009-3044ComputerKnowledgeKnowledgeandandTechnologyTechnology电脑知识电脑知识与技术Computer与技术Vol.15,No.35,December.2019E-mail:xsjl@dnzs.net.cn第15卷第35期(2019年12月)http://www.dnzs.net.cnTel:+86-551-6569096365690964基于大数据分析技术的用户行为分析平台设计与实现罗嘉龙,苏毓洲,方健炜,陈正铭(韶关学院信息科学与工程学院,广东韶关512000)摘要:随着大数据时代多元化商业模式和细分市场的快速发展,众多行业面临着高昂获客成本和流失率的双重挑战,如何精确获取用户行为数据成为重中之重。为解决问题,该文提出基于大数据分析技术的用户行为分析平台,对用户行为数据进行统计分析,优化企业营销策略,精细化运营。本项目通过测试,证实能更好地对任意网站进行用户数据获取和挖掘利用。关键词:大数据;获客成本;高流失率;用户行为分析;精细化中图分类号:TP393文献标识码:A开放科学(资源服务)标识码(OSID):文章编号:1009-3044(2019)35-0054-03DesignandImplementationofUserBehaviorAnalysisPlatformBasedonBigDataTechnologyLUOJia-long,SUYu-zhouFANGJian-wei,CHENZheng-ming

(DepartmentofInternetofPhysicalEngineering,ShaoguanUniversity,Shaoguan512000,China)

Abstract:Withtherapiddevelopmentofdiversifiedbusinessmodelsandmarketsegmentsintheeraofbigdata,manyindustriesfacethedoublechallengeofhighcustomercostandchurnrate.Howtoaccuratelyobtainuserbehaviordatahasbecomeatoppriority.Inor⁃dertosolvetheproblem,thispaperproposesauserbehavioranalysisplatformBasedonbigdataanalysistechnology,statisticalanalysisofuserbehaviordata,optimizationofenterprisemarketingstrategy,andrefinedoperation.Throughtesting,thisprojectprovesthatitcanbetteracquireandexploituserdataforanywebsite.Keywords:bigdata;customercost;highchurnrate;userbehavioranalysis;refinement时至今日,大数据(bigdata)一词频繁出现在各信息领域。据预计,到2020年全球每天所产文件、图片、视频等各类信息

[2]

数据量可达35ZB(240GB量级),并还在增长,这些庞大数据中包含着丰富的用户行为信息。如何及时、精确地从这些信息中统计、分析出对企业有用的数据信息,挖掘出这些信息背后隐含规律和价值,已成为制约企业决策发展战略,开拓市场和扩宽客户群的重要因素[3]。目前企业主流做法是引入类似于诸葛IO,百度统计等第三方模块,或者另外自行开发后台统计模块。为此,本文设计用户行为分析平台[4],运用大数据分析技术、Lu⁃cene全文检索交叉分析算法,自定义埋点技术,摒除接入第三方服务进行用户分析所带来的风险,对数据进行用户渠道转化、新增、留存、多维度交叉分析,能很好地发现潜藏规律,预测数据未来走向,并以图表可视化形式展示,很大程度上满足了企业决策者需求。

1存在问题描述经市场调研,传统的企业开发网页系统普遍存在问题如下:

1)性能问题:用户在日常体验过程,网页往往会生成大量的新增留存数据。传统企业开发网页系统需要及时对其进行数据处理并分析数据所带来的潜在信息,这一过程会极大消耗

服务器大量性能,同时对系统性能造成一定损耗。

2)获客成本问题:传统网页开发系统为了处理网页用户数据往往会消耗一定成本自行开发,或者接入第三方服务统计功能模块,从而导致企业开发网页获客成本高昂,得不偿失。

3)安全性问题:目前,部分企业会接入第三方服务来优化数据统计模块(如诸葛IO,百度统计等),虽然成本较低,但所有分析都将暴露给了第三方平台,数据存在泄漏的可能,隐含着极大安全隐患。

4)用户高流失率[1]问题:企业传统网页在开发过程中统计方式单一,数据处理与分析方面还做得不够完善,如何提高用户体验感迫在眉睫,用户流失高问题日渐体现。

5)市场营销定位问题:一个精确、符合大众用户的营销策略决定一个企业的盈利亏损。传统网页开发对在挖掘用户数据潜在价值这一模块缺乏重视,制约着决策者对市场营销数据流动进行正确的价值评估,往往导致决策者无法作出精确营销[5],造成经济上不必要的损失。

2系统设计理念与模块用户行为分析平台设计采用SSM+MAVEN框架进行开发,严格遵守着MVC思想,分析统计各个网站的浏览量,用户群体访问量,为用户提供较好的决策方案,操作简单、数据准确,具

收稿日期:2019-10-11基金项目:韶关学院大学生创新创业训练计划立项项目(省级)(S201910576037)54

软件设计开发本栏目责任编辑:谢媛媛

第15卷第35期(2019年12月)

有良好的个性化服务的特征其中本系统在事件的搜索上使用了全文检索,提高了网站的查询效率。由于在数据量庞大,基于大数据可视化的统计不可避免,为此,本系统做到了各种报表的导出与统计图下载相结合,采用多维度细分时间分析,提供新增、活跃、留存访客等分析数据,通过大数据精确分析[6],同时还提供标签反向检测,减少数据错误,为决策者、网站管理者提供帮助。平台主要分为以下模块:

图1用户行为分析平台总体模型设计3系统实现3.1系统架构流程介绍如下图2所示,当用户对网站进行操作,用户行为数据将

会发送至本系统的接收器,接收器通过算法对数据进行筛选与过滤,进而把有效数据存储进数据仓库。当数据仓库接收到数据后,系统利用一系列如用户活跃度、终端分析、地域分析等大数据用户行为分析算法,根据用户在网页的浏览行为进行加权评分,然后全局比较,分析用户活跃沉默用户,同时会将计算后的结果趋势分析,分析出用户是否留存,最终以大数据分析图表技术展示,并把结果返回给用户。同时,基于数据量较大影响系统的检索速度的不足,本系统采用全文检索算法[7],从根本上解决搜索检索效率的问题,最后将会把数据回馈展示到系统页面上,以提供用户实时使用。同时,本系统为解决获取的用户数据可能因网站版本的迭代或传输过程中出现错误的问题,设计开发出验证检测模块,该模块利用爬虫与标签递归算法检查数据正确性,保证了统计数据的完整性。

图2用户行为分析平台架构3.2系统设计总流程点方案1)调查网上各类统计平台的需求,设计平台需求文档,(presentation)-Web2)[8]

设计系统设计,不断吸收大众的意见,Browser/Web/DataBase3总结出明确的文档。

序扩展功能的Web浏览器、服务器功能层、数据(business层体系架构:层(dataservice)logic)-具有应用程表示层-数据库服务器。

本栏目责任编辑:谢媛媛

ComputerKnowledgeandTechnology电脑知识与技术

3)subpage4)对系统模块进行划分,设计后台数据库,明确各个模块的功能和联系。、user规范设计出数据库表,包含event、log、发,完成前后端数据交互。最后再完成移动端页面的实现。

5)编程和调试,、useraction完成前端页面设计与实现和后端功能的开、userdetail、web、webdetail等表。

显示器进行可用性测试。

6)α测试:计算本机测试,采用不同浏览器和不同分辨率7)试过程中发现的8)项目部署到云端。β测试:让测试人员采用不同的设备进行测试,修改测3.3关键功能实现9)调试修改代码,BUG。

根据测试结果,修改程序的不足之处。前端埋点方案有button$('button').click(functionbutton按钮标签数据获取相关部分代码:

(){//前端Javascript代码获取所有minif($(this).attr('min')标签并进行点击事件处理

==null){//判断植入页面button是否具var属性

varlabelvarvalue=='button';this.value;//赋值该//赋值该buttonbutton为label

标签valuevartextvarid==this.id;this.innerText;//赋值该//赋值该buttonbutton标签标签idinnerText值为为tex//var赋值该classnamelabelnamebutton=为id=this.name;标签this.className;

className//赋值该为buttonclassname

标签//=label==''||label==null?'':name为nameid三元表达式判断label值是否为空label;//=id==''||id==null?''name;

classname三元表达式判断=classnameid值是否为空

:id;==''||classname==null?'':class⁃//name三元表达式判断//=name==''classname||name值是否为空text三元表达式判断//=text==''||textname==值是否为空==null?'':name;null?''value三元表达式判断//var三元表达式判断=value==''text||value值是否为空

:text;==null?'':value;//'+

var三元表达式判断tab=this.outerHTML==null?\"\":this.outerHTML;vallue值是否为空

message='label='outerHTML+label值是否为空

+'&id='+id+'&className=+value+'&tab='+tab;classname+'&name='+name+'&text='+text+'&value='console.log(message);//赋值if(tab!=null&&tab!=''&&tab!='undefined'){//后台输出message

message进行测试//sendMsg(message);判断tab是否为null或undefined}}});

//发送到后端当页面植入用户行为平台所下载的代码,点击任意button,即可输出该classNamebutton标签label名、value、innnerHTML、name、id在后端输出的结果。

等一系列标签属性。如图3所示,是button标签测试、软件设计开发

55

ComputerKnowledgeandTechnology电脑知识与技术图3button按钮获取代码实现效果当用户进行用户行为,系统会自动监控用户行为所产生的数据,并对其进行访客分析,以1小时实时记录访问者行为,在线时间、在线人数有多少个。分多时间纬度观察近期访问者数量通过折线图展示,而访问者详细细节通过表格呈现(包括他们通过什么浏览器访问、访问时间、访问的操作系统、访问的页面、访问的IP),并对其进行地域分析,记录访问者的来源地,如图4所示通过中国地图形式展现出来。

图4后台网站概况页面图5访客分析和访客明细表56

软件设计开发第15卷第35期(2019年12月)

4结束语随着互联网技术的进步和快速发展,精细化运营逐渐成为市场主流,而用户行为数据分析的重要性日渐凸显。本文讲述基于大数据分析技术的用户行为分析平台设计与实现流程,致力于解决现有市场普遍存在的成本、安全等一系列问题,同时可以有效提高用户体验,很好的分担决策者压力。目前,本系统多次测试结果基本满足设计需求。综上所述,本文系统设计顺应社会发展趋势,具有较好的商业实用性和较高的市场价值。

参考文献:[1]赖院根,刘敏健,王星.网络环境下的信息用户流失分析[J].情[2]报科学何运祺,2011,29(11):1736-1741..基于Hadoop移动大数据的用户行为分析[3]兰州理工大学[D].兰州:陈恩红[4][J].郝增勇安徽大学学报,陈玉莹,2017.,潘镇,等.用户序列行为分析研究与应用综述.基于Hadoop:自然科学版,2018,42(5):39-51.[5]京杨芮:北京交通大学,2014.用户行为分析系统设计与实现[D].北[6]京闫朝阳:北京交通大学.Web用户行为数据收集统计系统的设计与实现[D].北.基于Web,2015.的大数据分析平台交互设计研究[7]2019(17):94-97.[J].设计,王鹏[8]电大学.基于,2017.Hadoop全文检索的研究与应用[D].重庆:重庆邮学廖建军,2019..Web信息的无埋点精准采集[D].北京:北京邮电大【通联编辑:梁书】

本栏目责任编辑:谢媛媛

因篇幅问题不能全部显示,请点此查看更多更全内容