试问一下达托机器人(DRB)如何利用智能陪伴机器人算法分析用户行为和偏好?


【摘要】:为了避免敏感信息对用户行为特征研究的局限,响应手机智能化脚步,文章提出以APP应用程序为标识的分析思路,借助决策树和其他七个分类模型,刻画用户行为特征,完成选择偏好预测。研究表明,决策树建立手机属性与APP应用程序间的关系,发现不同类型的手机用户行为特征规律。经过对比研究不同手机类型APP选择偏好的分类准确性,选择预测效果最佳模型——随机森林和Bagging,为智能手机由研发阶段投入市场环节提供方法学依据。}
淘宝作为国内消费者首选的网上购物平台,每天都会产生数以亿计的数据,本文将对淘宝用户在使用淘宝过程中的行为数据进行分析,用户行为包括:点击,收藏,加入购物车以及购买,使用sql,excel分析工具对其进行数据分析,进一步了解用户行为,分析淘宝业务,并提出相应的运营建议。一、明确问题和分析思路1、提出问题1)分析用户使用app过程中常见的数据分析指标,分析各个环节的流失率,找出薄弱环节,提出改进意见。2)分析用户在不同时间周期下的活跃规律;3)分析用户对不同商品种类的偏好,制定差异化的运营策略;4)找出核心付费用户群,统计这部分用户购买的产品以及类目,根据购买偏好制定营销策略。2、分析思路1)AARRR漏斗模型分析法其本质和OKR工作法一样,是分解和量化,整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。2)RFM模型分析法RFM模型是衡量客户价值和客户创利能力的重要工具和手段,通过客户分类区分无价值、高价值客户。二、理解数据1.数据来源阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649数据集包含了2014年11月18日至2014年12月18日之间期间,一个月内淘宝APP的用户行为数据。由于原数据集过大,本次分析导入100万条数据。2. 理解字段1)查看数据select * from tianchi_mobile_recommend_train_user;2)理解字段含义三、数据清理1)选择子集针对分析的问题,选择对解决问题有价值有意义的数据。这里不需要user_geohash这一列。2)修改表名和列名将列名修改为users,为方便查询,将behavior_type修改为type,item_category 修改为category。-- 修改表名
rename table tianchi_mobile_recommend_train_user to users;
-- 修改字段名称和类型
alter table users change behavior_type type varchar(20);
alter table users change item_category category varchar(20);3)删除重复值用户会进行多次购买,不应删除重复值。4)缺失值处理select * from users where user_id is null;无缺失值。5)一致化处理时间数据中的日期和小时存在于time列中,需要将其拆分成两列,以便分别研究每日和小时内的数据变化。ALTER TABLE users CHANGE time date CHAR(20);
ALTER TABLE users ADD time CHAR(20);
UPDATE users SET time=date;
UPDATE users SET date=SUBSTRING(date from 1 FOR 10);
UPDATE users SET time=SUBSTRING(time from 12 FOR 2);用户行为type中的1,2,3,4修改为pv、fav、cart、pay。UPDATE users SET type=REPLACE(type,1,'pv');
UPDATE users SET type=REPLACE(type,2,'fav');
UPDATE users SET type=REPLACE(type,3,'cart');
UPDATE users SET type=REPLACE(type,4,'pay');数据处理是数据分析的前提,对有效的数据进行分析才是有效的。清洗后的数据如下:四、数据分析分析用户行为的相关指标,构建用户行为的漏斗模型利用AARRR模型分析用户行为,数据主要涉及用户激活和购买转化的环节,分析用户从浏览到购买这一整个过程的流失情况,包括浏览、收藏、加入购物车和购买环节。UV:独立访客数PV:页面浏览量SELECT count(distinct user_id) as UV,
(SELECT count(*) from users where type='pv') as PV,
(SELECT count(*) from users where type='pv')/count(distinct user_id) as 'PV/UV'
FROM users;如果一个UV访问了三个页面,那么就是3个PV,计算可知PV/UV约为117,可知淘宝的网页浏览度较高。跳失率:只点击一次浏览的用户数量/总访问用户数量select count(*) from (select user_id from users
group by user_idhaving count(type)=1)
as X;可知,11月18日至2014年12月18日这一个月内,有71个人只点击过一个页面就离开了,71/8058=0.88%,占总访问量的0.88%。可得知淘宝APP对于用户来说有足够的吸引力。用户行为的漏斗模型select type,count(*) as '用户数' from users
group BY type
order BY count(*) DESC;从Mysql中到处数据到excel,得出漏斗模型从漏斗图可看出,用户从浏览到有意购买的转化率为5.1%,转化率比较低,也就是流失率为94.9%,当然用户也可能跳过了收藏和加入购物车这两部直接进行购买,但这也说明了APP的收藏和加入购物车的这两个功能被使用较少,从有意购买到最终购买的转化率为20.3%,可得出从pv到cart、fav这两个环节是提升指标的重要环节。独立访客漏斗图select type,count(DISTINCT user_id) as'用户数' from users
group BY type
order by count(DISTINCT user_id);可计算出,付费用户占比51%,付费转化率并不高,还需拉取以往数据,进行月份对比,才能得知用户付费转化率是提升了还是下降。2. 分析不同时间段下的用户行为1)该月份每天的用户行为select date,
sum( case when type='pv' then 1 else 0 end )as '浏览量',
SUM(case when type='fav' then 1 else 0 end) as '收藏量',
sum(case when type='cart' then 1 else 0 end )as '购物车',
sum(case when type='pay' then 1 else 0 end )as '付费数'
from users
group by date
order by date;从表中可得知,在2014/12/12日四项用户行为指标均达到了高峰,付费用户也超过了收藏量,得益于双十二的促销活动。因为大部分用户都已经提前选择好自己想要购买的商品,等着在这一天进行购买。2)每周内每一天的用户行为这里选取避开双十二的两周时间进行分析,作图如下:从两张表中可看出,周五为各行为指标最低的一天,可能周五是一周中大家最疲惫的一天,周天达到最高,周一到周四也不低。3)分析每小时的用户行为每小时里的各行为的平均数量select time,
round(sum( case when type='pv' then 1 else 0 end )/30 ,0)as '浏览量',
round(SUM(case when type='fav' then 1 else 0 end) /30 ,0)as '收藏量',
round(sum(case when type='cart' then 1 else 0 end )/30,0 )as '购物车',
round(sum(case when type='pay' then 1 else 0 end )/30 ,0)as '付费数'
from users
group by time
order by time;从表中可看出,一天内,浏览量、收藏量、加入购物车以及付费数均在下午5点后越来越高,到晚上7点-0点达到最高峰,早上八点到10点之间也有一个高峰期,符合大部分人员的作息时间。促销活动可以针对这两个高峰期进行重点投放。3. 不同商品种类的偏好统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品。SELECT 购买次数,count(item_id) FROM
(SELECT item_id,count(user_id) as'购买次数' from users WHERE type='pay' GROUP BY item_id) as A
GROUP BY 购买次数
ORDER BY count(item_id);select count(DISTINCT item_id) from users
where type='pay';可得出,只购买一次的商品有9037种,购买两次的商品有277种,本次分析的商品中用户购买的商品种类共有9362种,却没有出现购买数量非常集中的商品,购买一次的商品占到96%,说明本月商品售卖主要依靠长尾商品的累积效应,无爆款商品来推动销量。列出销量排名前十的商品:SELECT item_id,count(user_id) as'购买次数' from users WHERE type='pay' GROUP BY item_id
ORDER BY 购买次数 DESC
limit 10;从图中可看出,购买次数最多的商品是303205878和127247596,并不是浏览次数最多的,甚至没有进前十,说明这些更能吸引用户注意力的商品没有很好的转化为实际销量。可以看到销量第一的商品303205878收藏数为3,收藏数与购买数的关系更为直接。4. 基于RFM模型找出有价值的用户数据源中没有相关的金额数据,我们首先统计出用户购买商品的最大值和最小值,因此通过 R 和 F 的数据对客户价值进行评估。1) R - 最近一次消费时间为一个月30天,设区间为0-30,分为五档:0-6,7-12,13-18,19-24,25-30,对应评分为0,1,2,3,4create VIEW X AS
SELECT user_id, DATEDIFF('2014-12-18',MAX(date))
AS B
FROM users WHERE type='pay'
GROUP BY user_id;
select user_id,
(CASE WHEN B BETWEEN 25 AND 30 THEN 0
WHEN B BETWEEN 19 AND 24 THEN 1
WHEN B BETWEEN 13 AND 18 THEN 2
WHEN B BETWEEN 7 AND 12 THEN 3
WHEN B BETWEEN 0 AND 6 THEN 4 ELSE null END) as R
from
X
ORDER BY R DESC;2) F-消费频率select user_id,count(item_id) from users
where type='pay'
group by user_id
ORDER BY count(item_id) DESC;付费用户中,一个月内消费次数从低到高为1-82次,分为五档,分别为1-17,18-34,35-51,52-68,69-85CREATE view Y AS
SELECT user_id,count(item_id) AS C from users
where type='pay'
group BY user_id;
SELECT user_id,
(case WHEN C BETWEEN 1 AND 17 THEN 0
WHEN C BETWEEN 18 and 34 then 1
when C BETWEEN 35 and 51 then 2
when C BETWEEN 52 and 68 then 3
when C BETWEEN 69 and 85 then 4 else null end) as F
FROM Y
order by F DESC;链接R和F的评分结果进行分析:SELECT t1.user_id, t1.R,t2.F from t1 left JOIN t2
on t1.user_id = t2.user_id
ORDER BY t2.F DESC;从上表中可得知付费用户的RF评分,这里姑且不谈M来进行分析,其中用户ID为122338823、51492142、123842164三位用户的R和F值都为4分,是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,用户51492142、123842164的R值为4,F值为2,也应重视,不要引起用户反感。对于R值为4而F值为0的付费用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,可进行回访,清楚这部分用户与RFM值较高的用户进行对比分析,提高用户使用app的频率,其次通过拼团打折、积分兑换等活动吸引用户。五、结论和建议本文分析了淘宝app用户行为数据100万条,从四个不同角度提出业务问题,过程中使用AARRR模型和RFM模型分析数据给出如下结论和建议。基于AARRR模型分析用户使用的各个环节1)获取用户:用户如何找到我们?淘宝在获取用户这一环节已经做的很棒了,目前淘宝已经有了比较多的投放渠道,比如自然搜索排名、直通车等内流量渠道,百度推广等外流量渠道,微信、微博等SNS流量渠道。高效利用这些投放渠道提高渠道曝光率、日新增用户等。2)激活用户:用户的首次体验如何?根据UV和PV值,一个月内,有71个人只点击过一个页面就离开了,71/8058=0.88%,占总访问量的0.88%,说明用户的活跃率非常高。3)提高留存:用户会回来吗?从浏览到有购买意向只有5.1%的转化率,当然有一部分用户是直接购买,但也说明大多数用户以浏览页面为主而购买转化较少,从有意购买到最终购买的转化率为20.3%,转化率也不高,可能是平台推荐的产品并没有让用户很满意。此处为转化漏斗中需要改善和提高的环节。针对这一环节改善转化率的建议有:优化电商平台的搜索匹配度和推荐策略,根据用户喜好推荐相关的商品,优化商品搜索的准确度和聚合能力,对搜索结果排序优先级进行优化。首页直接推荐产品,不放无效信息,减少用户寻找信息的成本;优化加入购物车和收藏按键的触达,用户在滑屏时也能方便触达,增加功能使用的次数。回访流失客户,这是最直接的了解流失原因的方式。4)增加收入使用APP的用户中有51%的付费用户,付费转化率不够可以与前期月份数据进行对比,得出这个月的付费转化率的高低。5)用户推荐淘宝本身知名度高,可关注非一线、二线城市的用户,针对三四线城市进行渠道下沉,这部分人群高度关注价格的高低,以及是否包邮,开展类似拼多多的拼团转发和打折促销活动,扩大这部分用户的使用率。2. 分析用户在不同时间周期下的活跃规律一个月中的消费活动在平时以一周为周期进行波动,而双十二促销期间各项指标达到高峰。一周中的高峰期在周末,周五最低,而平时一天中有两个高峰期,一天24小时,用户下午5点后越来越活跃,至晚上9-10点达高峰。针对高峰期进行营销活动收益最高,此时使用人数最多,活动容易触达用户,营销活动的形式可以通过促销、拼团等形式进行。3. 分析用户对不同种类商品的偏好商品售卖主要依靠长尾商品的累积效应,而非爆款商品的带动。销量最高的商品,浏览量甚至没有进前10,而浏览次数最高的商品甚至没有进入销量前10,说明这些吸引用户较多注意力的商品没有很好的转化为实际销量。针对浏览量高而销量不高的这部分商品,需要提高的是用户从点击进入商品详情页到最终购买的体验。作为商家端可以从以下几个方面提高销售额:商家为了吸引用户点击在商品展示页投放的价格具有较强吸引力,但实际价格偏高,在用户心中反而引起反感;详情页的信息流展示是否合理,是否将用户最想看到的部分置于容易看到的位置,便于信息的获取优化商品展示的形式,利用视频等方式给用户更直观的感受,提高照片的美观程度;评论区评价管理,尤其对于差评区的用户反馈进行认真对待,提高自身服务质量。4. 基于RFM模型找出最具价值的核心付费用户群R和F评分都很高的用户是体系中的最有价值用户,需要重点关注。并且活动投放时需谨慎对待,不要引起用户反感。对于R值为4而F值为0的用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换、产品包邮等活动唤起用户注意力。}

我要回帖

更多关于 智能陪伴机器人 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信