项目总结-推荐系统
1、案例背景
当今电商发展的竞争愈来愈激烈。某玩具公司销售额突破6千万后,公司的发展便遭遇瓶颈。公司现状描述,公司属于中型发展公司,资金链充足;该公司的玩具货品来源品牌代理加工工厂,玩具质量和款式以及性价比均为亮点;公司运营团队的规模20人。该玩具公司希望,可以通过我们的分析,给予突破瓶颈+提升销售额的方案。
2、分析目的
首先与玩具公司进行调研,了解公司发展情况;结合市场定位以及竞争分析,确定竞争对手以及制定竞争方案;对公司自身数据进行深度挖掘,优化营销方案。
本次案例中,将针对算法建模的模块,即对公司自身数据进行深度挖掘,优化营销方案。
3、数据说明
共有三个数据文件。
(1)Orders文件是用户在产生购买行为后的交易数据,该数据以订单编号为区分,所产生的数据均在一个订单编号下,时间段为2017年5月整月的数据。
字段的说明:
订单编号:只要是一次下单购买的商品,不管购买数量为多少,均为一个订单,均具备一个订单编号;
买家应付金额/邮费:在购买商品理应支付的金额
买家实付金额/邮费:买家实际支付的金额(享受折扣,以及包邮),一般在淘宝中,会有售价以及折扣价,售价为商家自认为商品所值得的价格,折扣价为实际的销售价格。
订单状态:买家的行为决定了订单的状态,买家将宝贝加入到订单中,并提交该订单,此时为下单,此时产生的一系列数据均为下单数据;当买家实际支付之后,此时订单状态才会变为交易成功。
宝贝种类:这一笔订单中,一共购买的宝贝总类别
宝贝数量:这一笔订单中,宝贝的总数量
(2)Items_orders文件为每一个商品的交易数据
该文件为宝贝的交易数据,以宝贝类别为区分字段,如果一个订单中包含5种宝贝,此时将会以宝贝为维度,呈现5条数据。每一条数据中,包含宝贝的价格、数量等字段信息。
(3)Items_attribute为商品的属性数据
该数据包含宝贝的ID、标题、价格以及玩具类型、适用年龄以及品牌。
4、Python代码实现
4.1导入数据文件
4.1.1查看数据
4.1.2将数据合成一个表
得到orders_items_props表
4.2构建关系矩阵
4.3基于商品相似度的算法推荐
4.3.1计算物品相似度
4.3.2 根据相似度推荐排名前五的商品
4.3.3导出到CSV文件
4.4基于用户相似度的算法推荐