就香水市场份额而言,亚洲占全球销售额的8%,仅占拉丁美洲的20%,而中国仅占全球销售额的0.8%。
从国际市场角度来看,香水市场是一个438.9亿美元的产业,每年至少有300种新产品推出。
可下载资源
在法国,香水就像衣食住行一样不可或缺,而占世界人口约20%的中国,只占全球香水销售的1.5%。国内消费者不习惯使用香水。
数据挖掘是一门交叉学科,它汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域,近年来受到各界的广泛关注。
目前,国外有许多研究机构、公司和学术组织在从事数据挖掘工具的研究和开发。这些数据挖掘工具主要包括决策树、相关规则、神经元网络、遗传算法,以及可视化、联机分析处理等。另外也采用了传统的统计方法。
1.决策树(Decision Tree)
决策树是建立在信息论基础之上,对数据进行分类的一种方法。首先,通过一批已知的训练数据建立一棵决策树。然后,利用建好的决策树,对数据进行预测。决策树的建立过程可以看成是数据规则的生成过程。因此可以认为,决策树实现了数据规则的可视化,其输出结果也容易理解。例如:在金融领域中将贷款对象分为低贷款风险与高贷款风险两类。通过决策树,我们可以很容易地确定贷款申请者是属于高风险的还是低风险的。
决策树方法精确度比较高,结果容易理解,效率也比较高,因而比较常用。
2.神经网络(Neural Network)
神经网络建立在自学习的数学模型基础之上。它可以对大量复杂的数据进行分析,并可以完成对人脑或其他计算机来说极为复杂的模式抽取及趋势分析。
神经网络系统由一系列类似于人脑神经元一样的处理单元组成,我们称之为节点(Node)。这些节点通过网络彼此互连,如果有数据输入,它们便可以进行确实数据模式的工作。神经网络由相互连接的输入层、中间层(或隐藏层)、输出层组成。中间层由多个节点组成,完成大部分网络工作。输出层输出数据分析的执行结果。例如:我们可以指定输入层为代表过去的销售情况、价格及季节等因素,输出层便可输出判断本季度的销售情况的数据。
3.相关规则
相关规则是一种简单却很实用的关联分析规则,它描述了一个事物中某些属性同时出现的规律和模式。例如:超级市场中通过POS(Point Of Sell)系统收集存储了大量售货数据,记录了什么样的顾客在什么时间购买了什么商品,这些数据中常常隐含着诸如:购买面包的顾客中有90%的人同时购买牛奶的相关规则。
相关规则分析就是依据一定的可信度、支持度、期望可信度、作用度建立相关规则的。
4.K-nearest邻居
邻居就是彼此距离很近的数据。依据”Do as your neighbors do”的原则,K-nearest邻居方法认为:邻居数据必然有相同的属性或行为。K表示某个特定数据的K个邻居,可以通过K个邻居的平均数据来预测该特定数据的某个属性或行为。
5.联机分析处理(On Line Processing)
联机分析处理(OLAP)主要通过多维的方式来对数据进行分析、查询和报表。它不同于传统的联机事物处理(Online Transaction Processing,OLTP)应用。OLTP应用主要是用来完成用户的事务处理,如民航订票系统、银行储蓄系统等等,通常要进行大量的更新操作,同时对响应时间要求比较高。而OLAP应用主要是对用户当前及历史数据进行分析,辅助领导决策。其典型的应用有对银行信用卡风险的分析与预测、公司市场营销策略的制定等,主要是进行大量的查询操作,对时间的要求不太严格。
6.数据可视化(Data Visualization)
对大批量数据的展现也是数据挖掘的重要方面。就数据可视化系统本身而言,由于数据量很大,很容易使分析人员面对数据不知所措,数据挖掘的可视化工具可以通过富有成效的探索起点并按恰当的隐喻来表示数据,为数据分析人员提供很好的帮助。
数据可视化工具大大扩展了传统商业图形的能力,支持多维数据的可视化,从而提供了多方向同时进行数据分析的图形方法。有些工具甚至提供动画功能,使用户可以“飞越”数据,观看到数据不同层次的细节。
购买的香水往往只在出席特殊场合时使用。香水在中国仍然是一个比较新的东西。
虽然中国香水市场处于发展的初始阶段,但这意味着未来有很大的潜力。
本文试图通过对电商网站上的香水产品销量数据进行市场分析:
• 什么样的香水产品销售好?
• 这些香水的特点?
要点提示
从而分析香水销售的影响因素,为香水销售商判定采购计划以及用户选择香水提供依据。
不同特征的香水销量
在香水产品分类方面,香水的产地、香调和包装会对销售产生很大影响。
图一
上图描述了每个特征的香水销售分布情况。
就原产地而言,来自西班牙和英国的香水产品的销售额明显低于其他国家,中国、法国和意大利生产的香水在消费者中最受欢迎,法国和意大利是世界上最重要的香水奢侈品产地,影响巨大,而其他国家之间的差异不大。
“花香调”和“清新香调”的销量较低,花果香调和海洋、柑橘香调的香水产品的总体销量略高于其他香水。
东方女性在使用香水的习惯上比西方女性更保守,喜欢清淡简单的淡味,因此带有花香和果香的香水销量最好。选择合适的香水类型是促进销售的一个非常重要的方面。
香水在不同适用场景差异
在所有产品中,用于日常的使用场景占多数,其次是约会、聚会和送礼。用户更喜欢日常类香水。
图二
通过apriori关联模型发现,大多数香水适用场景之间的关联性非常强,表明大多数香水产品不仅有一个适用场景,而是有多个适用场景。大多数适用场合之间的关联性非常强,日常、约会、职场、聚会派对出现的次数最多,而且是相互关联性最强的场所,情趣、运动、其他与其他场所关联性不大,说明这三类场所针对性较强。
不同类型和包装的香水销量
从数据中可以看出,淡香水EDT和浓香型EDP的销量都不错,主要是因为淡香水的味道比较淡,符合东方女性的消费特点。
图三
随时关注您喜欢的主题
还有一个主要针对年纪较大商务妇女和中年妇女的浓香型香水市场。
独立包装的香水的销售情况要好于其他包装。商家需要结合不同的使用场合,推出更多的香水组合和香水礼品套装来刺激消费。
另外,目前中国的香水消费很大一部分还是作为礼品,因此,可以制定短期促销策略,降低价格。
可下载资源
关于作者
Kaizong Ye是拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。
本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。
非常感谢您阅读本文,如需帮助请联系我们!