巴斯Bass扩散模型已成功地用于预测各种新推出的产品以及成熟产品的市场份额。

由Kaizong Ye，Sherry Deng撰写

该模型的主要思想来自两个来源：

1.消费者不受社会影响的产品意愿。

2.因为其他人已经采用了该产品，所以倾向于采用该产品。因此，在优质产品的生命周期中的早期采用者的影响变得足够强大，以致驱使许多其他人也采用该产品。

Bass模型显示了如何使用销售数据的前几个时期的信息来对未来的销售做出相当好的预测。

可下载资源

完整程序、数据和文档（word）

成为新会员获取本文分析的智能体、数据、代码、报告

加入会员群

可以很容易地看出，虽然该模型来自营销领域，但它也可以很容易地用于对现金流量的预测进行建模以确定初创公司的价值。

1 巴斯模型概念

巴斯扩散模型针对创新产品、技术的采用和扩散，常被用作市场分析工具，对新产品、新技术需求进行预测。而新产品创新扩散是指新产品从创造研制到进入市场推广、最终使用的过程，表现为广大消费者从知晓、兴趣、评估、试用到最终采用新产品的行为。

历史事例

Bass模型的文献中有一些经典的例子。

例如，请参见下图所示的80年代VCR的实际与预测市场增长情况。

课程

R语言数据分析挖掘必知必会

从数据获取和清理开始，有目的的进行探索性分析与可视化。让数据从生涩的资料，摇身成为有温度的故事。

立即参加 ➜

基本思想

将单个人从零时间到时间tt购买产品的累计概率定义为F（t）。那么，在时间tt的购买概率为密度函数f（t）= F’（t）。

从目前来看，在目前没有购买的情况下，时间t的购买率符合逻辑，即

建模就像在给定时间t建模产品的采用率

微分方程

巴斯建议将此采用率定义为

在这里，我们可以将p定义为采用产品的消费者的 独立比率，将q定义为模仿率，因为q可以模拟累积采用强度F（t）的影响。

因此，如果我们可以找到某产品的p和q，则可以预测其随着时间的采用，从而生成销售的时间路径。总结一下：

p：创新系数。
q：模仿系数。

求解F（t）的模型

我们重写方程：

并注意F（0）= 0。

解决方案中的步骤是：

另一种解决方案

最受欢迎的见解

1.在python中使用lstm和pytorch进行时间序列预测

2.python中利用长短期记忆模型lstm进行时间序列预测分析

3.Python用RNN循环神经网络：LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列

4.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

5.r语言copulas和金融时间序列案例

6.R 语言用RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测

7.Matlab创建向量自回归（VAR）模型分析消费者价格指数 (CPI) 和失业率时间序列

8.r语言k-shape时间序列聚类方法对股票价格时间序列聚类

9.R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析

一种替代方法（这是学生Muhammad Sagarwalla根据Alexey Orlovsky的想法提出的）如下。

所以我们写

我们得到

与公式（*）相同。以前的解决方案是

R语言从经济时间序列中用HP滤波器，小波滤波和经验模式分解等提取周期性成分分析

阅读文章 >

求解f（t）

因此，如果目标市场的大小为m，则在每个t处，采用率简单地由m×f（t）给出。

例

例如，设置m = 100,000，p = 0.01和q = 0.2。然后，采用率如下图所示。

f = function(p,q,t) {
 
p = 0.01
q = 0.20
plot(t,m*f(p,q,t),type="l",col="blue",l

R中的符号数学

#BASS 模型
 
FF = expression(p*(exp((p+q)*t)-1)/(p*exp((p+q)*t)+q))

## expression(p * (exp((p + q) * t) - 1)/(p * exp((p + q) * t) + 
##     q))

#取导数
D(FF,"t")

## p * (exp((p + q) * t) * (p + q))/(p * exp((p + q) * t) + q) - 
##     p * (exp((p + q) * t) - 1) * (p * (exp((p + q) * t) * (p + 
##         q)))/(p * exp((p + q) * t) + q)^2

#设置函数
ff = function(p,q,t) {
    res

#评估
plot(t,m*eval(ff(p,q,t)),type="l",col="red",lwd=3)

随时关注您喜欢的主题

iPhone销售预测

例如，让我们看一下iPhone销量的趋势（我们将季度销量存储在一个文件中并读入文件，然后进行Bass模型分析）。

此计算的R代码如下：

#使用苹果iPHONE销售数据
data = read.table("tecdat/iphone.txt",header=TRUE)

##   Quarter Sales_MM_units
## 1   Q3_07           0.27
## 2   Q4_07           1.12
## 3   Q1_08           2.32
## 4   Q2_08           1.70
## 5   Q3_08           0.72
## 6   Q4_08           6.89

print(tail(data))

##    Quarter Sales_MM_units
## 30   Q4_14          39.27
## 31   Q1_15          74.47
## 32   Q2_15          61.17
## 33   Q3_15          47.53
## 34   Q4_15          48.05
## 35   Q1_16          74.78

## 
## Call:
## lm(formula = isales ~ cum_isales + cum_isales2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -14.050  -3.413  -1.429   2.905  19.987 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.696e+00  2.205e+00   1.676   0.1034    
## cum_isales   1.130e-01  1.677e-02   6.737 1.31e-07 ***
## cum_isales2 -5.508e-05  2.110e-05  -2.610   0.0136 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.844 on 32 degrees of freedom
## Multiple R-squared:  0.8729, Adjusted R-squared:  0.865 
## F-statistic: 109.9 on 2 and 32 DF,  p-value: 4.61e-15

b = res$coefficients

#拟合模型
m1 = (-b[2]+sqrt(b[2] 
m2 = (-b[2]-sqrt(b[2]^2-4

## cum_isales cum_isales 
##  -32.20691 2083.82202

## [1] 2083.822

##                                 (Intercept)           cum_isales2 
##                "p,q=" "0.00177381124189973"   "0.114767511363674"

##绘制拟合的模型
 
 
plot(t,fn_f,type="l"
 
lines(1:n,isales,col="red",lwd=2,lty=2)

三星Galaxy手机销售

#读取Galaxy销售数据
data = read.csv("tecdat/galaxy.csv")
 
#获取系数
 
res = lm(isales ~ cum_isales+cum_isales2)
print(summary(res))

## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11.1239  -6.1774   0.4633   5.0862  13.2662 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  5.375e+01  4.506e+00  11.928 2.87e-10 ***
## cum_isales   7.660e-02  1.068e-02   7.173 8.15e-07 ***
## cum_isales2 -2.806e-05  5.074e-06  -5.530 2.47e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.327 on 19 degrees of freedom
## Multiple R-squared:  0.8206, Adjusted R-squared:  0.8017 
## F-statistic: 43.44 on 2 and 19 DF,  p-value: 8.167e-08

b = res$coefficients
 
#拟合模型
 
m1 = (-b[2]+sqrt(b[2]^2-4*
m2 = (-b[2]-sqrt(b[2]^
print(c(m1,m2))

## cum_isales cum_isales 
##  -578.9157  3308.9652

## [1] 3308.965

##                               (Intercept)          cum_isales2 
##               "p,q=" "0.0162432614649845" "0.0928432001791269"

#绘制拟合模型
nqtrs = 100
t=seq(0
 
plot(t,fn_f,type="l"
 
lines(1:n,isales,col="red",lwd=2,lty=2)

全球半导体销售

#读取半导体销售数据
data = read.csv("tecdat/semi.csv")
 
#获取系数
isales = d
 
res = lm(isales ~ cum_isales+cum_isales2)

## Residuals:
##     Min      1Q  Median      3Q     Max 
## -42.359 -12.415   0.698  12.963  45.489 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  5.086e+01  8.627e+00   5.896 3.76e-06 ***
## cum_isales   9.004e-02  9.601e-03   9.378 1.15e-09 ***
## cum_isales2 -6.878e-06  1.988e-06  -3.459  0.00196 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21.46 on 25 degrees of freedom
## Multiple R-squared:  0.9515, Adjusted R-squared:  0.9476 
## F-statistic: 245.3 on 2 and 25 DF,  p-value: < 2.2e-16

 
 
#拟合模型
m1 = (-b[2]+sqrt(b[2]^2
m2 = (-b[2]-sqrt(b[
print(c(m1,m2))

## cum_isales cum_isales 
##  -542.4036 13633.3003

## [1] 13633.3

##                                 (Intercept)           cum_isales2 
##                "p,q=" "0.00373048366213552"  "0.0937656034785294"

#绘制拟合的模型
 
plot(t,fn_f,type="l",
 
lines(1:n,isales,col="red"

显示数据框：

print(df)

##       t   V2       fn_f
## 1     0 1988  50.858804
## 2     1 1989  55.630291
## 3     2 1990  60.802858
## 4     3 1991  66.400785
## 5     4 1992  72.447856
## 6     5 1993  78.966853
## 7     6 1994  85.978951
## 8     7 1995  93.503005
## 9     8 1996 101.554731
## 10    9 1997 110.145765
## 11   10 1998 119.282622
## 12   11 1999 128.965545
## 13   12 2000 139.187272

权衡p vs q

在Bass模型中，如果模仿系数相对于创新系数增加，那么以下哪一项是最有效的？

产品生命周期的高峰发生在稍后。
产品生命周期的高峰出现得更快。
两个生命周期高峰的机会可能会增加。
高峰可能迟早会出现，具体取决于创新系数。

使用高峰时间公式，用x = q / p代替：

x的微分：

从Bass模型中，我们知道q> p> 0，即x> 1，否则我们可以在0≤F<1区域获得负的接受度或形状，而没有最大值。因此，t /x的符号与：

但是这个非线性方程

根x≈3.59

换句话说，当x> 3.59时，导数t /x为负，而当x <3.59时为正。对于x = q / p的低值，模仿系数q的增加会增加达到销售高峰的时间，而对于q / p的高值，时间会随着q的增加而减少。因此，该问题的正确答案似乎是“它取决于p和q的值”。

t = seq(0,5,
.1)
p = 0.1; 
 
lines(t,f(p,q,t),type="l",col="red",lwd=2)

在图中，当x变小时，峰值更早。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言使用Bass模型进行市场产品周期预测