一. 一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地区的有关数据。利用Excel得到下面的回归结果(
方差分析表
变差来源 | df | SS | MS | F | Significance F |
回归 | 4008924.7 | 8.88341E-13 | |||
残差 | — | — | |||
总计 | 29 | 13458586.7 | — | — | — |
参数估计表
| Coefficients | 标准误差 | t Stat | P-value |
Intercept | 7589.1025 | 2445.0213 | 3.1039 | 0.00457 |
X Variable 1 | -117.8861 | 31.8974 | -3.6958 | 0.00103 |
X Variable 2 | 80.6107 | 14.7676 | 5.4586 | 0.00001 |
X Variable 3 | 0.5012 | 0.1259 | 3.9814 | 0.00049 |
(1) 将方差分析表中的所缺数值补齐。
(2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。
(3) 检验回归方程的线性关系是否显著?
(4) 计算判定系数
计算估计标准误差
方差分析表
变差来源 | df | SS | MS | F | Significance F |
回归 | 3 | 12026774.1 | 4008924.7 | 72.80 | 8.88341E-13 |
残差 | 26 | 1431812.6 | 55069.7 | — | — |
总计 | 29 | 13458586.7 | — | — | — |
(2)多元线性回归方程为:
(3)由于Significance F=8.88341E-13<
(4)
(5)
一. 一家出租汽车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行使时间(小时)行驶的里程(公里)之间的关系,为此随机调查了20个出租车司机,根据每天的收入(
方程的截距 | 截距的标准差 | 回归平方和 |
回归系数 | 回归系数的标准差 | 残差平方和 |
回归系数 | 回归系数的标准差 | — |
(1) 写出每天的收入(
(2) 解释各回归系数的实际意义。
(3) 计算多重判定系数
(4) 计算估计标准误差
(5) 若显著性水平 =0.05,回归方程的线性关系是否显著?(注:
(1)回归方程为:
(2)
(3)
表明在每天收入的总变差中,被估计的多元线性回归方程所解释的比例为85.17%,说明回归方程的拟合程度较高。
(4)
表明用行驶时间和行驶里程来预测每天的收入时,平均的预测误差为17.50元。
(5)提出假设:
计算检验的统计量F:
于
一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,抽取了该银行所属的25家分行2002年的有关业务数据。试建立不良贷款y与贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4的线性回归方程,并解释各回归系数的含义
分行 | 不良贷款(亿元) | 各项贷款余额(亿元) | 本年累计应收贷款(亿元) | 贷款项目个数(个) | 本年固定资产投资额(亿元) |
1 | 0.9 | 67.3 | 6.8 | 5 | 51.9 |
2 | 1.1 | 111.3 | 19.8 | 16 | 90.9 |
3 | 4.8 | 173.0 | 7.7 | 17 | 73.7 |
4 | 3.2 | 80.8 | 7.2 | 10 | 14.5 |
5 | 7.8 | 199.7 | 16.5 | 19 | 63.2 |
6 | 2.7 | 16.2 | 2.2 | 1 | 2.2 |
7 | 1.6 | 107.4 | 10.7 | 17 | 20.2 |
8 | 12.5 | 185.4 | 27.1 | 18 | 43.8 |
9 | 1.0 | 96.1 | 1.7 | 10 | 55.9 |
10 | 2.6 | 72.8 | 9.1 | 14 | 64.3 |
............... | ......... | ......... | ................ | ................. | ................... |
1. 以不良贷款y为因变量,贷款余额x1、累计应收贷款x2、贷款项目个数x3和固定资产投资额x4为自变量建立四元线性回归模型,Excel的输出结果如下表,请填写方差分析表中的下划线部分:
回归统计 | |||||
Multiple R | ***** | ||||
R Square | 0.79760399 | ||||
标准误差 | 1.77875228 | ||||
观测值 | ***** | ||||
方差分析 | |||||
| df | SS | MS | F | Significance F |
回归分析 | ****** | ***** | ******** | ****** | 1.03539E-06 |
残差 | ***** | ***** | ******* | ||
总计 | ****** | 312.6504 |
|
|
|
| Coefficients | 标准误差 | t Stat | P-value |
|
Intercept | -1.0216398 | 0.78237236 | -1.305822925 | 0.20643397 | |
各项贷款余额(亿元) | ****** | 0.01043372 | 3.83749534 | 0.00102846 | |
本年累计应收贷款(亿元) | 0.14803389 | ******* | 1.878737798 | 0.07493542 | |
贷款项目个数(个) | 0.01452935 | 0.08303316 | ******* | 0.86285269 | |
本年固定资产投资额(亿元) | -0.0291929 | 0.01507297 | -1.936768921 | 0.06703008 |
|
回归统计 | |||||
Multiple R | 0.89308678 | ||||
R Square | 0.79760399 | ||||
Adjusted R Square | 0.75712479 | ||||
标准误差 | 1.77875228 | ||||
观测值 | 25 | ||||
方差分析 | |||||
| df | SS | MS | F | Significance F |
回归分析 | 4 | 249.371206 | 62.34280156 | 19.7040442 | 1.03539E-06 |
残差 | 20 | 63.2791938 | 3.163959689 | ||
总计 | 24 | 312.6504 |
|
|
|
| Coefficients | 标准误差 | t Stat | P-value |
|
Intercept | -1.0216398 | 0.78237236 | -1.305822925 | 0.20643397 | |
各项贷款余额(亿元) | 0.04003935 | 0.01043372 | 3.83749534 | 0.00102846 | |
本年累计应收贷款(亿元) | 0.14803389 | 0.07879433 | 1.878737798 | 0.07493542 | |
贷款项目个数(个) | 0.01452935 | 0.08303316 | 0.174982537 | 0.86285269 | |
本年固定资产投资额(亿元) | -0.0291929 | 0.01507297 | -1.936768921 | 0.06703008 |
|
2、写出回归方程,并分析其回归系数的意义
3、设显著性水平
4、计算残差平方和决定系数
5、对回归系数进行显著性检验。
某工厂近年的生产数据如下表所示:
序号 | 产量(千件)Q | 技术改进支出T(万元) | 单位产品成本AC(元/件) | 总成本TC(万元) |
1 | 3 | 2 | 72 | 21.6 |
2 | 5 | 3.2 | 70 | 35 |
3 | 7 | 5 | 69 | 48.3 |
4 | 9 | 5 | 67 | 60.3 |
5 | 8 | 6 | 68 | 54.4 |
6 | 9 | 7 | 66 | 59.4 |
7 | 10 | 7.8 | 64 | 64 |
8 | 11 | 9.5 | 64 | 70.4 |
9 | 13 | 10.2 | 62 | 80.6 |
10 | 15 | 11 | 60 | 90 |
2. 以单位产品成本AC为因变量,产量Q和技术改进支出T为自变量建立二元线性回归模型,Excel的输出结果如下表,请填写方差分析表中的下划线部分:
回归统计 | |
Multiple R | 0.989028061 |
R Square | 0.978176505 |
Adjusted R Square | 0.971941221 |
标准误差 | 0.625760222 |
观测值 | 10 |
| 自由度 | 平方和 | 均方 | F | p值 |
回归分析 | _______ | _______ | _______ | _______ | 0.0000 |
残差 | _______ | _______ | _______ | ||
总计 | _______ | 128.6 |
|
|
|
| 系数 | 标准误差 | t统计量 | P-值 |
截距 | 79.26543089 | _______ | 126.9434402 | 4.96E-13 |
产量(千件) | -0.75456545 | 0.236593469 | ______ | 0.018259 |
技术改进支出(万元) | _______ | 0.281584338 | -1.35469377 | 0.217609 |
3. 根据回归结果计算自变量和因变量的相关系数。
4. 设显著性水平
5. 写出回归方程,并分析其回归系数的意义。(15分)
某企业生产情况如下表
产品名称 | 计量单位 | 生产量 | 价格 | ||
报告期 | 基期 | 报告期 | 基期 | ||
甲 | 台 | 360 | 300 | 1500 | 1100 |
乙 | 件 | 200 | 200 | 1000 | 800 |
丙 | 只 | 160 | 140 | 250 | 250 |
要求:遵循综合指数编制的一般原则,计算
(1) 三种产品的产量总指数和价格总指数。
解:根据已知资料计算得:
单位:元
产品名称 | |||
甲 | 330000 | 396000 | 540000 |
乙 | 160000 | 160000 | 200000 |
丙 | 30800 | 40000 | 40000 |
合计 | 520800 | 596000 | 780000 |
(1)产量总指数: (2分)
价格总指数: (2分)
什么是回归分析中的随机误差项和残差?它们之间的区别是什么?
答:随机误差项Ut反映除自变量外其他各种微小因素对因变量的影响。它是Yt与未知的总体回归线之间的纵向距离,是不可直接观测的。(2.5 分)。
残差et 是Yt与按照回归方程计算的的差额,它是Yt 与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出et的具体数值。利用残差可以对随机误差项的方差进行估计。(2.5分)
某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。根据计算得到以下方差分析表,求A、B的值,并说明销售量的变差中有多少是由于广告费用的变动引起的?
变差来源 | df | SS | MS | F | Significance F |
回归 | 1 | 1422708.6 | 1422708.6 | B | 2.17E-09 |
残差 | 10 | 220158.07 | A | ||
总计 | 11 | 1642866.67 | |||
2、A=SSE / (n-2) = 220158.07 / 10 =22015.807 2分
B=MSR / MSE =1422708.6 / 22015.807 =64.6221 2分
表明销售量的变差中有88.60%是由于广告费用的变动引起的。 1分
某家具公司生产三种产品的有关数据如下:
产品名称 | 总生产费用/万元 | 报告期产量比 基期增长(%) | |
基期 | 报告期 | ||
写字台 | 45.4 | 53.6 | 14.0 |
椅子 | 30.0 | 33.8 | 13.5 |
书柜 | 55.2 | 58.5 | 8.6 |
计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。
解:
1 拉氏加权产量指数=
② 帕氏单位成本总指数=
根据下面的方差分析表回答有关的问题:
方差分析 | ||||||
差异源 | SS | df | MS | F | P-value | F crit |
组间 | 0.001053 | 2 | 0.000527 | 32.91667 | 1.34E-05 | 3.88529 |
组内 | 0.000192 | 12 | 0.000016 | |||
总计 | 0.001245 | 14 | ||||
注:试验因素A有三个水平。
⑴写出原假设及备择假设;
⑵写出SST,SSA,SSE,
⑶判断因素A是否显著。
⑴ 原假设
备择假设
⑵ SST=0.001245 SSA=0.001053 SSE=0.000192
P值=1.34E-05 4分
⑶ F值=32.91667>
拒绝原假设,因素A显著。 1分
某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:
方差分析表
变差来源 | df | SS | MS | F | Significance F |
回归 | 1 | A | 1422708.6 | C | 2.17E-09 |
残差 | 10 | 220158.07 | B | ||
总计 | 11 | 1642866.67 | |||
参数估计表
Coefficients | 标准误差 | t Stat | P-value | |
Intercept | 363.6891 | 62.45529 | 5.823191 | 0.000168 |
X Variable 1 | 1.420211 | 0.071091 | 19.97749 | 2.17E-09 |
①求A、B、C的值;②销售量的变差中有多少是由于广告费用的变动引起的?
③销售量与广告费用之间的相关系数是多少?④写出估计的回归方程并解释回归系数的实际意义。⑤检验线性关系的显著性 (=0.05)
解
(1)A=SSR / 1=1422708.6 B=SSE / (n-2)=220158.07/10=22015.807
C=MSR / MSE=1422708.6/22015.807=64.6221 2分
(2)
表明销售量的变差中有88.60%是由于广告费用的变动引起的。
(3)
(4)估计的回归方程:
回归系数
(5)检验线性关系的显著性:
H0 :
∵Significance F=2.17E-09<α=0.05
∴拒绝H0,, 线性关系显著。 2分
4、某企业三种产品的出口价及出口量资料如下:
出口价 | 出口量 | |||
基期p0 | 报告期p1 | 基期q0 | 报告期q1 | |
甲 | 100 | 150 | 80 | 82 |
乙 | 80 | 140 | 800 | 1000 |
丙 | 120 | 120 | 60 | 65 |
(1)计算拉氏出口量指数;(2)计算帕氏出口价指数
解:
4、随机抽查5家商场,得到广告支出(x)和销售额(y)资料如下:
广告支出(万元)x | 1 | 2 | 4 | 4 | 6 |
销售额(万元)y | 20 | 35 | 50 | 60 | 75 |
附:
要求:
. ① 计算估计的回归方程;
②检验线性关系的显著性(
附F0.05(1,5)=6.61 F0.05(5,1)=230.2 F0.05(1,3)=10.13 F0.05(3,1)=215.7
F0.025(1,5)=10.01 F0.025(1,3)=17.44
现有某地区的啤酒销量数据如下,
年/季 | 啤酒销售量(Y) | 年/季 | 啤酒销售量(Y) | |
2000/1 | 25 | 2004/1 | 29 | |
2 | 32 | 2 | 42 | |
3 | 37 | 3 | 55 | |
4 | 26 | 4 | 38 | |
2001/1 | 30 | 2005/1 | 31 | |
2 | 38 | 2 | 43 | |
3 | 42 | 3 | 54 | |
4 | 30 | 4 | 41 | |
2002/1 | 29 | |||
2 | 39 | |||
3 | 50 | |||
4 | 35 | |||
2003/1 | 30 | |||
2 | 39 | |||
3 | 51 | |||
4 | 37 | |||
为了计算季节指数,有如下步骤
年/季 | 啤酒销售量(Y) | C | 比值y/c |
2000/1 | 25 | ||
2 | 32 | ||
3 | 37 | 30.625 | 1.208163 |
4 | 26 | 32 | 0.8125 |
2001/1 | 30 | 33.375 | 0.898876 |
2 | 38 | 34.5 | 1.101449 |
3 | 42 | 34.875 | 1.204301 |
4 | 30 | 34.875 | 0.860215 |
2002/1 | 29 | 36 | 0.805556 |
2 | 39 | 37.625 | 1.036545 |
3 | 50 | 38.375 | 1.302932 |
4 | 35 | 38.5 | 0.909091 |
2003/1 | 30 | 38.625 | 0.776699 |
2 | 39 | 39 | 1 |
3 | 51 | 39.125 | 1.303514 |
4 | 37 | 39.375 | 0.939683 |
2004/1 | 29 | 40.25 | 0.720497 |
2 | 42 | 40.875 | 1.027523 |
3 | 55 | 41.25 | 1.333333 |
4 | 38 | 41.625 | 0.912913 |
2005/1 | 31 | 41.625 | 0.744745 |
2 | 43 | 41.875 | 1.026866 |
3 | 54 | ||
4 | 41 | ||
1:第C列第一个数据30.625的计算依据是什么?写出30.625的计算过程
2:试计算季节指数
3:以2000年的数据计算分离了季节因素后的数据,并解释新得到的数据的意义
¥29.8
¥9.9
¥59.8