精品2019高中数学 第三章 统计案例 阶段复习课 第3课 统计案例学案 新人教A版选修2-3

第三课 统计案例

※精品试卷※

[核心速填] (建议用时 4 分钟) 1.分析判断两个变量相关关系常用的方法 (1)散点图法:把样本数据表示的点在直角坐标系中标出,得到散点图,由散点图的形状分析. (2)相关指数法:利用相关指数 R2 进行检验,在确认具有相关关系后,再求线性回归方程. 2.求线性回归方程的步骤 (1)画散点图:从直观上观察两个变量是否线性相关. (2)计算:利用公式求回归方程的系数的值.

n
?
b^=i=1

xi--x yi--y

n
?

xi--x 2

i=1

?n xiyi-n-x -y

i=1


,a^=-y -b^-x .

?n x2i-n-x 2

i=1

(3)写出方程:依据y^=a^+b^x,写出回归直线方程. 3.两种特殊可线性化回归模型的转化 (1)将幂型函数 y=axm(a 为正的常数,x,y 取正值)化为线性函数. 如果将 y=axm 两边同取以 10 为底的对数,则有 lg y=mlg x+lg a.令 u=lg y,v=lg x,lg a=b,代入上 式,得 u=mv+b,其中 m,b 是常数.这是 u,v 的线性函数.如果以 u 为纵坐标,v 为横坐标,则 u=mv+b 的图 象就是一直线. (2)将指数型函数 y=cax(a>0 且 a≠1,c>0 且为常数)化为线性函数. 将 y=cax 两边同取以 10 为底的对数,有 lg y=xlg a+lg c,令 lg y=u,lg a=k,lg c=b,得 u=kx+b, 其中,k 和 b 是常数,与幂型函数不同的是 x 依然保持原来的,只是用 y 的对数 lg y 代替了 y. 4.在实际问题中常用的三个数值 (1)当 K2>6.635 时,表示有 99%的把握认为“事件 A 与 B 有关系”. (2)当 K2>3.841 时,表示有 95%的把握认为“事件 A 与 B 有关系”. (3)当 K2≤3.841 时,认为事件 A 与 B 是无关的.
[体系构建]

推荐下载

※精品试卷※

[题型探究]

线性回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.根据两个变量的一组观测值,可以画出 散点图或利用相关系数 r,判断两个变量是否具有线性相关关系,若具有线性相关关系,可得出线性回归直线方程. 利用公式求回归直线方程时应注意以下几点:

n
?
i=1
(1)求b^时,利用公式b^=

xi- x

yi- y

n
? xi- x 2
i=1

?n xiyi-n-x -y

i=1

1

= i=n 1x2i-n-x 2 ,先求出 x =n(x1+x2+x3+…+xn), y =

1n(y1+y2+y3+…+yn).再由a^= y -b^ x 求a^的值,并写出回归直线方程.

(2)回归直线一定经过样本点的中心(-x ,-y ).

(3)回归直线方程中的截距a^和斜率b^都是通过样本估计得来的,存在误差,这种误差可能导致预报结果的偏差.

(4)回归直线方程y^=a^+b^x 中的b^表示 x 每增加 1 个单位时预报变量 y 的平均变化量,而a^表示预报变量 y 不随

x 的变化而变化的部分.

以下是某地收集到的新房屋的销售价格 y 和房屋的面积 x 的数据:

房屋面积 x/m2

115

110

80

135

105

销售价格 y/万元

24.8

21.6

18.4

29.2

22

(1)画出数据对应的散点图;

(2)若线性相关,求线性回归方程; (3)根据(2)的结果估计当房屋面积为 150 m2 时的销售价格.

【导学号:95032252】

[解] (1)数据对应的散点图如图所示.

推荐下载

※精品试卷※

(2)由散点图知

y



x

具有线性相关关系.由表中数据知-x =15i?=5 1xi=109,-y =15i?=5 1yi=23.2,i?=5 1x2i=60

5
975,?x
i=1

iyi=12 952.设所求回归直线方程为y^=b^x+a^,则b^=i=5 1xiyi-5-x -y ≈0.196 2,a^=-y -b^-x ≈1.814 2,故所求回归
?5 x2i-5-x 2
i=1

直线方程为y^=0.196 2x+1.814 2.

(3)根据(2),当 x=150 时,销售价格的估计值为y^=0.1962×150+1.814 2=31.244 2(万元).

[规律方法] 在散点图中样本点大致分布在一条直线附近,则利用线性回归模型进行研究,可近似地利用回归

直线方程y^=b^x+a^来预报,利用公式求出回归系数a^,b^,即可写出回归直线方程,并用回归直线方程进行预测说明.

[跟踪训练]

1.已知某连锁经营公司的 5 个零售店某月的销售额和利润额资料如下表:

商店名称

A

B

C

D

E

销售额 x(千万元)

3

5

6

7

9

利润额 y(千万元)

2

3

3

4

5

(1)画出散点图;

(2)根据如下的参考公式与参考数据,求利润额 y 与销售额 x 之间的线性回归方程;

(3)若该公司还有一个零售店某月销售额为 10 千万元,试估计它的利润额是多少.

?n xiyi-n-x -y

(参考公式:b^=i=1

,a^=-y -b^-x .

?n x2i-n-x 2

i=1

5

5

其中,?xiyi=112,?x2i=200)

i=1

i=1

[解] (1)散点图.

推荐下载

※精品试卷※
(2)由已知数据计算得 n=5,-x =350=6,-y =157=3.4,b^=121020--55××66××36.4=0.5,a^=3.4-0.5×6=0.4. 则线性回归方程为y^=0.5x+0.4. (3)将 x=10 代入线性回归方程中得到y^=0.5×10+0.4=5.4(千万元). 即估计该零售店的利润额约为 5.4 千万元.

回归模型分析

对于建立的回归模型,我们必须对模型的拟合效果进行分析,也就是对利用回归模型解决实际问题的效果进行

评价.一方面可以对比残差或残差平方和的大小,同时观察残差图,进行残差分析;另一方面也可以研究数据的 R2(相

关系数 r).对模型拟合效果的分析能够帮助我们利用最优化的模型来解决实际问题.

在研究弹簧伸长长度 y(cm)与拉力 x(N)的关系时,对不同拉力的 6 根弹簧进行测量,测得如下表中的

数据:

x/N

5

10

15

20

25

30

y/cm

7.25

8.12

8.95

9.90

10.9

11.8

若依据散点图及最小二乘法求出的回归直线方程为y^=0.18x+6.34,求 R2,并结合残差说明拟合效果.

【导学号:95032253】

[解] 列表求值如下:

xi

5

10

15

20

25

30

yi

7.25

8.12

8.95

9.90

10.9

11.8

xiyi

36.25

81.2

134.25

198

272.5

354

x2i

25

100

225

400

625

900

yi-y^i

0.01

-0.02

-0.09

-0.04

0.06

0.06

yi--y

-2.24

-1.37

-0.54

0.41

1.41

2.31

-x =17.5,-y ≈9.49,?6 xiyi=1

6
076.2,?x2i=2

6
275,?

(yi-y^i)2=0.017

6
4,?

(yi--y )2=14.678

4.

i=1

i=1

i=1

i=1

∴R2=1-104..061778 44≈0.998 81,回归模型拟合效果较好.由表中数据可以看出残差比较均匀地落在宽度不超过

0.15 的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.

[规律方法] 在一元线性回归模型中,相关指标 R2 与相关系数 r 都能刻画线性回归模型拟合数据的效果.|r| 越大,R2 就越大,用线性回归模型拟合数据的效果就越好.

[跟踪训练]

2.关于 x 与 y 有以下数据:

x

2

4

5

6

8

推荐下载

y

30

40

60

50

已知 x 与 y 线性相关,由最小二乘法得b^=6.5,

(1)求 y 与 x 的线性回归方程;

(2)现有第二个线性模型:y^=7x+17,且 R2=0.82.

若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.

[解] (1)依题意设 y 与 x 的线性回归方程为y^=6.5x+a^.

-x =2+4+55+6+8=5,

-y =30+40+650+50+70=50,

∴y^=6.5x+a^经过(-x ,-y ),

∴50=6.5×5+a^,∴a^=17.5,

∴y 与 x 的线性回归方程为y^=6.5x+17.5.

(2)由(1)的线性模型得 yi-y^i 与 yi--y 的关系如下表:

yi-y^i

-0.5

-3.5

10

yi--y

-20

-10

10

-6.5 0

5
所以?

(yi-y^i)2=(-0.5)2+(-3.5)2+(-10)2+(-6.5)2+0.52=155.

i=1

5
?

(yi--y )2=(-20)2+(-10)2+102+02+202=1

000.

i=1

5
?
i=1
所以 R21=1-
5
?
i=1

yi-y^i yi--y

2
=1-1150500=0.845.
2

由于 R21=0.845,R2=0.82 知 R21>R2, 所以(1)的线性模型拟合效果比较好.

※精品试卷※
70
0.5 20

独立性检验 独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个分类变量之间是否有关系时,作出等 高条形图只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.
为了调查胃病是否与生活规律有关,在某地对 540 名 40 岁以上的人进行了调查,结果是:患胃病者生 活不规律的共 60 人,患胃病者生活规律的共 20 人,未患胃病者生活不规律的共 260 人,未患胃病者生活规律的共
推荐下载

200 人.

※精品试卷※

(1)根据以上数据列出 2×2 列联表;

(2)判断 40 岁以上的人患胃病与生活规律是否有关.

【导学号:95032254】

[思路探究] (1)解决本题关键是首先弄清问题中的两个分类变量及其取值分别是什么,其次掌握 2×2 列联表

的结构特征. (2)利用 2×2 列联表计算 K2 的观测值,再结合临界值表来分析相关性的大小.

[解] (1)由已知可列 2×2 列联表如下:

患胃病

未患胃病

总计

生活规律

20

200

220

生活不规律

60

260

320

总计

80

460

540

(2)根据列联表得 K2 的观测值为

k=

- 80×460×220×320

2
≈9.638.

因为 9.638>7.879,

因此,我们在犯错误的概率不超过 0.005 的前提下认为 40 岁以上的人患胃病和生活规律有关.

[规律方法] 独立性检验的一般步骤:

(1)根据样本数据制成 2×2 列联表. (2)根据公式计算 K2 的观测值 k.

(3)比较 k 与临界值的大小关系作统计推断.

[跟踪训练]

3.为了解某班学生喜爱打篮球是否与性别有关,对本班 50 人进行问卷调查得到了如下的列联表:

喜爱打篮球

不喜爱打篮球

总计

男生

5

女生

10

总计

50

已知在全部 50 人中随机抽取 1 人抽到喜爱打篮球的学生的概率为 0.6.

(1)请将上面的列联表补充完整(不用写计算过程);

(2)能否有 99%的把握认为喜爱打篮球与性别有关?说明你的理由.

(参考公式:K2= a+b

n ad-bc 2 c+d a+c

b+d ,

其中 n=a+b+c+d)

[解] (1)依题意可知喜爱打篮球的学生的人数为 50×0.6=30.

列联表补充如下:

推荐下载

喜爱打篮球

不喜爱打篮球

总计

※精品试卷※

男生

20

5

25

女生

10

15

25

总计

30

20

50

(2)因为 k=



2

25×25×30×20 ≈8.333>6.635,所以,有 99%的把握认为喜爱打篮球与性别有关.

推荐下载


相关文档

「精品」2018-2019版高中数学第三章统计案例章末复习学案新人教A版选修2-3
精品-新人教版2018_2019学年高中数学第三章统计案例复习提升课学案新人教A版选修2_3
精品2019高中数学 第三章 统计案例章末复习课学案 新人教A版选修2-3
「精品」2018-2019版高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版选修2-3
精品2019版高中数学 第三章 统计案例章末复习课学案 苏教版选修2-3
精品学习2018-2019学年高中数学 第三章 统计案例章末复习课学案 新人教A版选修2-3
(新人教版)2019版高中数学 第三章 统计案例章末复习学案 新人教A版选修2-3【重点推荐】【精品推荐】
精品2019高中数学 第1章 统计案例阶段复习课学案 新人教A版选修1-2
精品-新人教版2018_2019学年高中数学第三章统计案例学案新人教A版选修2_3
精品学习2018-2019版高中数学 第三章 统计案例章末复习学案 新人教A版选修2-3
电脑版