第03讲 成对数据的统计分析 (精讲)
目录
第一部分:知识点精准记忆
第二部分:课前自我评估测试
第三部分:典型例题剖析
题型一:成对数据的相关性
题型二:回归分析
角度1:经验回归方程及应用
角度2:非线性经验回归方程及应用
角度3:相关系数
角度4:残差分析
题型三:列联表与独立性检验
第四部分:高考真题感悟
第一部分:知 识 点 精 准 记 忆
知识点一:变量的相关关系
(1)两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
(3)线性相关、非线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
知识点二:样本相关系数
(1)相关系数的计算
变量与变量的样本相关系数的计算公式如下:
(2)相关系数的性质
①当时,称成对样本数据正相关;当时,称成对样本数据负相关.
当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为,当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.
知识点三:一元线性回归模型
(1)数学表述式:如果两个变量之间的关系可以表示为
我们称该式为关于的一元线性回归模型.
其中,称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差.
(2)经验回归方程
我们将称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中
(3)利用刻画回归效果
的计算公式为,其意义是越大,残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.
知识点四:列联表与独立性检验
(1)2×2列联表
如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.
合计
合计
(2)独立性检验
依据上述列联表构造统计量
利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
常用的小概率值和临界值表
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
第二部分:课 前 自 我 评 估 测 试
1.(2022·重庆·高二阶段练****甲、乙、丙、丁四位同学各自对两变量的线性相关性做试验,分别求得样本相关系数,如下表:
甲
乙
丙
丁
则试验结果中两变量有更强线性相关性的是( )
A.甲 B.乙 C.丙 D.丁
【答案】B
【详解】由已知,乙的相关系数的绝对值为,是四人中最大的,因此乙同学有更强的相关性.
故选:B.
2.(2022·全国·长垣市第一中学高三开学考试(文))在研究线性回归模型时,样本数据所对应的点均在直线上,用表示解释变量对于预报变量变化的贡献率,则( )
A. B. C.1 D.2
【答案】C
【详解】因为样本数据所对应的点都在直线上,所以.
故选:C
3.(2022·河南南阳·高二期末(文))对两个变量与进行回归分析,有个不同模型可供选择,其中拟合效果最好的是( )
A.模型的相关系数为 B.模型的相关系数为
C.模型的相关系数为 D.模型的相关系数为
【答案】A
【详解】对于模型而言,当越接近于,则模型的拟合效果越好,故拟合效果最好的模型.
故选:A.
4.(多选)(2022·全国·高二课时练****下列散点图中,变量X,Y可用直线拟合的是( )
A. B.
C. D.
【答案】AB
【详解】由题可知A,B中的点落在一条直线附近,故其变量X,Y有近似的线性关系;
C,D中的点没有落在一条直线附近,故其变量X,Y不具有近似的线性关系.
故选:AB.
5.(2022·山东济宁·高二期末)下列命题中正确的是( )
A.在回归分析中,成对样本数据的样本相关系数r的绝对值越大,成对样本数据的线性相关程度越强
B.在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果