适用于新教材2023版高中数学第九章统计 学案(含解析)(4份打包)

文档属性

名称 适用于新教材2023版高中数学第九章统计 学案(含解析)(4份打包)
格式 zip
文件大小 1.9MB
资源类型 教案
版本资源 人教A版(2019)
科目 数学
更新时间 2023-12-28 17:40:56

文档简介

9.1 随机抽样
9.1.1 简单随机抽样
1.简单随机抽样
分为放回简单随机抽样、        ;有抽签法、随机数法两种方法.
2.总体平均数与样本平均数
(1)总体平均数
①一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称=      =          为总体均值,又称总体平均数.
②如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=      .
(2)样本平均数
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称=
          =     为样本均值,又称样本平均数.在简单随机抽样中,我们常用样本平均数去估计总体平均数.
3.总体均值与样本均值有何区别
一、单选题
1.下列抽样的方式属于简单随机抽样的个数为 (  )
①从500个个体中一次性抽取50个作为样本;
②将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;
③某班有55个同学指定个子最高的5名同学参加学校组织的篮球赛;
④福利彩票用摇奖机摇奖.
A.1 B.2 C.3 D.4
2.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是 (  )
A., B., C., D.,
3.从全校200名女生中用随机数法抽取30名调查其身高,得到样本量的平均数为148.3 cm,则可以推测该校女生的平均身高 (  )
A.一定为148.3 cm   B.高于148.3 cm
C.低于148.3 cm D.约为148.3 cm
4.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
第1行
6667403714640571110565099586687683203790
第2行
5716031163149084452175738805905223594310
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是(  )
A.10   B.09   C.05   D.20
二、多选题
5.从10个篮球中任取一个,检查其质量,用随机数法抽取样本,则应编号为 (  )
A.1,2,3,…,10
B.-1,-2,-3,…,-10
C.0,1,2,3,…,10
D.0,1,2,…,9
6.从1 200件零件中用简单随机抽样方法抽取20件进行检验,其中有1件是不合格品,则(  )
A.样本量为20
B.每个零件被抽入样本的概率为
C.产品的合格率约为
D.产品的合格率约为
三、填空题
7.要从60位同学中抽取8位同学调查其期末考试的数学成绩,如图是电子表格软件生成的部分随机数,若从第一个数开始抽取,则抽取的8位同学的编号依次为       .
8.为了考察某地2022年6月每天的最高气温,随机抽取了5天,所得数据为29,29,31,30,31,则该地2022年6月每天的最高气温平均值约为    .
四、解答题
9.从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴.
10.某次运动会甲、乙两名射击运动员的成绩(环数)如下:
甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8;
乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1.
求两个样本数据的平均数,估计哪位运动员水平较高.
一、选择题
1.某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a,高一(6)班被抽到的可能性为b,则 (  )
A.a=,b= B.a=,b=
C.a=,b= D.a=,b=
2.我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米2 020石,验得米内夹谷,抽样取米一把,数得255粒内夹谷29粒,则这批米内夹谷约为 (  )
A.222石 B.220石
C.230石 D.232石
二、填空题
3.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为   .
4.为了调查某市城区某小河流的水体污染状况,就某个指标,某学校甲班的同学抽取了样本量为50的5个样本,乙班的同学抽取了样本量为100的5个样本,得到如下数据:
样本 抽样序号
1 2 3 4 5
样本量为50的样本 123.1 120.2 125.4 119.1 123.6
样本量为100的样本  119.8 120.1 121.0 120.3 120.2
据此可以认定     班的同学调查结果能够更好地反映总体,这两个班的同学调查的该项指标约为     (答案不唯一,只要合理即可).
三、解答题
5.选择合适的抽样方法抽样,写出抽样过程.
(1)现有一批电子元件600个,从中抽取6个进行质量检测;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
6.某些商家为消费者提供免费塑料袋,使购物消费更加方便快捷,但是我们更应关注它对环境的潜在危害.为了解某市所有家庭每年丢弃塑料袋个数的情况,统计人员采用了科学的方法,随机抽取了200户,对他们某日丢弃塑料袋的个数进行了统计,结果如表:
每户丢弃塑 料袋个数 1 2 3 4 5 6
家庭数/户 15 60 65 35 20 5
(1)求当日这200户家庭平均每户丢弃塑料袋的个数;
(2)假设某市现有家庭100万户,据此估计全市所有家庭每年(以365天计算)丢弃塑料袋的总数.
7.某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1~40进行编号,并相应地制作号码为1~40的40个号签,把这40个号签放在一个不透明的箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工幸运入选;
选法二:将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个不透明的箱中搅匀,让40名员工逐一从中摸取一个球,则摸到红球的员工幸运入选.试问:
(1)这两种选法是否都是抽签法,为什么
(2)这两种选法中每名员工被选中的可能性是否相等
第九章 统计
9.1 随机抽样
9.1.1 简单随机抽样
必备知识·落实
1.不放回简单随机抽样
2.(1)① Yi ②fiYi
(2) yi
3.当总体中个体较多时,总体均值不易计算,样本均值比较方便计算.总体均值是一个确定的数,样本均值具有随机性.
知能素养·进阶
【基础巩固组】
1.B ①不是逐个抽取,③不是等可能抽取,故不是简单随机抽样,②④是简单随机抽样.
2.A 简单随机抽样中每个个体每次被抽取的机会均等,都为.
3.D 由抽样调查的意义可以知道该校女生的平均身高约为148.3 cm.
4.B 从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,
所以选出来的第4个个体的编号为09.
【名师点睛】读取时要连续读取2个数字,并且超出范围及重复的要删去.
5.AD 用随机数法抽样时,编号的位数可以相同(随机数表),也可以不同(临时生成随机数),但不能是负数,编号与个体数量相同.
6.ABC 从N个总体中抽取n个个体作为样本,样本量为n,每个个体被抽到的概率为,所以A,B都是正确的,因为样本的合格率为1-=,所以用样本估计总体,这批产品的合格率约为,所以C正确,D错误.
7.【解题指南】按顺序依次选出8位同学的号码,注意大于60的号码要剔去,重复的号码只选一次.
【解析】如题图所示,抽取的8位同学的号码依次为7,4,1,15,2,3,5,14.
答案:7,4,1,15,2,3,5,14
8.【解析】=30.
答案:30
9.【解析】第一步:将20架钢琴编号,号码是01,02,…,20;
第二步:将号码分别写在一张纸条上,揉成团,制成号签;
第三步:将得到的号签放入一个不透明的袋子中,并充分搅匀;
第四步:从袋子中逐个不放回地抽取5个号签,并记录上面的编号;
第五步:所得号码对应的5架钢琴就是要抽取的对象.
10.【解析】=×(9.4+8.7+7.5+8.4+10.1+10.5+10.7+7.2+7.8+10.8)=9.11,
=×(9.1+8.7+7.1+9.8+9.7+8.5+10.1+9.2+10.1+9.1)=9.14,
因为>,所以乙的水平较高.
【素养提升组】
1.C 由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为.
2.C 根据米255粒内夹谷29粒,则频率为,则这批米内夹谷为
2 020×≈230(石).
3.【解析】设参加游戏的小孩有x人,则=,x=.
答案:
4.【解析】由抽样调查的意义可以知道,增加样本量可以提高估计效果,所以乙班同学的调查结果能更好地反映总体,由表可知,该项指标约为120.
答案:乙 120
5.【解析】(1)总体中个体数较大,用随机数表法.
第一步,给元件编号为001,002,003,…,099,100,…,600;
第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;
第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;
第四步,以上这6个号码对应的元件就是要抽取的对象.
(2)总体中个体数较小,用抽签法.
第一步,将30个篮球,编号为1,2,…,30;
第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,揉成小球状,制成号签;
第三步,把号签放入一个不透明的盒子中,充分搅拌;
第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码;
第五步,找出和所得号码对应的篮球.
6.【解析】(1)×(1×15+2×60+3×65+4×35+5×20+6×5)=×600=3,故当日这200户家庭平均每户丢弃塑料袋的个数为3.
(2)3×365×100=109 500,故全市所有家庭每年丢弃塑料袋约109 500万个.
7.【解析】(1)选法一:满足抽签法的特征,是抽签法;
选法二:不是抽签法,抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分.
(2)这两种选法中每名员工被选中的可能性相等,均为.9.1.2 分层随机抽样
1.分层随机抽样
按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行         ,再把所有子总体中抽取的样本合在一起作为      .每一个子总体称为   .
2.样本平均数的计算公式
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层样本的平均数分别为和,则样本的平均数
=    +    =    +    .
一、单选题
1.某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层随机抽样方法从该公司全体员工中选出部分员工座谈,如果选出的人有6人对户外运动持“喜欢”态度,有1人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的人数为(  )
A.36 B.6 C.12 D.18
2.下列调查方案中,抽样方法合适、样本具有代表性的是 (  )
A.用一本书第1页的字数估计全书的字数
B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生
C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些名人的名字,要求每个学生只能在一个名字下面画“√”,以了解全省中学生最崇拜的人物是谁
D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查
3.某校要了解高一学生的学习规划情况,在高一年级6个班级中任选两个班级,并在所选的班级中按男女比例抽取样本,则应采用的抽样方法是 (  )
A.简单随机抽样
B.分层随机抽样
C.先用分层随机抽样,再用随机数法
D.先用抽签法,再用分层随机抽样
4.据统计某高校共有本科生1 600人,硕士生600人,博士生200人申请报名做志愿者,现用分层随机抽样方法从中抽取博士生30人,则该高校抽取的志愿者总人数为 (  )
A.300人 B.320人 C.340人 D.360人
二、多选题
5.某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则 (  )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.三种型号的轿车依次抽取6辆、30辆、10辆
D.这三种型号的轿车,每一辆被抽到的概率都是相等的
6.某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二,学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有(  )
A.应该采用分层随机抽样法抽取
B.高一、高二年级应分别抽取100人和135人
C.高二年级学生被抽到的可能性比高一年级学生大
D.该问题中的总体是高一、高二年级的全体学生的视力
三、填空题
7.“民以食为天,食以安为先”,食品安全是关系人们身体健康的大事,某粮油店经营A,B,C三类品牌的食用油,其中A类品牌的食用油40桶,B类品牌的食用油30桶,C类品牌的食用油20桶,为防止“地沟油”,要从中抽取一个容量为9的样本,若用分层抽样抽取,且在各层中按比例分配样本,则在A,B,C三类品牌的食用油中各抽取的桶数分别为     .
8.比例分配的分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为    .
四、解答题
9.某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生每天参与体育锻炼情况,按分层随机抽样的方法抽取50名男生每天的锻炼时间为一个样本,其样本平均数为70 min,抽取50名女生每天的锻炼时间为一个样本,其样本平均数为60 min,求该校高一年级学生每天的平均锻炼时间的估计值.
10.某班有20名男生,20名女生,已知男女身高有明显不同,现欲调查平均身高,准备抽取,采用比例分配分层随机抽样方法,抽取男生1名,女生1名,你认为这种做法是否妥当 如果让你来调查,你准备怎样做
一、选择题
1.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为 (  )
A.200,20 B.100,20 C.200,10 D.100,10
2.某中学有高中生3 600人,初中生2 400人,为了解学生课外锻炼情况,用分层抽样的方法从学生中抽取一个容量为n的样本.已知从高中生中抽取的人数比从初中生中抽取的人数多24,则n= (  )
A.48 B.72 C.60 D.120
二、填空题
3.某校为了解学生的身体素质情况,采用按年级分层随机抽样的方法,从高一、高二、高三学生中抽取一个300人的样本进行调查,已知高一、高二、高三学生人数之比为k∶5∶4,抽取的样本中高一学生为120人,则k的值为    ,高一学生共有    人.
4.某校做了一次关于“感恩父母”的问卷调查,从9~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为   .
三.解答题
5.某科研机构由科技人员、行政人员和后勤职工3种不同类型的人员组成,现要抽取1个容量为45的样本进行调查.已知科技人员共有60人,抽入样本的有20人,且行政人员与后勤职工的人数之比为2∶3,那么此机构的总人数、行政人员、后勤职工人数分别为多少
6.为了对某课题进行讨论研究,用分层抽样的方法从三所高校A,B,C的相关人员中,抽取若干人组成研究小组,有关数据见下表(单位:人).
高校 相关人数 抽取人数
A x 1
B 36 y
C 54 3
(1)求x,y;
(2)若从高校B相关人员中选2人作专题发言,应采用什么抽样法 请写出合理的抽样过程.
9.1.2 分层随机抽样
必备知识·落实
1.简单随机抽样 总样本 层
2.   
知能素养·进阶
【基础巩固组】
1.A 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x,x,3x,由题意可得3x-x=12,x=6,所以持“喜欢”态度的有6x=36(人).
2.B A中样本缺少代表性(第1页的字数一般较少);B中抽样保证了随机性原则,样本具有代表性;对于C,城市中学与农村中学的规模往往不同,学生崇拜的人物也未必在所列的名单之中,这些都会影响数据的代表性;D中总体数量很大,而样本容量太少,不足以体现总体特征.
3.D 采用抽签法从6个班级中抽取两个班级,然后采用分层随机抽样的方法在所选的班级中按男女比例抽取样本,故D项正确.
4.D 因为1 600∶600∶200=8∶3∶1,用分层随机抽样方法从中抽取博士生30人,所以本科生、硕士生抽取的人数分别为30×8=240(人)、3×30=90(人),
则该高校抽取的志愿者总人数为240+90+30=360(人).
5.ACD 由于总体按型号分为三个子总体,所以应采用分层随机抽样抽取,A正确;
设三种型号的轿车依次抽取x辆,y辆,z辆,
则有解得
所以三种型号的轿车依次抽取6辆、30辆、10辆,故C正确;由分层随机抽样的意义可知D也正确.
6.ABD 易知应采用分层随机抽样法抽取,A正确;
由题意可得高一年级的人数为20×50=1 000,高二年级的人数为30×45=1 350,则高一年级应抽取的人数为235×=100,高二年级应抽取的人数为235-100=135,所以高一、高二年级应分别抽取100人和135人,故B正确;
高二年级学生被抽到的可能性与高一年级学生一样大,故C错误;
该问题中的总体是高一、高二年级的全体学生的视力,故D正确.
7.【解析】分配比例为=,则A类油中抽取的桶数为40×=4,B类油中抽取的桶数为30×=3,C类油中抽取的桶数为20×=2.
答案:4,3,2
8.【解析】该样本的平均数为×3+×8=6.
答案:6
9.【解析】由题意可知,=70,=60,
且M=320,N=280,
所以样本平均数=+=×70+×60≈65.3(min),故该校高一年级学生每天的平均锻炼时间的估计值为65.3 min.
10.【解析】这种做法不妥当.原因:取样比例数过小,很难准确反映总体情况,况且男、女身高差异较大,抽取人数各1名,也不合理.
考虑到本题的情况,可以采用分层随机抽样,抽样比为.男生抽取20×=4(名),女生抽取20×=4(名),各自用抽签法或随机数法抽取组成样本.
(考虑到本题的情况,总体为40,数据不多,可以采用全面调查的方式调查该班的平均身高)
【素养提升组】
1.A 该地区中小学生总人数为3 500+2 000+4 500=10 000(人),则样本量为
10 000×2%=200(人),其中抽取的高中生近视人数为2 000×2%×50%=20(人).
2.D 由题意可知,该校高中生人数与初中生人数之比为3∶2,则-=24,解得n=120.
3.【解析】由题意可得,=,
解得k=6.
经检验,k=6是原分式方程的解.
高一学生有120÷=300(人).
答案:6 300
4.【解析】11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为.
因为从回收的问卷中按年龄段分层抽取容量为300的样本,所以从9~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷总数为=900(份),
则15~16岁回收问卷份数为:x=900-120-180-240=360(份).
所以在15~16岁学生中抽取的问卷份数为360×=120(份).
答案:120
5.【解析】不妨设行政人员有2x人,后勤职工有3x人,根据分层随机抽样等比例抽取的性质,故可得=,解得x=15.
所以后勤职工有3x=45人,行政人员有2x=30人,总人数为135人,所以此机构的总人数、行政人员、后勤职工人数分别为135,30,45.
6.【解析】(1)分层抽样是按各层相关人数和抽取人数的比例进行的,所以有=,所以x=18,=,所以y=2.
故x=18,y=2.
(2)总体容量和样本容量较小,所以应采用抽签法,过程如下:
第一步,将36人随机编号,号码为1,2,3,…,36;
第二步,将号码分别写在相同的纸片上,揉成团,制成号签;
第三步,将号签放入一个不透明的容器中,充分搅匀,依次不放回地抽取2个号码,并记录上面的编号;
第四步,把与号码相对应的人抽出,即可得到所要的样本.9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
1.频率分布直方图
(1)频率分布直方图的纵坐标是   ,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为   .
(2)除频率分布直方图外,还有其他统计图吗
(3)频率分布直方图的组数对数据分析有何影响
2.百分位数
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有      的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤:
第1步,按        排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的      .
一、单选题
1.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是第   百分位数. (  )
A.15 B.25 C.50 D.75
2.将容量为100的样本数据,按由小到大排列分成8个小组,如表所示:
组号 1 2 3 4 5 6 7 8
频数 10 13 14 14 15 13 12 9
第3组的频率和累积频率为 (  )
A.0.14和0.37 B.和
C.0.03和0.06 D.和
3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为 (  )
A.6 B.8 C.12 D.18
4.如图是根据某中学为地震灾区捐款的情况而制作的统计图.已知该校在校学生3 000人,根据统计图计算该校捐款总额为 (  )
A.10 500 B.12 870 C.14 400 D.37 770
二、多选题
5.5月6日,小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.
根据图中的信息可得 (  )
A.护士每隔6小时给小明测量一次体温
B.近三天来,小明的最低体温38摄氏度
C.从体温看,小明的病情在不断好转
D.如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快5月10日凌晨5时出院
6.为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),
[90,100)六组),若问卷成绩最后三组频数之和为360,则 (  )
A.n=480
B.问卷成绩在[70,80)内的频率为0.3
C.a=0.030
D.以样本估计总体,若对A地区5 000人进行问卷调查,则约有1 250人不及格
三、填空题
7.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是    .
8.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则样本在[40,50),[50,60)内的数据个数之和为    .
四、解答题
9.生产过程中,测得纤维产品的纤度(表示纤细的一种量),共有100个数据,将数据分组如下表:
分组 频数 频率
[1.30,1.34) 4
[1.34,1.38) 25
[1.38,1.42) 30
[1.42,1.46) 29
[1.46,1.50) 10
[1.50,1.54] 2
合计 100
(1)完成频率分布表,并画出频率分布直方图;
(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少
10.为了了解学生参加体育活动的情况,某校对学生进行了随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少”,共有4个选项可供选择:
A.1.5小时以上 B.1~1.5小时
C.0.5~1小时 D.0.5小时以下
如图是根据调查结果绘制的两幅不完整的统计图,请你根据统计图中提供的信息解答以下问题:
(1)本次一共调查了多少名学生
(2)在图(1)中将选项B对应的部分补充完整;
(3)若该校有3 000名学生,你估计全校有多少名学生平均每天参加体育活动的时间在0.5小时以下
一、选择题
1.下面是两户居民家庭全年各项支出的统计图.
根据统计图,下列对两户教育支出占全年总支出的百分比作出的判断中,正确的是 (  )
A.甲户比乙户大
B.乙户比甲户大
C.甲、乙两户一样大
D.无法确定哪一户大
2.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居民,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是 (  )
A.7 B.7.5 C.8 D.9
二、填空题
3.某学校随机抽取部分新生调查其从家到学校所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则
(1)图中的x=    ;
(2)若从家到学校所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有    名学生可以申请住宿.
4.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为    ;
(2)由频率分布直方图估计志愿者年龄的85%分位数为    岁.
三.解答题
5.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名考生参加了这次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:
分组 频数 频率
[50,60) 4 0.08
[60,70) 0.16
[70,80) 10
[80,90) 16 0.32
[90,100]
合计 50
(1)填充频率分布表的空格(将答案直接填在表格内).
(2)补全频率分布直方图.
(3)若成绩在[70,90)分的学生为二等奖,问该校获得二等奖的学生约为多少人
6.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
9.2 用样本估计总体
9.2.1 总体取值规律的估计
9.2.2 总体百分位数的估计
必备知识·落实
1.(1) 1
(2)条形图、扇形图、折线图、频数分布直方图.
(3)当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.
2.(1)p% (2)从小到大 平均数
知能素养·进阶
【基础巩固组】
1.B 由小到大排列的结果:6,7,15,36,39,40,41,42,43,47,49,一共11项.由11×25%=2.75,故第25百分位数是15.
2.A 由表可知,第三小组的频率为=0.14,累积频率为=0.37.
3.C 志愿者的总人数为=50,所以第三组人数为50×0.36×1=18,所以有疗效的人数为18-6=12.
4.D 根据统计图,得高一人数为3 000×32%=960(人),捐款960×15=14 400(元);
高二人数为3 000×33%=990(人),
捐款990×13=12 870(元);
高三人数为3 000×35%=1 050(人),捐款1 050×10=10 500(元).所以该校学生共捐款14 400+12 870+10 500=37 770(元).
5.AC 根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.
从折线统计图中的最高点和最低点对应的纵轴意义,可知近三天最低体温是36.8摄氏度.
从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.
5月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自5月8日18时起计算,连续36小时后对应的时间为5月10日凌晨6时.因此小明最快可以在5月10凌晨6时出院.
6.BCD 由(0.010+0.015+0.015+a+0.025+0.005)×10=1,得a=0.030,
n==600,故A不正确,C正确.成绩在[70,80)内的频率为10a=0.3,故B正确.若对A地区5 000人进行问卷调查,则约有5 000×(0.1+0.15)=1 250人不及格,故D正确.
7.【解析】由30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.
答案:8.6
8.【解析】根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
因为样本中数据在[20,60)内的频率为0.6,样本容量为50,所以=0.6,
解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.
答案:21
9.【解析】(1)频率分布表如下:
分组 频数 频率
[1.30,1.34) 4 0.04
[1.34,1.38) 25 0.25
[1.38,1.42) 30 0.30
[1.42,1.46) 29 0.29
[1.46,1.50) 10 0.10
[1.50,1.54] 2 0.02
合计 100 1.00
频率分布直方图如图所示.
(2)利用样本估计总体,则纤度落在[1.38,1.50)的可能性即为纤度落在[1.38,1.50)的频率,即为0.30+0.29+0.10=0.69=69%.
纤度小于1.42的可能性即为纤度小于1.42的频率,即为0.04+0.25+0.30=0.59=
59%.
10.【解析】(1)由图(1)知,选A的人数为60,而图(2)显示,选A的人数占总人数的30%,故本次调查的总人数为60÷30%=200.
(2)由图(2)知,选B的人数占总人数的50%,因此其人数为200×50%=100,图(1)补充如图所示:
(3)根据图(2)知:平均每天参加体育活动的时间在0.5小时以下的人数占统计人数的5%,以此估计得3 000×5%=150(人).
【素养提升组】
1.B 条形统计图反映具体数值,则由图甲可知,甲户教育支出占全年总支出的百分比为1 200÷(1 200+2 000+1 200+1 600)×100%=20%;从扇形统计图乙可知,乙户教育支出占全年总支出的百分比为25%.所以乙户比甲户大.
2.C 该组数据从小到大排列为:5,5,6,7,8,9,且6×80%=4.8.所以第80百分位数是第5个数,即8.
3.【解析】(1)由频率分布直方图知20x=1-20×(0.025+0.006 5+0.003+0.003),
解得x=0.012 5.
(2)从家到学校时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计有0.12×600=72(人)可以申请住宿.
答案:(1)0.012 5 (2)72
4.【解析】(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.
(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,
所以志愿者年龄的85%分位数在[35,40)内,
因此志愿者年龄的85%分位数为35+×5≈39(岁).
答案:(1)0.04 (2)39
5.【解析】(1)
分组 频数 频率
[50,60) 4 0.08
[60,70) 8 0.16
[70,80) 10 0.20
[80,90) 16 0.32
[90,100] 12 0.24
合计 50 1.00
(2)频率分布直方图如图所示:
(3)因为成绩在[70,80)间的学生频率为0.20;
成绩在[80,90)间的学生频率为0.32.
所以在[70,90)之间的频率为0.20+0.32=0.52.
又因为900名学生参加竞赛,所以该校获二等奖的学生为900×0.52=468(人).
6.【解析】(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,
则第25百分位数是=8.15,
第50百分位数是=8.5,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即珍珠质量较小的前15%的珍珠有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
1.众数、中位数
众数:一组数据中重复出现次数     的数.
中位数:把一组数据按从小到大(或从大到小)排列,处在      位置的一个数据(或两个数据的      ).
2.样本方差、样本标准差
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,则样本方差:s2=       ,样本标准差:s=    .
3.标准差、方差与数据离散程度有何关系
4.用频率分布直方图估计众数、中位数、平均数
(1)众数:取           底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积    的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的    乘小矩形底边中点的    之和.
一、单选题
1.学校田径运动会有15名运动员参加跳高比赛,预赛成绩各不相同,取前8名参加决赛,某同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道这15名运动员成绩的 (  )
A.平均数 B.众数 C.中位数 D.极差
2.抽样调查了某班30位女生所穿鞋子的尺码,数据如下(单位:码).在这组数据的平均数、中位数和众数中,鞋厂最感兴趣的是 (  )
码号 33 34 35 36 37
人数 7 6 15 1 1
A.平均数 B.中位数 C.众数 D.无法确定
3.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如表:
甲 乙 丙 丁
平均数 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则参加奥运会的最佳人选应为 (  )
A.甲 B.乙 C.丙 D.丁
4.随机抽取高一(1)班10名同学,测量他们的身高(单位:cm)分别为158,162,164,168,168,170,171,178,179,182,记这10名同学的平均身高为,则身高不小于平均数的同学有 (  )
A.3个 B.4个 C.5个 D.6个
二、多选题
5.如图,样本A,B分别取自两个不同的总体,它们的平均数分别为,,中位数分别为yA,yB,则 (  )
A.> B.< C.yA>yB D.yA6.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲 78795491074
乙 9578768677
在这次射击中,下列说法正确的是 (  )
A.甲成绩的极差比乙成绩的极差大
B.甲成绩的众数比乙成绩的众数大
C.甲的成绩没有乙的成绩稳定
D.甲成绩的中位数比乙成绩的中位数大
三、填空题
7.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下:
甲:6,8,9,9,8;乙:10,7,7,7,9.
则两人的射击成绩较稳定的是    .
8.有13位同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是   (填“众数”“中位数”或“平均数”).
四、解答题
9.某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.
10.甲、乙、丙三家电子厂商在广告中都声称,他们的某型电子产品在正常情况下的待机时间都是12 h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数和中位数.
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间
(3)如果你是顾客,宜选择哪个厂商的产品 为什么
一、选择题
1.某市4月份日平均气温统计图情况如图所示,则在日平均气温这组数据中,众数和中位数分别是 (  )
A.13,13 B.13,13.5 C.13,14 D.16,13
2.是x1,x2,…,x100的平均值,5为x1,x2,…,x40的平均值,10为x41,x42,…,x100的平均值,则= (  )
A.8 B.9 C.15 D.
二、填空题
3.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s1,s2,s3,则它们的大小关系为     (用“>”连接).
4.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为   件;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为    小时.
三、解答题
5.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
6.在一次科技知识竞赛中,两组学生的成绩如下表:
分数 50 60 70 80 90 100
人数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
9.2.3 总体集中趋势的估计
9.2.4 总体离散程度的估计
必备知识·落实
1.最多 最中间 平均数
2. 
3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.
4.(1)最高小长方形 (2)相等 (3)面积 横坐标
知能素养·进阶
【基础巩固组】
1.C 共有15名运动员参加比赛,取前8名参加决赛,将15名运动员的成绩从大到小排列,第8名运动员的成绩是这组数据的中位数,所以为了判断自己是否能进入决赛,还需要知道这15名运动员成绩的中位数.
2.C 由于众数是数据中出现最多的数,故鞋厂最感兴趣的是销售量最多的鞋号即这组数据的众数.
3.C 由平均数及方差的意义知,丙的平均成绩较高且较稳定.
4.C =×(158+162+164+168+168+170+171+178+179+182)=170(cm),
身高不小于平均数的同学有5个.
5.BD 由题图知,A组的6个数从小到大排列为2.5,2.5,5,7.5,10,10;B组的6个数从小到大排列为6,6,6,7.5,7.5,9,
所以==6.25,
==7.
显然<.
又yA=(5+7.5)=6.25,
yB==6.75,
所以yA6.AC 由题意可知,对于选项A,甲成绩的极差为10-4=6,乙成绩的极差为9-5=4,所以甲成绩的极差比乙成绩的极差大,故选项A正确;对于选项B,甲成绩的众数为7,乙成绩的众数为7,故选项B错误;对于选项C,甲成绩的平均数为=7,
方差为=4,乙成绩的平均数为=7,
方差为=1.2,则甲成绩的方差大于乙成绩的方差,即甲的成绩没有乙的成绩稳定,故选项C正确;对于选项D,甲成绩的中位数为7,乙成绩的中位数为7,故选项D错误.
7.【解析】由题意求平均数可得==8,=1.2,=1.6,<,所以甲稳定.
答案:甲
8.【解析】因为7位获奖者的分数肯定是13名参赛选手中最高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.
答案:中位数
9.【解析】由已知条件可知高级职称教师的平均年龄为==45(岁),
年龄的方差为=[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,
所以该校中级职称和高级职称教师的平均年龄为=×38+×45≈39.2(岁),
该校中级职称和高级职称教师的年龄的方差是
s2=[2+(38-39.2)2]+[73+(45-39.2)2]=20.64.
10.【解析】(1)根据平均数的计算公式可知:
甲厂数据的平均数是
=12;
乙厂数据的平均数是
=13.6;
丙厂数据的平均数是
=13.4.
甲厂、乙厂、丙厂的众数分别是9,12,8.
甲厂数据的中位数为=10,乙厂数据的中位数为=12.5,丙厂数据的中位数为=12.
(2)甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)我会选乙厂的产品.因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些,稳定性也较好.
【素养提升组】
1.C 因为这组数据中,13出现了10次,出现次数最多,所以众数为13,因为第15个数和第16个数都是14,所以中位数是14.
2.A 因为5为x1,x2,…x40的平均值,
所以=5,
即x1+x2+…+x40=5×40=200,
因为10为x41,x42,…x100的平均值,
所以=10,即
x41+x42+…+x100=10×60=600,
所以===8.
3.【解析】根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最小,故s1>s2>s3.
答案:s1>s2>s3
4.【解析】由分层抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命为1 020×50%+980×20%+1 030×30%=1 015(小时).
答案:50 1 015
5.【解析】(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65,又因为第一个小矩形的面积为0.3,第二个小矩形的面积为0.4,设第二个小矩形底边的一部分长为x,则x×0.04=0.2,得x=5,所以中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以平均成绩约为67分.
6.【解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数看,甲组成绩较好.
(2)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人,从这一角度看,甲组成绩较好.
(3)=×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172.
=×[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
因为<,所以甲组成绩比乙组成绩稳定,从这一角度看,甲组成绩较好.
(4)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩分布在高分段的人数较多.
同时,乙组得满分的人数比甲组得满分的人数多6,从这一角度看,乙组成绩较好