第九章 9.1 9.1.1
A 组·素养自测
一、选择题
1.下列抽取样本的方式是简单随机抽样的有( B )
①某连队从200名官兵中,挑选出50名最优秀的官兵赶赴某地参加救灾工作;
②箱子中有100支铅笔,从中选10支进行检测,在抽样操作时,从中任意拿出一支检测后再放回箱子里;
③从50个个体中一次性抽取8个个体作为样本;
④从2 000个灯泡中不放回地逐个抽取20个进行质量检查.
A.0个 B.1个
C.2个 D.3个
[解析] 只有④符合简单随机抽样的要求.
2.全市10个重点医院的1 425名医生中随机选取4名组成医疗小组.假定本次选员是一个抽样过程,则样本量为( A )
A.4 B.10
C.1 425 D.2 020
3.某总体容量为M,其中带有标记的个体有N个,现用简单随机抽样的方法从中抽出一个容量为m的样本,则抽取的m个个体中带有标记的个数估计为( A )
A. B.
C. D.N
[解析] 利用在总体中的占比等于在样本中的占比,设在样本中带有标记的有x个.则=,所以x=.故选A.
4.下列抽样试验中,用抽签法方便的有( B )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
5.为了调查高一学生的数学学习状况,从50名高一同学的数学成绩中用抽签法随机抽取5名同学数学成绩为:80分,85分,75分,60分,90分,那么据此可以估计这50名同学的数学平均分为( B )
A.76分 B.78分
C.80分 D.82分
[解析] 由题意可估计这50名同学的数学平均分为(80+85+75+60+90)=78(分).
二、填空题
6.一次体育运动会,某代表团有6名代表参加,欲从中抽取一人检查是否服用兴奋剂,抽检人员将6名队员名字编号为1~6号,然后抛掷一枚骰子,朝上的一面是几就抽检几号对应的队员,问这种抽检方式是简单随机抽样吗?_是__(填“是”或“不是”).
[解析] 抛掷一枚均匀的骰子,各面向上的机会是均等的,故每名队员被抽到的机会相等.
7.一个总体的60个个体编号为00,01,…,59,现需从中抽取一容量为6的样本,请从下面给出的随机数表的第10列开始向右读取,直到取足样本,则抽取的第五个样本的号码是_17__.
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
[解析] 读取的数字两个一组为01,87,47,20, 01, 83, 87, 95, 86, 93, 28, 17, 68, 02,…,由于抽取的号码不能超过59,且不能重复,则抽取的样本号码是01,47,20,28,17,02,第五个是17.
8.已知总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取4个个体,选取方法是从随机数表第1行的第5个数字开始,由左到右依次选取两个数字,则选取的4个个体编号分别为_08,02,14,07__.
7816 6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938 7481
[解析] 第1次选取的是65,不符合题意;第2次选取的是72,不符合题意;第3次选取的是08,符合题意;第4次选取的是02,符合题意;第5次选取的是63,不符合题意;第6次选取的是14,符合题意;第7次选取的是07,符合题意.
三、解答题
9.判断下列是否是随机抽样?
(1)从自然数中抽取100个研究素数的比例;
(2)从一箱100个零件中抽取5个进行质量调查;
(3)在一个班级40人中选5人参加志愿者,其中在身高最高的5人中抽取4个.
[解析] (1)随机抽样是在有限多个个体中进行抽取,所以从自然数中抽取100个研究素数不是随机抽样.
(2)从一箱100个零件中抽取5个进行质量调查符合随机抽样的特点,在有限多个个体中,通过逐个抽取的方法抽取样本,且每次抽取时各个个体被抽到的概率相等,所以是随机抽样.
(3)在身高最高的5人中抽取4个不满足每次抽取时各个个体被抽到的概率相等,所以在一个班级40人中选5人参加志愿者,其中在身高最高的5人中抽取4个不是随机抽样.
10.选择合适的抽样方法抽样,写出抽样过程.
(1)现有一批电子元件600个,从中抽取6个进行质量检测;
(2)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样.
[解析] (1)总体中个体数较大,用随机数法.
第一步,给元件编号为1,2,3,…,99,100,…,600;
第二步,用随机数工具产生1~600范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的电子元件进入样本;
第三步,依次操作,如果生成的随机数有重复,则剔除并重新产生随机数,直到样本量达到6;
第四步,以上这6个号码对应的元件就是要抽取的对象.
(2)总体中个体数较小,用抽签法.
第一步,将30个篮球,编号为1,2,…,30;
第二步,将以上30个编号分别写在外观、质地等无差别的小纸条上,揉成小球状,制成号签;
第三步,把号签放入一个不透明的盒子中,充分搅拌;
第四步,从盒子中不放回地逐个抽取3个号签,并记录上面的号码;
第五步,找出和所得号码对应的篮球.
B 组·素养提升
一、选择题
1.(2022·北京市丰台区期末)某校为了分析高三年级的8个班400名学生第一次高考模拟考试的数学成绩,决定在8个班中每班随机抽取12份试卷进行分析,这个问题中样本量是( C )
A.8 B.400
C.96 D.96名学生的成绩
[解析] 在本题所叙述的问题中,400名学生第一次高考模拟考试的数学成绩是总体,8×12=96(名)学生的数学成绩是样本,400是总体量,96是样本量.
2.(多选题)下面的抽样方法是简单随机抽样的是( CD )
A.从无数张高考试卷中抽取50张试卷作为样本
B.从80台笔记本电脑中一次性抽取6台电脑进行质量检查
C.一福彩彩民买30选7彩票时,从装有30个大小、形状都相同的乒乓球的盒子(不透明)中逐个无放回地摸出7个有标号的乒乓球,作为购买彩票的号码
D.用抽签法从10件产品中选取3件进行质量检验
[解析] A中样本总体数目不确定,不是简单随机抽样;B中样本不是从总体中逐个抽取,不是简单随机抽样;C、D符合简单随机抽样的特点,是简单随机抽样.故选CD.
3.已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的个数是( D )
A.1 B.2
C.3 D.4
[解析] ①不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;②不是简单随机抽样,原因是简单随机抽样是不放回地抽取,而题中是放回地;③不是简单随机抽样,原因是简单随机抽样是逐个抽取,而题中是一次性抽取;④不是简单随机抽样,原因是个子最高的5名同学是56名同学中特定的,不存在随机性,不是等可能抽样.故选择D.
二、填空题
4.为了考察某地6月份最高气温的情况,随机抽取了5天,所得数据(单位:℃)约为29,29,31,30,31,则该地6月份最高气温的平均值约为_30_℃__.
[解析] =30 ℃.
5.假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将500袋牛奶按000,001,…,499进行编号,如果从随机数表第8行第26列的数开始,按三位数连续向右读取,最先检验的5袋牛奶的号码是(下面摘取了某随机数表第7行至第9行)_169,105,071,286,443__.
84421 75331 57245 50688 77047 44767 21763
35025 83921 20676 63016 47859 16955 56719
98105 07185 12867 35807 44395 23879 33211
[解析] 根据随机数表法中数据的读取规则与方法,可得最先检验的5袋牛奶的号码是:169,105,071,286,443.
故答案为169,105,071,286,443.
三、解答题
6.一个学生在一次竞赛中要回答的8道题是这样产生的:从15道物理题中随机抽取3道;从20道化学题中随机抽取3道;从12道生物题中随机抽取2道.使用合适的方法确定这个学生所要回答的三门学科的题的序号(物理题的编号为1~15,化学题的编号为16~35,生物题的编号为36~47).
[解析] 解法一:抽签法:
第一步,将试题的编号1~47分别写在一张纸条上,将纸条揉成团儿制成号签,并将物理、化学、生物题的号签分别放在一个不透明的袋子中并搅匀.
第二步,从装有物理题的袋子中逐个抽取3个号签,从装有化学题的袋子中逐个抽取3个号签,从装有生物题的袋子中逐个抽取2个号签,并记录所得号签上的编号,这便是所要回答的问题的序号.
解法二:随机数法:
第一步,将物理题的序号对应改成01,02,…,15,其余两科题的序号不变.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,每次读取两位,凡不在01~47中的数跳过去不读,前面已经读过的也跳过去不读,从01~15中选3个号码,从16~35中选3个号码,从36~47中选2个号码.直到取满8个数为止,说明8个样本号码已取满.
第三步,对应以上号码找出所要回答的问题的序号.
C 组·探索创新
从一群游戏的小孩中抽出k个,一人分一个苹果,让他们返回继续游戏,一段时间后,再从中任取m人,发现其中有n个小孩曾分到过苹果,估计一共有小孩( B )
A.k·人 B.k·人
C.(k+m-n)人 D.不能估计
[解析] 设一共有x人,由=,解得x=.第九章 9.1 9.1.2、9.1.3
A 组·素养自测
一、选择题
1.“中国天眼”为500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( C )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
[解析] “中国天眼”主要是通过观察获取数据.
2.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( C )
A.4 B.5
C.6 D.7
[解析] 本题主要考查对分层随机抽样的理解.抽样比为=,则抽取的植物油类食品种数是10×=2,抽取的果蔬类食品种数是20×=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.
3.某市新上了一批便民公共自行车,有绿色和橙黄色两种颜色,且绿色公共自行车和橙黄色公共自行车的数量比为2∶1,现在按照分层随机抽样的方法抽取36辆这样的公共自行车放在某校门口,则其中绿色公共自行车的辆数是( D )
A.8 B.12
C.16 D.24
[解析] 根据题意,绿色公共自行车和橙黄色公共自行车的数量比为2∶1,
所以样本中绿色公共自行车和橙黄色公共自行车的数量比也为2∶1,
所以绿色公共自行车的辆数为36×=24.
4.某电器城为应对即将到来的空调销售旺季,批发了一批新型号空调,其中甲品牌60台,乙品牌45台,丙品牌30台,为了确保产品质量,质检员要在这批空调中采用分层抽样的方法,抽取一个容量为n的样本进行安全性能检验,若甲品牌空调抽取了12台,则n=( D )
A.18 B.21
C.24 D.27
[解析] 由=,得乙品牌抽取了45×=9台,丙品牌抽取了30×=6台,所以n=12+9+6=27.
故选D.
5.(多选题)某高校大一新生中,来自东部地区的学生有2 400人、中部地区的学生有1 600人、西部地区的学生有1 000人.从中选取100人作样本调研饮食习惯,为保证调研结果相对准确,下列判断正确的有( AC )
A.用分层抽样的方法分别抽取东部地区学生48人、中部地区学生32人、西部地区学生20人
B.用简单随机抽样的方法从新生中选出100人最适合
C.西部地区学生小刘被选中的可能性为
D.中部地区学生小张被选中的可能性为
[解析] 由题设可得东部地区、中部地区、西部地区的学生的抽样比为12∶8∶5,故抽取100人时东部地区、中部地区、西部地区的学生人数分别为:100×,100×,100×即48,32,20,故A正确.用简单随机抽样的方法从新生中选出人数为25n(n∈N*)均合适,故B错误.由分层抽样的性质可得无论哪一个地区的学生,被抽取到的概率为=,故C正确,D错误.
故选AC.
二、填空题
6.某地有15 000亩农田,其中山地、平原、洼地分别为9 800亩、1 200亩、4 000亩,在实施乡村振兴战略中,要对这个地方的农作物产量进行调查,应当采用的抽样方法是_分层抽样__.
[解析] 由于田地分为:山地、平原、洼地,不同的田地农作物产量会有较大的不同,所以应该采用分层抽样.
7.某校共有师生2 400人,其中教师200人,男学生1 200人,女学生1 000人.现用比例分配的分层随机抽样方法从所有师生中抽取一个容量为n的样本,已知从女学生中抽取的人数为80,那么n=_192__.
[解析] 由于女学生的抽样比与总体的抽样比相等,则=,解得n=192.
8.某企业三月中旬生产A、B、C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别 A B C
产品数量/件 1 300
样本量 130
由于不小心,表格中A、C产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本量比C产品的样本量多10,根据以上信息,可得C产品的数量是_800__件.
[解析] 设样本量为x,则×1 300=130.∴x=300.
∴A产品和C产品在样本中共有300-130=170(件).
设C产品的样本量为y,则y+y+10=170,∴y=80.
∴C产品的数量为×80=800(件).
三、解答题
9.某学校为了了解2022年高考语文的考试成绩,计划在高考后对1 200名学生进行抽样调查,其中有300名文科考生,600名理科考生,200名艺术类考生,70名体育类考生,30名外语类考生,若要抽出120名考生作为调查分析对象,则按科目应分别抽取多少名考生?
[解析] 从1 200名考生中抽取120名调查,由于各科目的考生人数不同,为了更准确地了解情况,可采用分层随机抽样,抽样时每层所抽人数按1∶10抽取.
所以300×=30,600×=60,200×=20,70×=7,30×=3.
所以抽取的文科考生、理科考生、艺术类考生、体育类考生、外语类考生分别是30名、60名、20名、7名、3名.
10.某工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
第一车间 第二车间 第三车间
女工 173 100 y
男工 177 x z
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层随机抽样的方法在全厂抽取50名工人,问应在第三车间抽取多少名?
[解析] (1)由=0.15,得x=150.
(2)∵第一车间的工人数是173+177=350(人),第二车间的工人数是100+150=250(人),
∴第三车间的工人数是1 000-350-250=400(人).
设应从第三车间抽取m名工人,则由=,
得m=20.
∴应在第三车间抽取20名工人.
B 组·素养提升
一、选择题
1.北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是一次中国文化与奥林匹克精神的完美结合,现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和15个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( D )
A.3 B.5
C.9 D.10
[解析] 抽样比为=,
所以n=(20+15+15)×=10.
故选D.
2.一支田径队有男运动员48人,女运动员36人,用分层抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为177.5 cm,抽出的女运动员平均身高为168.4 cm,估计该田径队运动员的平均身高是( B )
A.172.95 cm B.173.6 cm
C.172.3 cm D.176 cm
[解析] 依题意,该田径队运动员的平均身高为177.5×+168.4×=173.6 cm.
3.某学校在校学生2 000人,为了学生的“德、智、体”全面发展,学校举行了跑步和登山比赛活动,每人都参加而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:
高一年级 高二年级 高三年级
跑步人数 a b c
登山人数 x y z
其中a∶b∶c=2∶5∶3,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高三年级参与跑步的学生中抽取( D )
A.15人 B.30人
C.40人 D.45人
[解析] 全校参与登山的人数是2 000×=500(人),所以全校参与跑步的人数是1 500人,所以抽取全校参与跑步的人数为×200=150(人),则从高三年级参与跑步的学生中抽取人数为150×=45(人).故选D.
二、填空题
4.某单位200名职工的年龄分布情况如图所示,现要从中抽取一个容量为40的样本,用分层抽样法应抽取50岁以上年龄段的职工_8__人.
[解析] 依题意50岁以上年龄段的职工应该抽取40×20%=8人;
故答案为8.
5.某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团,已知报名参加这两个社团的学生共有800人,按照要求每人只能参加一个社团,各年级参加社团的人数情况如下表:
高一年级 高二年级 高三年级
泥塑 a b c
剪纸 x y z
其中x∶y∶z=5∶3∶2,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对这两个社团活动的满意程度,从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取_6__人.
[解析] 因为“泥塑”社团的人数占两个社团总人数的,所以“剪纸”社团的人数占两个社团总人数的,所以“剪纸”社团的人数为800×=320.
易知“剪纸”社团中高二年级人数占比例为==,所以“剪纸”社团中高二年级人数为320×=96.由题意知,抽样比为=,所以从高二年级“剪纸”社团中抽取的人数为96×=6.
三、解答题
6.某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40.为了检测该大队的射击水平,从整个大队用按比例分配分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8,8.5,8.1,试估计该武警大队队员的平均射击水平.
[解析] 该武警大队共有30+30+40=100(人),按比例分配得第一中队参加考核人数为×30=9;
第二中队参加考核人数为×30=9;
第三中队参加考核人数为×30=12,
所以参加考核的30人的平均射击环数为
×8.8+×8.5+×8.1=8.43,
所以估计该武警大队队员的平均射击水平为8.43环.
C 组·探索创新
已知一种腌菜食品按行业生产标准分为A,B,C三个等级,现针对某加工厂的同一批次的三个等级420箱腌菜进行质量检测,采用分层随机抽样的方法进行抽取.设从三个等级A,B,C中抽取的箱数分别为m,n,t,若2t=m+n,则420箱腌菜中等级为C级的箱数为( D )
A.110 B.120
C.130 D.140
[解析] 由2t=m+n,可知等级为C级的腌菜占全部箱数的,故420箱腌菜中等级为C级的箱数为420×=140.第九章 9.2 9.2.1
A 组·素养自测
一、选择题
1.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
第三组的频数和频率分别是( A )
A.14和0.14 B.0.14和14
C.和0.14 D.和
[解析] x=100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为=0.14.
2.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[50,60)内的汽车有( C )
A.30辆 B.40辆
C.60辆 D.80辆
[解析] 因为小长方形的面积即为对应的频率,时速在[50,60)内的频率为0.3,所以有200×0.3=60(辆).
3.观察如图所示的统计图,下列结论正确的是( D )
A.甲校女生比乙校女生多
B.乙校男生比甲校男生少
C.乙校女生比甲校男生少
D.甲、乙两校女生人数无法比较
[解析] 图中数据只是百分比,甲、乙两个学校的学生人数不知道,因此男生、女生的具体人数也无法得知.
4.(多选题)(2023·安徽省马鞍山市质检)某品牌为了研究旗下某产品在淘宝、抖音两个平台的销售状况,统计了2021年7月到12月在淘宝和抖音官方平台的月营业额(单位:万元),得到如图所示的折线图.下列说法正确的是( ABC )
A.抖音平台的月营业额的平均值在[31,32]内
B.淘宝平台的月营业额总体呈上升趋势
C.抖音平台的月营业额极差比淘宝平台的月营业额极差小
D.10,11,12月份的总营业额淘宝平台比抖音平台少
[解析] 抖音平台的月营业额的平均值为×(14+21+26+30+52+47)≈31.7∈[31,32],故A正确;由淘宝平台的折线走势可知,淘宝平台的月营业额总体呈上升趋势,故B正确;抖音平台的月营业额极差为52-14=38,淘宝平台的月营业额极差为53-7=46,故C正确;10,11,12月份淘宝的总营业额为33+44+53=130,10,11,12月份抖音的总营业额为30+52+47=129,故D错误.故选ABC.
5.(多选题)为组织好“市运会”,组委会征集了800名志愿者,现对他们的年龄进行抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失.则下列说法正确的是( AD )
A.年龄在[25,30)内对应小长方形的高度为0.04
B.年龄在[25,30)内对应小长方形的高度为0.2
C.这800名志愿者中年龄在[25,35)内的人数为400
D.这800名志愿者中年龄在[25,35)内的人数为440
[解析] 年龄在[25,30)内对应小长方形的高度为×[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,故所求人数为0.55×800=440.故选AD.
二、填空题
6.将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表:
组号 1 2 3 4 5 6 7 8
频数 10 16 18 15 11 9
若第6组的频率是第3组频率的2倍,则第6组的频率是_0.14.__.
[解析] 由题得第3组和第6组的频数和为100-10-16-18-15-11-9=21,
所以第6组的频数为21×=14.
所以第6组的频率是=14%=0.14.
故答案为0.14.
7.某校高一(1)班有50名学生,综合素质评价“运动与健康”方面的等级统计如图所示,则该班“运动与健康”评价等级为A的人数是_19__.
[解析] 由扇形图可知:评价等级为A的人数占总人数的38%,由此可知高一(1)班的50名学生中有50×38%=19人在该等级中.
8.中国于2022年2月在北京成功地举办了第二十四届冬季奥林匹克运动会.共赴冰雪之约,共享冬奥机遇,“冰雪经济”逐渐升温,“带动三亿人参与冰雪运动”已从愿望变为现实,中国各地滑雪场的数量也由2015年的1 255家增加到2021年的3 100家.下面是2016年至2021年中国滑雪场新增数量和滑雪场类型统计图,下列说法中正确的序号是_①②④__.
①2021年中国滑雪场产业中大众娱乐型滑雪场占比最高
②2016年至2021年中国滑雪场数量逐年上升
③2016年至2021年中国滑雪场新增数量逐年增加
④2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多
[解析] 由扇形统计图可知,2021年中国滑雪场产业中大众娱乐型滑雪场占比最高,故①正确;
由柱状图可知,2016年至2021年中国滑雪场数量逐年上升,故②正确;
由柱状图可知,2020年比2019年下降了,故③不正确;
由图可知,2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多,故④正确.
故答案为①②④.
三、解答题
9.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
[解析] (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小,
因此第二小组的频率为=0.08.
又因为第二小组的频率=,所以样本量===150.
(2)由直方图可估计该校高一年级学生的达标率为×100%=88%.
10.某电子商务公司对10 000名网络购物者某年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.求:
(1)直方图中的a的值;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数.
[解析] (1)由频率分布直方图及频率和等于1可得:
0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,
解得a=3.
(2)消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,
所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
B 组·素养提升
一、选择题
1.(2023·辽宁省沈阳市期末)人口普查的主要目的是全面查清我国人口数量、结构、分布等方面的情况,为完善我国人口发展战略和政策体系、制定经济社会发展规划、推动高质量发展提供准确统计信息支持.根据国家统计局发布的第七次全国人口普查结果,全国人口共141 178万人(不包括香港、澳门、台湾地区),全国共有家庭户49 416万户,家庭户人口为129 281万人.如图所示为历次人口普查中的全国人口及年均增长率,根据该统计图,下列说法正确的是( A )
A.我国人口2010—2020年保持低速增长态势
B.我国人口的年平均增长率持续下降
C.2020年的全国人口相比2010年增加了0.53%
D.我国人口出生率仍然持续上升
[解析] 我国人口2010—2020年的年平均增长率为0.53%,保持低速增长态势,故选项A正确,选项C错误;1964~1982年,我国人口的年平均增长率上升,故选项B错误;从题图中不能判定我国人口出生率的情况,故选项D错误.故选A.
2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( C )
A.6 B.8
C.12 D.18
[解析] 由题意知,第一组和第二组的频率之和为0.24+0.16=0.4,故样本容量为=50,又第三组的频率为0.36,所以第三组的人数为50×0.36=18,故该组中有疗效的人数为18-6=12.
3.(2023·福建省模拟)小王于2017年底贷款购置了一套房子,根据家庭收入情况,小王选择了10年期每月还款数额相同的还贷方式,且截至2022年底,他没有再购买第二套房子.下图是2018年和2022年小王的家庭收入用于各项支出的比例分配图.根据图中信息,判断下列结论正确的是( B )
A.小王一家2022年用于饮食的支出费用跟2018年相同
B.小王一家2022年用于其他方面的支出费用是2018年的3倍
C.小王一家2022年的家庭收入比2018年增加了1倍
D.小王一家2022年用于房贷的支出费用比2018年减少了
[解析] 设2018年小王的家庭收入为a,∵相同的还款数额在2018年占各项支出的60%,在2022年占各项支出的40%,
∴2022年小王的家庭收入为=1.5a.
小王一家2022年用于饮食的支出比例跟2018年相同,但是由于2022年比2018年家庭收入多,
∴小王一家2022年用于饮食的支出费用比2018年多,故A错误;
小王一家2022年用于其他方面的支出费用为1.5a×12%=0.18a,小王一家2018年用于其他方面的支出费用为0.06a,
∴小王一家2022年用于其他方面的支出费用是2018年的3倍,故B正确;
小王一家2022年的家庭收入比2018年增加了=0.5倍,故C错误;
小王一家2022年用于房贷的支出费用与2018年相同,故D错误.故选B.
二、填空题
4.(2023·上海春季高考)某校抽取100名学生测身高,其中身高最大值为186 cm,最小值154 cm,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为_7__.
[解析] ∵153.5+6×5=183.5<186,153.5+7×5=188.5>186,组数有7组,分别是[153.5,158.5),[158.5,163.5),[163.5,168.5),[168.5,173.5),[173.5,178.5),[178.5,183.5),[183.5,188.5).
5.北京时间2022年4月16日09时56分,神州十三号载人飞船返回舱在东风着陆场成功着陆,将在太空“出差”半年的翟志刚、王亚平、叶光富送回到阔别已久的祖国大地.神州十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果:
根据调查结果,以下说法正确的是_①③__.
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少
③在“曾有过航天梦想”的人群中,18-29岁在航天相关方面的总消费最多
[解析] 从曾有过航天梦想的年龄分布图可知,在“曾有过航天梦想”的人群中,54岁及以上的人数最少,所以①正确;
在“曾有过航天梦想”的人群中,30~40岁的消费最多,所以②错误;
设总人数为n ,18-29岁在航天相关方面的总消费约为:0.39×700n=273n,
30-40岁在航天相关方面的总消费约为:0.33×800n=264n,
41-53岁在航天相关方面的总消费约为:0.20×650n=130n,
54岁及以上在航天相关方面的总消费约为:0.08×200n=16n.
所以在“曾有过航天梦想”的人群中,18-29岁在航天相关方面的总消费最多.故选①③.
三、解答题
6.为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:
分组(单位:岁) 频数 频率
[20,25) 5 0.05
[25,30) ① 0.20
[30,35) 35 ②
[35,40) 30 0.30
[40,45] 10 0.10
合计 100 1.00
(1)频率分布表中的①②位置应填什么数据?
(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.
[解析] (1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.
根据题意可得=0.20,
=y,解得x=20,y=0.35,
故①处应填20,②处应填0.35.
(2)由题中频率分布表知年龄在[25,30)岁的频率是0.20,组距是5,所以==0.04.
补全频率分布直方图如图.
这500名志愿者中年龄在[30,35)岁的人数约为0.35×500=175.
C 组·探索创新
某省有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的条形统计图.请结合统计图回答下列问题:
(1)该校对多少名学生进行了抽样调查?
(2)本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?
(3)若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形统计图,请你估计全校学生中最喜欢跳绳活动的人数约为多少?
[解析] (1)由图1知4+8+10+18+10=50(名).即该校对50名学生进行了抽样调查.
(2)本次调查中,最喜欢篮球活动的有18人,×100%=36%.
即最喜欢篮球活动的人数占被调查人数的36%.
(3)1-(30%+26%+24%)=20%,200÷20%=1 000(人),×1 000=160(人).
即估计全校学生中最喜欢跳绳活动的人数约为160人.第九章 9.2 9.2.2、9.2.3
A 组·素养自测
一、选择题
1.奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( C )
A.减少计算量 B.避免故障
C.剔除异常值 D.活跃赛场气氛
[解析] 因为在体操比赛的评分中使用的是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平.
2.以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( B )
A.90 B.90.5
C.91 D.91.5
[解析] 把成绩按从小到大的顺序排列为:56,70, 72, 78, 79, 80, 81, 83, 84, 86, 88, 90,91, 94, 98.
因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.
3.已知100个数据的第75百分位数是9.3,则下列说法正确的是( C )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
[解析] 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C.
4.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是( C )
环数 5 6 7 8 9 10
人数 1 2 7 6 3 1
A.7,7 B.8,7.5
C.7,7.5 D.8,6
[解析] 从表中数据可知7环有7人,人数最多,所以众数是7;
中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是=7.5.
5.下图是根据某班学生体育测试成绩画出的频率分布直方图,由直方图得到的中位数为( D )
A.65 B.72.5
C.73 D.
[解析] 由图可知,第一组的频率为:0.005×10=0.05,
前两组的频率为:0.05+0.04×10=0.45,
前三组的频率为:0.45+0.03×10=0.75,
所以中位数在[70,80)内,设中位数为x,
则0.45+(x-70)×0.03=0.5,解得x=,
故选D.
二、填空题
6.1,2,3,4,5,6,7,8,9,10的25%分位数为_3__,75%分位数为_8__,90%分位数为_9.5__.
[解析] 因为数据个数为10,且已经按照从小到大的顺序排列,又10×25%=2.5,10×75%=7.5,
10×90%=9,所以该组数据的25%分位数为x3=3,75%分位数为x8=8,90%分位数为==9.5.
7.一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,则x=_15__.
[解析] 由中位数的定义知=16,
∴x=15.
8.某学校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在某天内课外阅读所用时间的数据,结果用条形统计图表示如下,根据条形统计图估计该校全体学生这一天平均每人的课外阅读时间为_0.9__h.
[解析] 由条形统计图可得,这50名学生这一天平均每人的课外阅读时间为
=0.9(h),
因此估计该校全体学生这一天平均每人的课外阅读时间为0.9 h.
三、解答题
9.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
[解析] (1)甲群市民年龄的平均数为
=15(岁),中位数为15岁,众数为15岁,平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
10.某校为了解学生对食堂伙食的满意程度,组织学生给食堂打分(分数为整数,满分为100分),从中随机抽取一个容量为120的样本,发现所有数据均在[40,100]内.现将这些分数分成以下6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并画出了样本的频率分布直方图,部分图形如图所示.观察图形,回答下列问题:
(1)算出第三组[60,70)的频数,并补全频率分布直方图;
(2)请根据频率分布直方图,估计样本的众数和平均数.
[解析] (1)因为各组的频率之和等于1,所以分数在[60,70)内的频率为f=1-(0.005+0.015+0.030+0.025+0.010)×10=0.15.
所以第三组[60,70)的频数为120×0.15=18(人).
完整的频率分布直方图如图.
(2)因为众数的估计值是频率分布直方图中最高矩形的中点,从图中可看出众数的估计值为75分.
又根据频率分布直方图,样本的平均数的估计值为:
45×(10×0.005)+55×(10×0.015)+65×(10×0.015)+75×(10×0.03)+85×(10×0.025)+95×(10×0.01)=73.5.
所以,样本的众数为75分,平均数为73.5分.
B 组·素养提升
一、选择题
1.某校举行歌咏比赛,7位评委给各班演出的节目评分,去掉一个最高分,再去掉一个最低分后,所得平均数作为该班节目的实际得分.对于某班的演出,7位评委的评分分别为:9.65,9.70,9.68,9.75,9.72,9.63,9.78,则这个班节目的实际得分是( B )
A.9.66 B.9.70
C.9.65 D.9.67
[解析] =×(9.65+9.70+9.68+9.75+9.72)=9.70.
2.某校高二(10)班50名学生的身高(单位:cm)数据均在区间[150,180],其频率分布直方图(将频率视为概率)如图所示,则下列说法正确的是( D )
A.a=0.2
B.估计该班学生身高的中位数为160 cm
C.估计该班学生身高的平均值大于165 cm
D.估计该班学生身高不低于165 cm的概率为0.4
[解析] (0.02×3+2a+0.06)×5=1,解得a=0.04,故A错误;由频率分布直方图可得,前三个小矩形的面积之和为(0.02+0.04+0.06)×5=0.6>0.5,设该班学生身高的中位数为x cm,所以(0.02+0.04)×5+(x-160)×0.06=0.5,解得x≈163.3cm,故B错误;由频率分布直方图可得,身高的平均值=[0.02×(152.5+172.5+177.5)+0.04×(157.5+167.5)+0.06×162.5]×5=164 cm,故C错误;由频率分布直方图可得,该班学生身高不低于165 cm的频率为(0.04+0.02+0.02)×5=0.4,故该班学生身高不低于165 cm的概率为0.4,故D正确.故选D.
3.(多选题)某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列说法正确的有( AB )
A.乙同学体温的极差为0.2 ℃
B.乙同学体温的众数为36.4 ℃,中位数与平均数相等
C.甲同学的体温比乙同学的体温稳定
D.甲同学体温的第70百分位数为36.6 ℃
[解析] 乙同学体温的极差为36.5-36.3=0.2 ℃,故A正确;乙同学的体温从低到高依次为36.3 ℃,36.3 ℃,36.4 ℃,36.4 ℃,36.4 ℃,36.5 ℃,36.5 ℃,故众数为36.4℃,中位数为36.4 ℃,平均数为(36.3+36.3+36.4+36.4+36.4+36.5+36.5)=36.4 ℃,故B正确;从折线图上可以看出,乙同学的体温比甲同学的体温稳定,故C错误;甲同学的体温从低到高依次为36.2 ℃,36.2 ℃,36.4 ℃,36.4 ℃,36.5 ℃,36.5 ℃,36.6 ℃,由70%×7=4.9,可知数据的第70百分位数为第5项数据36.5 ℃,故D错误.
故选AB.
二、填空题
4.已知一组数据的平均数是x,众数是m,中位数是n,将每个数据加上3后得到一组新数据,则这组新数据的平均数为_x+3__,众数为_m+3__,中位数为_n+3__.
[解析] 根据平均数的计算公式可得平均数变为x+3.原众数为m,原中位数为n,每个数据加上3后,众数变为m+3,中位数变为n+3.
5.一组数据按从小到大的顺序排列如下:11,12,15,x,17,y,22,26,经计算,该组数据中位数是16,若75%分位数是20,则x+y=_33__.
[解析] 因为50%×8=4,故中位数是=16,解得x=15;
因为75%×8=6,故75%分位数是=20,则y=18;
所以x+y=33
故答案为33.
三、解答题
6.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:
(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
[解析] (1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65,又因为第一个小矩形的面积为0.3,设中位数为x,则0.3+(x-60)×0.040=0.5,解得x=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,所以平均成绩约为67分.
C 组·探索创新
某中学开展演讲比赛活动,高一(1)、高一(2)班根据初赛成绩各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩(满分为100分)如下图所示.
(1)根据上图填写下表:
平均分(分) 中位数(分) 众数(分)
高一(1)班 85 _85__ 85
高一(2)班 85 80 _100__
(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;
(3)如果在每班参加复赛的选手中分别选出2人参加决赛,你认为哪个班的实力更强一些?说明理由.
[解析] (2)∵两班的平均数相同,高一(1)班的中位数高,
∴高一(1)班的复赛成绩好些.
(3)∵高一(1)、高一(2)班前两名选手的平均分分别为92.5分,100分,∴在每班参加复赛的选手中分别选出2人参加决赛,高一(2)班的实力更强一些.第九章 9.2 9.2.4
A 组·素养自测
一、选择题
1.甲、乙两中学生在一年里学科平均分相等,但他们的方差不相等,正确评价他们的学习情况是( C )
A.因为他们的平均分相等,所以学一样
B.成绩虽然一样,方差较大,说明潜力大,学习态度踏实
C.表面上看这两个学生平均成绩一样,但方差小的学习成绩稳定
D.平均分相等,方差不等,说明学不一样,方差较小的同学,学习成绩不稳定,忽高忽低
[解析] 方差小说明成绩稳定,方差大说明成绩不稳定,忽高忽低.故选C.
2.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是( B )
A.平均数 B.标准差
C.众数 D.中位数
[解析] 由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.
3.已知某班40名学生某次考试的数学成绩依次为x1,x2,x3,…,x40,经计算全班数学平均成绩=90,且=324 400,则该班学生此次数学成绩的标准差为( D )
A.20 B.2
C.10 D.
[解析] 因为=90,且=324 400,
所以此次数学成绩的标准差为
s==
==
==,
故选D.
4.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数及其方差s2如表所示,则选送决赛的最佳人选应是( B )
项目 甲 乙 丙 丁
7 8 8 7
s2 6.3 6.3 7 8.7
A.甲 B.乙
C.丙 D.丁
[解析] 因为乙=丙>甲=丁,且s=s5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为甲,乙,标准差分别为s甲,s乙,则( C )
A.甲<乙,s甲s乙
C.甲>乙,s甲乙,s甲>s乙
[解析] 由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知甲>乙.图中数据显示甲同学的成绩比乙同学稳定,故s甲二、填空题
6.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4
则:(1)平均命中环数为_7__;
(2)命中环数的标准差为_2__.
[解析] (1)==7.
(2)∵s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,
∴s=2.
7.已知样本9,10,11,x,y的平均数是10,方差是4,则 xy=_91__.
[解析] 由题意得
即
解得或所以xy=91.
8.已知某省二、三、四线城市数量之比为1∶3∶6,2019年8月份调查得知该省二、三、四线所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.7万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市的房价的方差为_117.98__.
[解析] 设二线城市的房价的方差为s2,由题意可知20=[s2+(2.4-1.2)2]+[10+(1.8-1.2)2]+[8+(0.7-1.2)2],解得s2=117.98,
即二线城市的房价的方差为117.98.
三、解答题
9.甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中各抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
[解析] (1)甲=(99+100+98+100+100+103)=100,
乙=(99+100+102+99+100+100)=100.
s=[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
s=[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,
又s>s,所以乙机床加工零件的质量更稳定.
10.某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).
其中,a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.
若某组成功研发一种新产品,则给该组记1分,否则记0分.
试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平.
[解析] 甲组研发新产品的成绩分别为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,
其平均数甲==,
方差s=××10+=.
乙组研发新产品的成绩分别为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数乙==,
方差s=××9+=.
因为甲>乙,sB 组·素养提升
一、选择题
1.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级 人数 平均分数 方差
甲 20 甲 2
乙 30 乙 3
其中甲=乙,则两个班数学成绩的方差为( C )
A.3 B.2
C.2.6 D.2.5
[解析] 由题意可知两个班的数学成绩平均数为=甲=乙,则两个班数学成绩的方差为
s2=[2+(甲-)2]+[3+(乙-)2]
=×2+×3=2.6.
2.(多选题)给出下列说法,其中正确的是( ACD )
A.数据0,1,2,4的极差与中位数之积为6
B.已知一组数据x1,x2,…,xn的方差是5,则数据4x1-1,4x2-1,…,4xn-1的方差是20
C.已知一组数据x1,x2,…,xn的方差为0,则此组数据的众数唯一
D.已知一组不完全相同的数据x1,x2,…,xn的平均数为x0,在这组数据中加入一个数x0后得到一组新数据x0,x1,x2,…,xn,其平均数为,则=x0
[解析] 极差为4-0=4,中位数为=,所以极差与中位数之积为4×=6,A对;根据方差的性质可知,数据4x1-1,4x2-1,…,4xn-1的方差是42×5=80,B错;由方差s2==0,可得x1=x2=…=xn=,即此组数据众数唯一,C对;∵=x0,∴x1+x2+…+xn=nx0,∴==x0,D对.故选ACD.
3.设样本数据x1,x2,…,x10的平均数和方差分别为2和5,若yi=xi+a(a为非零实数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为( B )
A.2,5 B.2+a,5
C.2+a,5+a D.2,5+a
[解析] 由题意知x1,x2,…,x10的平均数=(x1+x2+…+x10)=2,
x1,x2,…,x10的方差s=[(x1-2)2+(x2-2)2+…+(x10-2)2]=5,
对于yi=xi+a,则有
y1,y2,…,y10的平均数=(x1+a+x2+a+…+x10+a)
=(x1+x2+…+x10+10a)
=2+a,
y1,y2,…,y10的方差s=[(y1-2-a)2+(y2-2-a)2+…+(y10-2-a)2]
=[(x1+a-2-a)2+(x2+a-2-a)2+…+(x10+a-2-a)2]
=[(x1-2)2+(x2-2)2+…+(x10-2)2]
=5.
二、填空题
4.某班共有40名学生,其中22名男生的身高平均数为173 cm,方差为28;18名女生的身高平均数为163 cm,方差为32;则该班级全体学生的身高方差为_54.55__.
[解析] 由题意,全体学生的身高均值为×(22×173+18×163)=168.5,
若xi(1≤i≤22,i∈N*)表示男生数据,xj(1≤j≤18,j∈N*)表示女生数据,
所以(xi-173)2=22×28,(xj-163)2=18×32,
则全体学生的身高方差为[(xi-168.5)2+(xj-168.5)2]
=[(xi-173+4.5)2+(xj-163-5.5)2]
=[(xi-173)2+22×4.52+(xj-163)2+18×5.52]
=(22×28+22×4.52+18×32+18×5.52)=54.55.
故答案为54.55.
5.近年来随着移动互联网的发展,在线点外卖成为城市居民重要的餐饮方式之一,送餐员的需求量越来越大,甲、乙两名送餐员某一周内每天完成的订单量如图所示,则下列结论中正确的是_①④__.(只填写序号)
①甲该周的订单总量比乙该周的订单总量大
②甲的方差比乙的方差大
③甲的标准差比乙的标准差大
④甲、乙两人在工作日一天送的外卖比周末一天送的多
[解析] 由已知,甲订单总量为55+62+58+60+57+61+53=406,乙的订单总量为43+54+74+60+52+58+44=385,①正确;
从折线图知甲的订单量都在60左右偏移,而乙的订单量相差太大,估计乙的方差大,标准差大,②③均错;
甲乙在周日一天送的量为55+43=98,在周六送的量为53+44=97,而在工作日送的量最少的是周四为57+52=109大于98,④正确.
故答案为①④.
三、解答题
6.一次数学知识竞赛中,两组学生的成绩如下:
分数 50 60 70 80 90 100
人数 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
经计算,两组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.
[解析] 从不同的角度分析如下:
①甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.
②s=×[2×(50 -80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2 + 14×(90-80)2+6×(100-80)2]=172.同理得s=256.因为s③甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.
④从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.
C 组·探索创新
某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登错了,甲实得80分,却记了50分,乙实得70分却记了100分,更正后平均分和方差分别是( B )
A.70,75 B.70,50
C.75,1.04 D.65,2.35
[解析] 因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2=[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前的方差为75=[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.第九章综合测试
考试时间120分钟,满分150分.
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( B )
A.134石 B.169石
C.338石 D.1 365石
[解析] 依题意,这批米内夹谷为×1 534≈169(石).
2.下列两个抽样:
①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.
则应采用的抽样方法依次为( C )
A.简单随机抽样;简单随机抽样
B.分层随机抽样;分层随机抽样
C.分层随机抽样;简单随机抽样
D.简单随机抽样;分层随机抽样
[解析] ①中商店的规模不同,所以应采用分层随机抽样;②中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.
3.某校高一年级15个班参加庆祝建党100周年的合唱比赛,得分如下:85、87、88、89、89、90、91、91、92、93、93、93、94、96、98,则这组数据的40%分位数、90%分位数分别为( A )
A.90.5、96 B.91.5、96
C.92.5、95 D.90、96
[解析] 将数据从小到大排列可得85、87、88、89、89、90、91、91、92、93、93、93、94、96、98,
由15×40%=6,则40%分位数为=90.5,
由15×90%=13.5,则90%分位数为96.
故选A.
4.根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在2 080 mg/100 mL(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2 000元以下罚款,据《法制晚报》报道,2021年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28 800人,如图是对这28 800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为( C )
A.2 160 B.2 880
C.4 320 D.8 640
[解析] 醉酒驾车人数的频率是(0.01+0.005)×10=0.15,故醉酒驾车人数为28 800×0.15=4 320(人).
5.关于用统计方法获取数据,分析数据,下列结论错误的是( C )
A.某食品加工企业为了解生产的产品是否合格,合理的调查方式为抽样调查
B.为了解高一学生的视力情况,现有高一男生480人,女生420人,按性别进行分层抽样,样本量按比例分配,若从女生中抽取的样本量为63,则样本容量为135
C.若甲、乙两组数据的标准差满足s甲D.若数据x1,x2,x3,…,xn的平均数为,则数据yi=axi-b的平均数为a-b
[解析] 了解生产的产品是否合格,合理的调查方式为抽样调查,故A正确;
根据分层抽样抽样比可知,样本容量为×=135,故B正确;
因为s甲因为数据x1,x2,x3,…,xn的平均数为,
所以=,
所以数据yi=axi-b的平均数为=
=-=a-b,故D正确.故选C.
6.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( C )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
[解析] 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A正确.
不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B正确.
平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C不正确.
4.5万到8.5万的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64,故D正确.
7.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样的方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件做使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为( A )
A.1 013 h B.1 014 h
C.1 016 h D.1 022 h
[解析] 解法一:由分层抽样的知识可知,从第一、二、三分厂抽取的电子产品数量分别为25件,50件,25件,则抽取的100件产品的使用寿命的平均值为×(980×25+1 020×50+1 032×25) =1 013(h).
解法二:因为第一、二、三分厂的产量之比为1∶2∶1,所以根据各层抽取的产品数量所占的比例计算抽取的100件产品的使用寿命的平均值为×(980+2×1 020+1 032)=1 013(h).
8.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( B )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
[解析] 讲座前中位数为>70%,所以A错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.故选B.
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多个选项是符合题目要求的,全部选对的得5分,选对但不全的得2分,有选错的得0分)
9.下列表述正确的是( ABC )
A.样本选取不恰当时,用样本估计总体不可靠
B.有的容量较小的样本的平均数和标准差与总体的平均数和标准差差距也不大
C.有的容量较大的样本的平均数和标准差与总体的平均数和标准差差距也不小
D.选取的样本容量越大,这种抽样调查的方式越科学
[解析] A,B,C显然正确;样本容量适当,既省时又省力,又具代表性,故D说法错误.
10.已知甲种杂交水稻近五年的产量(单位:吨/公顷)数据为:9.7,10.0,10.0,10.0,10.3,乙种杂交水稻近五年的产量(单位:吨/公顷)数据为:9.6,9.7,10.0,10.2,10.5,则( ACD )
A.甲种的样本平均数等于乙种的样本平均数
B.甲种的样本方差大于乙种的样本方差
C.甲种样本的70%分位数小于乙种样本的70%分位数
D.甲乙两种水稻近五年的总方差为0.072
[解析] 甲=(9.7+10.0+10.0+10.0+10.3)=10.0,乙=(9.6+9.7+10.0+10.2+10.5)=10.0=甲,故A正确;
因为甲、乙平均值都为10,所以S=,
S=
,
显然甲种的样本方差小于乙种的样本方差,故B错误;
70%×5=3.5,故甲种样本的70%分位数为10.0,
乙种样本的70%分位数为10.2,所以甲种样本的70%分位数小于乙种样本的70%分位数,故C正确;
甲、乙两种水稻近五年的总方差为0.072μ==10,
故甲、乙两种水稻近五年的总方差为S2=
=0.072,
故D正确.故选ACD.
11.(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( CD )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
[解析] A.=;==+c;
B.y中=x中+c;
C.S=(xi-)2;S′=(xi+c)-(+c)2]=S;
D.x的极差为xmax-xmin;y的极差为(xmax+c)-(xmin+c)=xmax-xmin.
故选CD.
12.为庆祝中国共青团成立100周年,校团委举办了“学团史,知团情”知识竞赛,甲、乙两个组各派7名同学参加竞赛,测试成绩(单位:分,十分制)如图所示,则下列描述正确的有( AC )
A.甲、乙两组成绩的极差相等
B.甲、乙两组成绩的平均数相等
C.甲、乙两组成绩的中位数相等
D.甲组成绩的方差大于乙组成绩的方差
[解析] 甲、乙两组成绩的极差都为4,故A正确;
甲组成绩的平均数为=,
乙组成绩的平均数为=,
∴甲组成绩的平均数小于乙组成绩的平均数,故B错误;
甲、乙两组成绩的中位数都为6,故C正确;
甲组成绩的方差为:
×=,
乙组成绩的方差为
×=,
∴甲组成绩的方差小于乙组成绩的方差,故D错误.
故选AC.
三、填空题(本大题共4小题,每小题5分,共20分)
13.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人):
篮球组 书画组 乐器组
高一 45 30 a
高二 15 10 20
学校要对这三个小组的活动效果进行抽样调查,按小组分层随机抽样,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为_30__.
[解析] 由题意知,=,
解得a=30.
14.3月12日是植树节,某地组织青年志愿者进行植树活动,植树的树种及其数量的折线图,如图所示.后期,该地区农业局根据树种采用分层抽样的方法抽取150棵树,请专业人士查看树种的成活情况,则被抽取的梧桐树的棵数为_10__.
[解析] 由分层抽样法,被抽取的梧桐树的棵数为:150×=10.
故答案为10.
15.给出下列关于“用样本估计总体”中的四个结论:
①中位数对极端值不敏感;
②若改变一组数据中的一个数,则这组数据的平均数、中位数、众数都会发生变化;
③标准差的大小不会超过极差;
④方差越小,说明这组数据越集中.
其中,正确的结论是_①③④__.(用序号表示,把你认为正确的结论的序号都填上)
[解析] 中位数是将数据从小到大排列后,最中间的1个数或2个数的平均数,所以中位数对极端值不敏感,①正确;
改变一组数据中的一个数,中位数和众数可能不发生变化,②错误;
设样本为x1,x2,…,xn,样本均值为,样本中的最大值和最小值分别为xmax,xmin,
则标准差s=
≤=xmax-xmin,③正确;
方差反映数据的离散程度,方差越小,说明这组数据越集中,④正确.
故答案为①③④.
16.为调查高一年级学生期中考试数学成绩的情况,从(1)班抽取了12名学生的成绩(单位:分),他们的平均分为91,方差为3,从(2)班抽取了8名学生的成绩,他们的平均分为89,方差为5,则这20名学生成绩的平均数为_90.2__,方差为_4.76__.
[解析] 这20名学生成绩的平均数为=90.2,
方差为=4.76.
四、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)南京市某报社发起了建党100周年主题征文活动,报社收到了来自社会各界的大量文章,打算从众多文章中选取60篇文章以专栏形式在报纸上发表,其参赛作者年龄集中在[15,65]之间,根据统计结果,作出频率分布直方图如图:
(1)求频率分布直方图中m的值;
(2)为了展示不同年龄作者心中的党的形象,报社按照分层抽样的方法,从这60篇文章中抽出20篇文章,并邀请相应作者参加座谈会.求从年龄在[15,35)的作者中选出参加座谈会的人数;
(3)根据频率分布直方图,求这60位作者年龄的样本平均数(同一组数据用该区间的中点值作代表)和80百分位数(结果保留一位小数).
[解析] (1)∵10×(0.01+0.015+m+0.03+0.01)=1,∴m=0.035.
(2)应从[15,35)选出参加座谈会的人数为:20×(0.01+0.015)×10=5人.
(3)由题意得:=(20×0.01+30×0.015+40×0.035+50×0.03+60×0.01)×10=41.5;
假设第80百分位数为t,则(0.01+0.015+0.035)×10+(t-45)×0.03=0.8,
解得:t≈51.7,即第80百分位数为51.7.
18.(本小题满分12分)某农场在两块面积相同的水稻试验田中分别种植甲、乙两种水稻,已知连续6季的产量如下:
品种 第1季 第2季 第3季 第4季 第5季 第6季
甲/kg 550 580 570 570 550 600
乙/kg 540 590 560 580 590 560
现在该农场决定选择其中一种水稻进行推广种植,若你是农场经营者,你会如何选择?请使用统计学的有关知识进行说明.
[解析] 设甲种水稻产量的平均值和方差分别为1,s,
乙种水稻产量的平均值和方差分别为2,s,由题中数据可得,
1=×(550+580+570+570+550+600)=570,
2=×(540+590+560+580+590+560)=570,
s=[(550-570)2+(580-570)2+(570-570)2+(570-570)2+(550-570)2+(600-570)2]=300,
s=[(540-570)2+(590-570)2+(560-570)2+(580-570)2+(590-570)2+(560-570)2]=,
因为1=2,s但甲种水稻的产量较稳定,所以应推广甲种水稻种植.
19.(本小题满分12分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/米3收费.超出w立方米的部分按10元/米3收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下图所示的频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/米3,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
[解析] (1)由用水量的频率分布直方图知,
该市居民该月用水量在区间[0.5,1),[1,1.5),[1.5,2),[2,2.5)[2.5,3)内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量少于3立方米的居民占85%,用水量少于2立方米的居民占45%.
依题意,w至少定为3.
(2) 由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号 1 2 3 4 5 6 7 8
分组 [2,4) [4,6) [6,8) [8,10) [10,12) [12,17) [17,22) [22,27]
频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05
根据题意,该市居民该月的人均水费估计为:
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
20.(本小题满分12分)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,得到体育成绩的折线图如图所示.
(1)若体育成绩大于或等于70分的学生为“体育良生”,已知该校高一年级有1 000名学生,试估计该校高一年级学生“体育良生”的人数;
(2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分;
(3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],当三人的体育成绩方差s2最小时,写出a,b,c的所有可能取值(不要求证明).
[解析] (1)由折线图得体育成绩大于或等于70分的学生有14+3+13=30(人),∴估计该校高一年级学生“体育良生”的人数为1 000×=750.
(2)用样本估计总体的思想,估计该校高一年级学生达标测试的平均分为=(45×2+55×6+65×2+75×14+85×3+95×13)=77.25(分).
(3)∵甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,
∴当三人的体育成绩方差s2最小时,a,b,c的所有可能取值为79,84,90或79,85,90.
21.(本小题满分12分)某地统计局就该地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500).
(1)求居民月收入在[3 000,3 500)的频率;
(2)根据频率分布直方图算出样本数据的中位数;
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?
[解析] (1)月收入在[3 000,3 500)的频率为:
0.000 3×(3 500-3 000)=0.15
∴居民月收入在[3 000,3 500)的频率为0.15.
(2)0.000 2×(1 500-1 000)=0.1,
0.000 4×(2 000-1 500)=0.2,
0.000 5×(2 500-2 000)=0.25,
0.1+0.2+0.25=0.55>0.5,
∴样本数据的中位数为2 000+=2 000+400=2 400
∴样本数据的中位数为2 400元.
(3)居民月收入在[2 500,3 000)的频率为:
0.000 5×(3 000-2 500)=0.25,
∴10 000人中月收入在[2 500,3 000)的人数为:
0.25×10 000=2 500,
再从10 000人中分层抽样方法抽出100人,
则月收入在[2 500,3 000)的这段应抽取:
100×=25,
∴月收入在[2 500,3 000)的这段应抽25人.
22.(本小题满分12分)在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从A,B两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,为此将900名考生选做题的成绩按照随机顺序依次编号为001~900.
(1)若采用随机数法抽样,已知用计算机产生的若干0~9范围内的随机数如下,以第3个数5为起点.从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端,写出样本编号的中位数;
0 6 5 1 2 9 1 6 9 3 5 8 0 5 7 7 0
9 5 1 5 1 2 6 8 7 8 5 8 5 5 4 8 7
6 6 4 7 5 4 7 3 3 2 0 8 1 1 1 2 4
4 9 5 9 2 6 3 1 6 2 9 5 6 2 4 2 9
4 8 2 6 9 9 6 1 6 5 5 3 5 8 3 7 7
8 8 0 7 0 4 2 1 0 5 0 6 7 4 2 3 2
1 7 5 5 8 5 7 4 9 4 4 4 6 7 1 6 9
4 1 4 6 5 5 2 6 8 7 5 8 7 5 9 3 6
2 2 4 1 2 6 7 8 6 3 0 6 5 5 1 3 0
8 2 7 0 1 5 0 1 5 2 9 3 9 3 9 4 3
(2)若采用分层随机抽样,按照学生选择A题目或B题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4;样本中B题目的成绩有2个,平均数为8,方差为1.用样本估计900名考生选做题得分的平均数与方差.
[解析] (1)根据题意,读出的编号依次是:512,916(超界),935(超界),805,770,951(超界),512(重复),687,858,554,876,647,547,332.
将有效的编号从小到大排列,得
332,512,547,554,647,687,770,805,858,876,
所以中位数为×(647+687)=667.
(2)记样本中8个A题目的成绩分别为x1,x2,…,x8,2个B题目的成绩分别为y1,y2.
由题意可知i=8×7=56,(xi-7)2=8×4=32,
i=16,(yi-8)2=2×1=2,
故样本平均数为=×=×(56+16)=7.2;
样本方差为
s2=×[(xi-7.2)2+(yi-7.2)2]
=×{(xi-7)-0.2]2+(yi-8)+0.8]2}
=×[(xi-7)2-0.4(xi-7)+8×0.22+
(yi-8)2+1.6(yi-8)+2×0.82]
=(32-0+0.32+2+0+1.28)
=3.56.
所以估计该校900名考生该选做题得分的平均数为7.2,方差为3.56.