第3章 数据分析初步 习题课件(9份打包)2025-2026学年数学浙教版八年级下册

文档属性

名称 第3章 数据分析初步 习题课件(9份打包)2025-2026学年数学浙教版八年级下册
格式 zip
文件大小 4.5MB
资源类型 教案
版本资源 浙教版
科目 数学
更新时间 2026-03-17 00:00:00

文档简介

(共13张PPT)
第3章 数据分析初步
小专题(六) 数据分析在生活决策中的应用
类型一 平均数、中位数、众数在决策中的应用
1. 某鞋厂为了解中学生的鞋号情况,对某中学八年级一班的20名男生所穿鞋号进行了统计,结果如下表:
鞋号/cm 23.5 24 24.5 25 25.5 26
人 数 3 4 4 7 1 1
这20名男生鞋号数据的平均数是  24.55 ,中位数是  24.5 ,在平均数、中位数和众数中,鞋厂最感兴趣的是  众数 .
24.55 
24.5 
众数 
1
2
3
4
5
6
2. (新情境·热点信息)(2025·台州临海段考)随着AI技术发展,机器人正逐步应用于更多领域.现有A,B两款机器人,网友对其评分如下:
网友对A,B两款机器人评分数据统计表
款 式 外观/分 性能/分 售后/分
A款 90 95 92
B款 95 90 94
7位网友对A款机器人的综合评分(单位:分)如下:93,94,92,93,93,96,94.
1
2
3
4
5
6
(1) 求7位网友对A款机器人综合评分的众数;
解:(1) 在7个数据中,93出现的次数最多,所以7位网友对A款机器人综合评分的众数为93分
(2) 若将机器人的外观、性能、售后三项评分按2∶4∶4的比例统计,请通过计算比较A,B两款机器人的平均分.
解:(2) A款机器人的平均分为
=92.8(分),B款机器人的平均分为 =92.6(分),因为92.8>92.6,所以A款机器人的平均分高于B款机器人的平均分
1
2
3
4
5
6
3. 某校八年级一班有40名学生,他们2023年纸质书的阅读情况如图所示.
(1) 求这40名学生纸质书阅读量的平均数、中位数和众数;
解:(1) 根据题意,得这40名学生纸质书阅读量的平均数为(14×5+7×6+12×7+3×8+4×10)÷40=6.5(本),中位数为 =6(本),众数是5本
1
2
3
4
5
6
(2) 该班拟进行“个人阅读达标奖”评比,为了提高学生的阅读积极性且使超过50%的学生能达标,如果你是决策者,从平均数、中位数和众数的角度进行分析,你将如何确定这个“标准”
解:(2) 当“标准”为平均数6.5本时,达到标准的有19名学生,未超过50%;当“标准”为中位数6本时,达到标准的有26名学生,超过50%,有利于提高学生的阅读积极性;当“标准”为众数5本时,40名学生都达到标准,但不利于提高学生的阅读积极性.综上所述,应选择中位数6本作为“标准”
1
2
3
4
5
6
类型二 方差在决策中的应用
4. 为备战温州市第十八届运动会,某区(县)对甲、乙、丙、丁四名射击运动员进行射击测试,他们射击测试成绩的平均数 (单位:环)及方差S2(单位:环)如表所示:
甲 乙 丙 丁
9.6 8.9 9.6 9.6
S2 1.4 0.2 0.2 0.8
根据表中数据,要从中选择一名成绩好且发挥稳定的运动员参加比赛,应选择  丙 (填“甲”“乙”“丙”或“丁”).
丙 
1
2
3
4
5
6
5. 现有A,B两家农副产品加工厂到某快餐公司推销鸡腿,两家加工厂鸡腿的价格相同,品质相近.该公司决定通过检查质量来确定选购哪家加工厂的鸡腿.检查人员先分别从两家加工厂抽取100个鸡腿,然后从中随机各抽取10个,记录它们的质量(单位:g)如下表:
A加工厂 74 75 75 75 73 77 78 72 76 75
B加工厂 78 74 78 73 74 75 74 74 75 75
1
2
3
4
5
6
(1) 求A加工厂的10个鸡腿质量的中位数、众数、平均数;
解:(1) A加工厂的10个鸡腿质量的中位数是 =75(g),众数是75g,平均数是 ×(74+75+75+75+73+77+78+72+76+75)=75(g)
(2) 估计B加工厂这100个鸡腿中质量为75g的个数;
解:(2) 由题意,得100× =30(个).所以估计B加工厂这100个鸡腿中质量为75g的鸡腿有30个
1
2
3
4
5
6
(3) 根据鸡腿质量的稳定性,该快餐公司应选购哪家加工厂的鸡腿
解:(3) A加工厂的10个鸡腿质量的方差是 ×[(74-75)2+4×(75-75)2+(73-75)2+(77-75)2+(78-75)2+(72-75)2+(76-75)2]=2.8(g2);B加工厂的10个鸡腿质量的平均数是 ×(78+74+78+73+74+75+74+74+75+75)=75(g),方差是 ×[2×(78-75)2+4×(74-75)2+(73-75)2+3×(75-75)2]=2.6(g2).因为A,B两家加工厂鸡腿质量的平均数相同,B加工厂鸡腿质量的方差比A加工厂的小,即B加工厂的鸡腿质量更稳定,所以该快餐公司应选购B加工厂的鸡腿
1
2
3
4
5
6
类型三 四分位数与箱线图在决策中的应用
6. 甲、乙两组的测试成绩(单位:分)如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1) 求甲组的成绩数据的四分位数;
解:(1) 将甲组的成绩数据从小到大排列为 60,70,70,80,89,91,92,96,98,100,所以m25=70,m50= =90,m75=96
1
2
3
4
5
6
第6题答案
(2) 根据四分位数可绘制如图所示的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图;
解:(2) 如图所示
1
2
3
4
5
6
(3) 根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
解:(3) 根据箱线图和四分位数,可知甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组的波动大(合理即可)
1
2
3
4
5
6(共29张PPT)
第3章 数据分析初步
第3章总结提升
01
体系构建
02
考点突破
03
素养提升


考点一 平均数
1. (2025·乐山)某学校食堂有7元、8元和9元三种价格的午餐供师生选择(每人限定一份),5月销售情况如图所示,则师生购买午餐的平均价格为( A )
A. 7.8元 B. 7.9元
C. 8元 D. 8.1元
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
2. “稻鱼共生”的种养方式因稻鱼双收、互惠共生而受到农户青睐.现有一农户在5块面积相等的稻田里养殖田鱼,产量如下(单位:kg):12,13,15,17,18,则这5块稻田的田鱼平均产量是  15 kg.
3. 某学校八年级有三个班,各班级人数及期末考试的平均成绩如下表:
班 级 人 数 平均成绩/分
A 48 88
B 50 85
C 52 78
则该校八年级学生的平均成绩约为  83.5分 (精确到0.1分).
15 
83.5分 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
考点二 中位数与众数
4. (2025·镇江)有一组数据:82,80,82,87,90,84,85,它们的中位数是( B )
A. 82 B. 84 C. 85 D. 87
5. (新考向·传统文化)(2025·舟山定海二模)“五铢钱”是我国古代的一种铜制货币.某古币爱好者收藏了7枚“五铢钱”,测得它们的质量(单位:g)分别为3.5,3.4,3.5,3.4,3.3,3.3,3.5.这组数据的中位数和众数分别为( B )
A. 3.3,3.5 B. 3.4,3.5
C. 3.4,3.4 D. 3.5,3.4
B
B
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
6. (2024·南充)若一组数据6,6,m,7,7,8的众数为7,则这组数据的中位数为  7 .
7. (2024·温州模拟)某公司销售部有营销人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下表:
7 
每人销售件数 1400 880 270 150 130 120
人 数 1 1 3 6 3 1
(1) 求这15名营销人员该月销售量的平均数、中位数和众数.
解:(1) = ×(1400×1+880×1+270×3+150×6+130×3+120×1)=300(件).因为最中间的数据为150,所以中位数为150件.因为150是这组数据中出现次数最多的数据,所以众数为150件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(2) 为督促且不影响员工的积极性,假设销售负责人把每名营销人员的月销售定额定为300件,你认为是否合理?若不合理,请你制定一个较合理的月销售定额.
解:(2) 不合理 月销售定额定为150件较合理,因为150件既是中位数,又是众数,是大部分营销人员能达到的定额,能督促且不影响员工的积极性(合理即可)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
考点三 离差平方和与方差
8. (2024·嘉兴桐乡一模)甲、乙两人在相同的条件下各射击10次,甲射击成绩的平均数是7环,方差是2.3环2;乙射击成绩的平均数是7环,方差是5.6环2,则下列说法正确的是( A )
A. 甲的成绩比乙的成绩稳定
B. 再各射击一次,肯定是甲的成绩好
C. 甲、乙两人的总环数不相同
D. 甲、乙两人的成绩的众数相同
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
9. (2024·杭州西湖一模)杭州市某年3月某周7天日最高气温统计表如下:
星 期 一 二 三 四 五 六 日
最高 气温/℃ 18 20 18 14 18 23 15
下列说法正确的是( B )
A. 这组数据的平均数为17,众数为18
B. 这组数据的中位数为18,众数为18
C. 这组数据的平均数为18,中位数为14
D. 这组数据的中位数为14,方差为7
B
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
10. (新考向·传统文化)(2025·青岛)为弘扬传统文化、培养学生的劳动意识,某校在端午节期间举行了包粽子活动,每个粽子的标准质量为100g.甲、乙两名同学各包了5个粽子,每个粽子的质量(单位:g)如下:甲:103,99,100,101,97;乙:99,103,105,95,98.甲、乙两名同学包的粽子的质量比较稳定的是  甲 (填“甲”或“乙”).
11. 一组数据-1,0,2,x,3的平均数为2,则这组数据的标准差是    ,离差平方和是  30 .
甲 
 
30 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
12. 王伯伯承包了甲、乙两座荒山,各栽100棵杨梅树,成活率为98%.现已挂果,经济效益初步显现,为了分析收成情况,他分别从两山上随机各采摘了4棵杨梅树上的杨梅,每棵杨梅树的产量如图所示.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(1) 分别计算甲、乙两山上样本的平均数,并估算出甲、乙两山上杨梅的产量总和;
解:(1) = ×(50+36+40+34)=40(千克), = ×(36+40+48+36)=40(千克).估计产量总和为40×100×98%×2=7840(千克)
(2) 试通过计算说明哪座山上的杨梅产量较稳定.
解:(2) = ×[(50-40)2+(36-40)2+(40-40)2+(34-40)2]=38(千克2), = ×[(36-40)2+(40-40)2+(48-40)2+(36-40)2]=24(千克2).因为38>24,所以乙山上的杨梅产量较稳定
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
考点四 四分位数与箱线图
13. 甲、乙两人各自记录了八次自己从家到学校所用的时间(单位:min)如下:甲:15,12,15,13,16,14,13,14;乙:16,20,12,22,13,25,13,19.利用四分位数和箱线图比较,从家到学校所用时间较稳定的是  甲 (填“甲”或“乙”).
甲 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
14. (2025·无锡)有一组数据:13,14,14,16,18,这组数据的平均数和众数分别是( A )
A. 15,14 B. 14,15
C. 14,14 D. 15,15
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
15. 某校合唱团有90名成员,他们的年龄分布统计如下表:
年龄/岁 13 14 15 16 17
人 数 17 29 x 26-x 18
下列关于年龄的统计量不会发生改变的是( C )
A. 平均数、中位数
B. 平均数、离差平方和
C. 众数、中位数
D. 众数、方差
C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
16. 移动支付已成为人们的主要支付方式之一.某企业为了解员工某月A,B两种移动支付方式的使用情况,从企业2000名员工中随机抽取了200名,发现样本中A,B两种支付方式都不使用的有10人,仅使用A种支付方式和仅使用B种支付方式的员工支付金额a(单位:元)的分布情况如下表:
支付金额a/元 仅使用A 仅使用B
0<a≤1000 36人 20人
1000<a≤2000 18人 28人
a>2000 6人 2人
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
给出下列四个推断:① 根据样本数据,估计企业2000名员工中,同时使用A,B两种支付方式的有800人;② 本次调查抽取的样本容量为200人;③ 样本中仅使用A种支付方式的员工,该月支付金额的中位数一定不超过1000元;④ 样本中仅使用B种支付方式的员工,该月支付金额的众数一定为1500元.其中,正确的是( A )
A. ①③ B. ③④
C. ①② D. ②④
A
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
17. 某街道有两所初中,这两所初中的八年级学生的平均身高分别为162cm,166cm.若这两所初中八年级学生人数之比为2∶5,则这两所初中八年级所有学生的平均身高约为  164.9 cm(精确到0.1cm).
18. 某电脑公司销售部为了制定下个月的销售计划,对20名销售人员本月的销售量进行了统计,并绘制成如图所示的统计图,则这20名销售人员本月销售量的平均数、中位数、众数分别是  18.4台 、  20台 、  20台 .
164.9 
18.4台 
20台 
20台 
第18题
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
19. 小强每天坚持做引体向上,他记录了某一周每天做引体向上的个数如下表:
星 期 日 一 二 三 四 五 六
个 数 11 12       13 12
其中有三天的个数被墨汁覆盖了,但小强已经计算出这组数据的唯一众数是13,平均数是12,则这组数据的上四分位数是  13 ,方差是    .
13 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
20. (2025·浙江模拟)6月5日是世界环境日,某校组织了一次环保知识竞赛,每班选25名同学参加比赛,成绩分为A,B,C,D四个等级,其中相应等级的得分依次记为10分、9分、8分、7分,学校将甲班和乙班的成绩整理并绘制成统计图(如图).根据提供的信息解答下列问题:
班 级 平均分/分 中位数/分 众数/分 方差/分2
甲班 8.76 a 9 1.06
乙班 8.76 8 b 1.38
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(1) 把甲班竞赛成绩统计图补充完整;
解:(1) 甲班C等级的人数为25-6-12-5=2,补全条形统计图如图所示 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(2) 写出表中a,b的值;
解:(2) 将甲班25名同学的成绩从小到大进行排序,排在第13个的在B等级中,因此a=9;乙班25名同学的成绩在A等级的人数最多,因此b=10 
(3) 依据数据分析表,有同学认为甲班的成绩好,也有同学认为乙班的成绩好,请写出一条支持甲班成绩更好的理由.
解:(3) 理由:根据表格中的数据可知,甲班25名同学的成绩的中位数比乙班25名同学的成绩的中位数大,且甲班25名同学的成绩的方差比乙班25名同学的成绩的方差要小,说明甲班25名同学的成绩较稳定,因此甲班成绩更好(合理即可).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
21. 甲、乙两支篮球队进行了五场比赛,将比赛成绩进行统计后,绘制成如图①所示的条形统计图.
(1) 在图②中画出折线(实线)表示乙队在五场比赛中成绩的变化情况;
解:(1) 如图②所示 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(2) 甲队五场比赛成绩的平均数 =90分,请计算乙队五场比赛成绩的平均数 ;
解:(2) = ×(110+90+83+87+80)=90(分)
(3) 观察统计图可看出  甲队 的成绩比较稳定(填“甲队”或“乙队”),并分别计算两队成绩的方差来验证你的判断;
解:(3) 由(2),知 =90分, =90分,所以 = ×[(80-90)2+(86-90)2+(95-90)2+(91-90)2+(98-90)2]=41.2(分2), = ×[(110-90)2+(90-90)2+(83-90)2+(87-90)2+(80-90)2]=111.6(分2).因为41.2<111.6,所以 < ,即甲队的成绩比较稳定 
甲队 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(4) 请按照“组内离差平方和达到最小”的方法,将甲队五场比赛成绩的数据分成两组;
解:(4) 将甲队成绩的数据按照从小到大的顺序排列为80,86,91,95,98,将这些数据分成两组,有下列4种情况,分别计算各种情况的组内离差平方和(精确到0.1),如下表:
可以发现,将数据分成{80,86},{91,95,98}两组时,组内离差平方和达到最小 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
组 序 分组情况 组内离差
平方和
第1组 第2组 1 80 86,91,95,98 81
2 80,86 91,95,98 42.7
3 80,86,91 95,98 65.2
4 80,86,91,95 98 126
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
(5) 如果从甲、乙两队中选派一支球队参加篮球锦标赛,根据上述统计情况,试从平均数、折线的走势、获胜场数和方差四个方面分别进行简要分析,你认为选派哪支球队参赛能取得更好的成绩?
解:(5) 从平均数方面分析,两队成绩的平均数相同,实力大体相当;从折线的走势方面分析,甲队成绩整体呈上升趋势,而乙队成绩整体呈下降趋势;从获胜场数方面分析,甲队胜三场,乙队胜两场,甲队成绩较好;从方差方面分析,甲队的成绩比乙队的成绩波动小,甲队的成绩较稳定.综上所述,选派甲队参赛能取得更好的成绩
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21(共11张PPT)
第3章 数据分析初步
3.4 四分位数与箱线图
第1课时 四分位数
01
基础过关
02
能力进阶
03
思维拓展


一般地,一组数据中至少有50%的数小于或等于中位数,也至少有50%的数大于或等于中位数.中位数也叫作第50百分位数,记为m50.进一步地,将一组数据按从小到大排列,中位数把这组数据分成左右两部分,用m25,m75分别表示第25百分位数和第75百分位数.在一组从小到大排列的数据中,m25,m50,m75这三个数值把所有数据分为个数相等的四个部分,这三个数叫作  四分位数 ,其中第25百分位数也称为  下四分位数 ,第75百分位数也称为  上四分位数 .
四分位数 
下四分位数 
上四分位数 
1. 现有一组数据:106,113,96,98,100,102,104,112,则上四分位数是( D )
A. 113 B. 112 C. 106 D. 109
2. 经调查,八年级一班7名同学每周阅读时间(单位:min)分别为78,80,85,90,79,82,83,则这组数据的下四分位数为( D )
A. 80 B. 82 C. 85 D. 79
3. 某班5名同学参加演讲比赛,他们的成绩(单位:分)分别是8,6,8,7,9,这组数据的上四分位数为  8.5 .
D
D
8.5 
1
2
3
4
5
6
7
8
9
10
11
12
解:将这些数据按照从小到大的顺序排列为-5,-2,-2,-1,-1,-1,2,2,2,2,3,3,3,5,5,5,所以第12个和第13个数分别是3,3,所以m75=3
4. 有下列一组数据:5,3,2,2,2,2,3,3,5,5,-2,-2,-5,-1,-1,-1,求这组数据的上四分位数.
5. 某市10月1日~16日每日的最高气温(单位:℃)依次如下:26,27,28,26,27,29,30,25,26,28,27,24,23,25,28,27.求这组数据的四分位数m25,m50,m75.
解:把这16个数据由小到大排序为23,24,25,25,26,26,26,27,27,27,27,28,28,28,29,30.m50= =27.因为前一半数据为23,24,25,25,26,26,26,27,所以m25= =25.5.因为后一半数据为27,27,27,28,28,28,29,30,所以m75= =28
1
2
3
4
5
6
7
8
9
10
11
12
6. (新情境·科技民生)续航能力关乎无人机的“生命力”,太阳能供能是实现无人机长时间续航的重要路径之一.某大学科研团队利用自主研发的新型静电电机,成功研制出仅重4.21克的太阳能动力微型无人机,实现纯自然光供能下的持续飞行.为激发同学们对无人机的兴趣,某校无人机兴趣社团在校内进行选拔赛,8名参赛学生的成绩(单位:分)依次为65,95,75,70,95,85,92,80,则这组数据的上四分位数为( D )
A. 93 B. 92
C. 91.5 D. 93.5
D
1
2
3
4
5
6
7
8
9
10
11
12
7. 某地有8个快递收件点,在某天接收到的快递件数分别为360,284,290,300,188,240,260,288,则这组数据的上四分位数和下四分位数分别为( B )
A. 250,290 B. 295,250
C. 240,300 D. 240,295
8. 某考生参加某高校的综合评价招生并成功通过了初试,在面试阶段中,8位老师根据考生表现给出分数(单位:分),分数由低到高依次为76,a,b,80,80,81,84,85.若这组数据的下四分位数为77,则该名考生这次面试的平均得分为( B )
A. 79分 B. 80分 C. 81分 D. 82分
B
B
1
2
3
4
5
6
7
8
9
10
11
12
9. (教材变式)调查某少年足球队全体队员的年龄,得到数据结果如下表:
年龄/岁 11 12 13 14 15
人 数 3 4 7 2 2
则该足球队队员年龄的上四分位数为  13岁 .
10. 已知一组数据按从小到大排列如下:11,12,15,x,17,y,22,26.若该组数据的中位数是16,第75百分位数是20,则x=  15 ,y=  18 .
13岁 
15 
18 
1
2
3
4
5
6
7
8
9
10
11
12
解:将跑步前脉搏(单位:次/分)由小到大排序为65,70,72,75,76,77,78,78,80,83,85,90,m25= =73.5(次/分),m50= =77.5(次/分),m75= =81.5(次/分);将跑步后脉搏(单位:次/分)由小到大排序为146,149,149,150,151,152,153,153,154,154,156,161,m25= =149.5(次/分),m50= =152.5(次/分),m75= =154(次/分)
11. 体育老师随机选择了12名学生,分别测量了他们完成800米跑步前、后1分钟脉搏,结果如下表(单位:次/分):
65 85 78 77 78 90 76 75 80 83 72 70
146 161 149 154 154 156 149 152 151 150 153 153
请求出跑步前、后脉搏的四分位数.
1
2
3
4
5
6
7
8
9
10
11
12
12. (教材变式)某校举办校园歌手大赛,决赛中12名参赛选手的成绩(单位:分,满分:10分)分别为9.5,8.1,7.8,8.5,8.8,9.1,7.5,9.6,8.6,8.8,9.3,9.0.
(1) 求这组数据的四分位数m25,m50,m75;
解:(1) 将这12个数据由小到大排序为7.5,7.8,8.1,8.5,8.6,8.8,8.8,9.0,9.1,9.3,9.5,9.6,m50= =8.8;前一半数据的中位数为整组数据的下四分位数,故m25= =8.3;后一半数据的中位数为整组数据的上四分位数,故m75= =9.2
1
2
3
4
5
6
7
8
9
10
11
12
(2) 根据所得的四分位数,分析该校校园歌手大赛决赛的成绩情况;
解:(2) 该校参加校园歌手大赛决赛的选手中,至少有25%,即四分之一选手的成绩小于或等于m25,在8.3分及以下;至少有50%,即一半选手的成绩小于或等于m50,在8.8分及以下;至少有25%,即四分之一选手的成绩大于或等于m75,在9.2分及以上(合理即可)
(3) 如果该校参加校园歌手大赛决赛的某名选手的成绩为8.5分,那么他的成绩处于什么位置
解:(3) 因为m25<8.51
2
3
4
5
6
7
8
9
10
11
12(共15张PPT)
第3章 数据分析初步
3.3 离差平方和与方差
第1课时 离差平方和与方差
01
基础过关
02
能力进阶
03
思维拓展


1. 样本中,各数据与平均数的差(又称离差)的平方和称为  离差平方和 ,记为D2.对于一组数据x1,x2,…,xn,这组数据的平均数为 ,则D2=  (x1- )2+(x2- )2+…+(xn- )2 .
2. 一般地,一组数据的各离差的平方的平均数叫作这组数据的方差,记为S2.S2=   [(x1- )2+(x2- 
  )2+…+(xn- )2] .方差越大,说明数据的波动越  大 ,越  不稳定 .
离差平方和 
(x1- )2+(x2-
)2+…+(xn- )2 
[(x1- )2+(x2-
)2+…+(xn- )2] 
大 
不稳定 
3. 一组数据的方差的算术平方根称为这组数据的  标准差 .
标准差 
1. (2025·台州椒江模拟)甲、乙、丙、丁四支女子花样游泳队的人数相同,且平均身高相同,身高的方差分别是 =0.3cm2, =0.1cm2, =0.2cm2, =0.15cm2.身高最整齐的花样游泳队是( B )
A. 甲队 B. 乙队
C. 丙队 D. 丁队
B
1
2
3
4
5
6
7
8
9
10
11
12
2. 甲、乙、丙、丁四名射击运动员进行射击测试,每人10次射击成绩的平均数 (单位:环)及方差S2(单位:环2)如下表:
甲 乙 丙 丁
9 8 9 9
S2 1.2 0.4 1.8 0.4
根据表中数据,要从中选择一名成绩好且发挥稳定的运动员参加比赛,应选择( D )
A. 甲 B. 乙 C. 丙 D. 丁
D
1
2
3
4
5
6
7
8
9
10
11
12
3. (2025·杭州西湖三模)对于一组统计数据6,7,6,5,6.下列说法错误的是( D )
A. 平均数是6 B. 中位数是6
C. 众数是6 D. 方差是6
4. (教材变式)八年级一班甲小组的5名学生进行飞镖训练,某次训练的成绩(单位:环)分别为4,3,5,7,6.甲小组成绩的离差平方和是  10 环2,标准差是    环.
5. (教材变式)(2024·兰州)甲、乙两人在相同条件下各射击10次.两人的成绩(单位:环)如图所示.现有下列三个推断:① 甲的成绩更稳定;② 乙的平均成绩更高;③ 每人再射击一次,乙的成绩一定比甲高.其中,正确的是  ①② (填序号).
D
10 
 
①② 
1
2
3
4
5
6
7
8
9
10
11
12
6. 甲、乙两支篮球队的五名主力球员的身高如下表:
甲队主力球员身高/cm 194 203 187 192 189
乙队主力球员身高/cm 196 190 207 185 192
哪队的主力球员的平均身高较高 哪队的主力球员的身高较为整齐
1
2
3
4
5
6
7
8
9
10
11
12
解: = ×(194+203+187+192+189)=193(cm), = ×(196+190+207+185+192)=194(cm), = ×[(194-193)2+(203-193)2+(187-193)2+(192-193)2+(189-193)2]=30.8(cm2), = ×[(196-194)2+(190-194)2+(207-194)2+(185-194)2+(192-194)2]=54.8(cm2).因为193<194,所以 < ,即乙队的主力球员的平均身高较高.因为30.8<54.8,所以 < ,即甲队的主力球员的身高较为整齐
1
2
3
4
5
6
7
8
9
10
11
12
7. 在体育学业水平测试中,6名学生的一项体育成绩如图所示,则这组数据的中位数、方差、众数分别是( A )
A. 18,1,18 B. 17.5,3,18
C. 18,3,18 D. 17.5,1,18
A
1
2
3
4
5
6
7
8
9
10
11
12
8. (2025·杭州上城期中)已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是 ,则另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别是( D )
A. 2, B. 2,1
C. 4, D. 4,3
D
9. (2025·舟山期中)已知一组数据:8,4,6,a,5的平均数为5,则这组数据的标准差为  2 .
10. 一组数据2,3,4,x,y的平均数是3,离差平方和是4,则xy=  8 .
2 
8 
1
2
3
4
5
6
7
8
9
10
11
12
11. (2025·杭州拱墅期中)如图,为了解A,B两款品质相近的无人机在一次充满电后运行的最长时间,分别随机调查了A,B两款无人机各10架,记录它们运行的最长时间(单位:min),并对数据进行整理.
1
2
3
4
5
6
7
8
9
10
11
12
(1) 填空:
平均数/ min 中位数/ min 众数/ min 方差/
min2
A 70 69.5 72 17.8
B 72 71 69 14
(2) 根据以上信息,你认为哪款无人机运行时间更有优势 请说明理由.
解:B款无人机运行时间更有优势 理由:因为B款无人机运行的最长时间的平均数大于A款无人机,所以B款无人机运行时间更有优势(合理即可).
72
17.8
71
1
2
3
4
5
6
7
8
9
10
11
12
12. (1) 求出下列各组数据的平均数和方差.
① 1,2,3,4,5,6,7,8,9;
② 11,12,13,14,15,16,17,18,19;
③ 10,20,30,40,50,60,70,80,90.
1
2
3
4
5
6
7
8
9
10
11
12
解:(1) ① = ×(1+2+3+4+5+6+7+8+9)=5,S2= ×[(1-5)2+(2-5)2+(3-5)2+(4-5)2+(5-5)2+(6-5)2+(7-5)2+(8-5)2+(9-5)2]=
② = ×(11+12+13+14+15+16+17+18+19)=15,S2= ×[(11-15)2+(12-15)2+(13-15)2+(14-15)2+(15-15)2+(16-15)2+(17-15)2+(18-15)2+(19-15)2]=  ③ = ×(10+20+30+40+50+60+70+80+90)=50,S2= ×[(10-50)2+(20-50)2+(30-50)2+(40-50)2+(50-50)2+(60-50)2+(70-50)2+(80-50)2+(90-50)2]=
1
2
3
4
5
6
7
8
9
10
11
12
(2) 根据(1)中的计算结果,你发现了什么规律 根据你发现的规律填写下表:
数 据 平均数 方 差
x1,x2,…,xn S2
x1+a,x2+a,…,xn+a +a S2
mx1,mx2,…,mxn m m2S2
解:(2) 规律:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数,方差不变;一组数据中的每一个数都变为原数的n倍,它的平均数变为原平均数的n倍,它的方差变为原方差的n2倍.填表如上
+a
S2
m
m2S2
1
2
3
4
5
6
7
8
9
10
11
12(共15张PPT)
第3章 数据分析初步
3.2 中位数与众数
01
基础过关
02
能力进阶
03
思维拓展


1. 一组数据中出现次数最多的那个数据叫作这组数据的  众数 .
2. 将一组数据按  从小到大 (或  从大到小 )的顺序排列,位于  最中间 的一个数据(当数据个数为奇数时)或  最中间两个数据的平均数 (当数据个数为偶数时)叫作这组数据的中位数.
众数 
从小到大 
从大到小 
最中
间 
最中间两个数据的平均数 
1. (2025·资阳)某年级7名教师某周使用人工智能(AI)办公的次数分别为5,2,6,9,5,5,3.这组数据的众数和中位数分别为( D )
A. 6,5 B. 5,9
C. 5,6 D. 5,5
D
1
2
3
4
5
6
7
8
9
10
2. (教材变式)(2025·杭州西湖二模)据调查,某班30名学生所穿鞋子鞋号统计如下:
鞋 号 20 21 22 23 24
频 数 1 8 6 14 1
则该班学生所穿鞋子鞋号的中位数和众数分别是( C )
A. 6,14 B. 22.5,14
C. 22.5,23 D. 22,23
C
1
2
3
4
5
6
7
8
9
10
3. 期中考试后,班里有两名同学议论他们各自小组的数学成绩,小晖说:“我们组数学成绩是82分的人最多.”小聪说:“我们组的7名同学的数学成绩排在最中间的恰好也是82分.”上面两名同学的话能反映出的统计量分别是( D )
A. 众数和平均数
B. 平均数和中位数
C. 平均数和众数
D. 众数和中位数
D
1
2
3
4
5
6
7
8
9
10
4. (教材变式)一组数据按从小到大的顺序排列为2,4,5,x,7,15.已知这组数据的中位数是6,则这组数据的众数是  7 .
5. (2025·杭州临平段考)如图所示为浙江某年春节七天最高气温的统计结果,这七天最高气温的众数和中位数分别是  17℃,14℃ .
7 
17℃,14℃ 
1
2
3
4
5
6
7
8
9
10
6. (教材变式)某车间有20名工人,某天他们生产零件的个数如下表:
生产零件的 个数 9 10 11 12 13 15 16 19 20
工人人数 1 1 6 4 2 2 2 1 1
(1) 求这天20名工人生产零件的平均个数.
解:(1) 这天20名工人生产零件的平均个数为 ×(9×1+10×1+11×6+12×4+13×2+15×2+16×2+19×1+20×1)=13
1
2
3
4
5
6
7
8
9
10
(2) 为了提高大多数工人的积极性,管理者将实行“每天定额生产,超产有奖”的措施.若你是管理者,你将如何确定这个“定额”?
解:(2) 由题意,得这天20名工人生产零件的个数的中位数为12,众数为11.当“定额”为13个时,有8人达标,6人获奖,不利于提高大多数工人的积极性;当“定额”为12个时,有12人达标,8人获奖,不利于提高大多数工人的积极性;当“定额”为11个时,有18人达标,12人获奖,有利于提高大多数工人的积极性,所以“定额”应为11个
1
2
3
4
5
6
7
8
9
10
7. 下列说法中,正确的是( C )
A. 如果一组数据中有一个数据变动,那么中位数一定会跟着变动
B. 给定一组数据,如果找不到众数,那么众数一定是0
C. 给定一组数据,那么这组数据的中位数、平均数都只有一个
D. 给定一组数据,那么这组数据的众数一定只有一个
C
8. 在5个正整数a,b,c,d,e中,中位数是4,唯一的众数是6,则这5个正整数的和的最大值为  21 .
21 
1
2
3
4
5
6
7
8
9
10
使用次数 0 1 2 3 4 5
人 数 11 15 23 28 18 5
(1) 这部分出行学生使用共享单车次数的中位数是  3 ,众数是  3 ,该中位数的实际意义是  这天这部分出行学生中约有一半人使用共享单车3次以上(含3次) .
(2) 这天这部分出行学生平均每人使用共享单车约多少次(结果保留整数)?
解:(2) (0×11+1×15+2×23+3×28+4×18+5×5)÷(11+15+23+28+18+5)≈2(次).所以这天这部分出行学生平均每人使用共享单车约2次
3 
3 
这天这部分出行学生中约有一半人使用共享单车3次以上
(含3次) 
9. 某校为了解学生出行使用共享单车的情况,随机调查了某天部分出行学生使用共享单车的情况,并整理成下表:
1
2
3
4
5
6
7
8
9
10
(3) 若该校某天有出行学生1500人,请你估计这天使用共享单车3次以上(含3次)的学生人数.
解:(3) 1500× =765(人).所以估计这天使用共享单车3次以上(含3次)的学生人数为765
1
2
3
4
5
6
7
8
9
10
10. 某水果公司以10元/千克的成本价购进2000箱荔枝,每箱的质量为5千克.在出售荔枝前,需要去掉损坏的荔枝,现随机抽取20箱,去掉损坏的荔枝后称得每箱的质量(单位:千克)如下:4.7,4.8,4.6,4.5,4.8,4.9,4.8,4.7,4.8,4.7,4.8,4.9,4.7,4.8,4.5,4.7,4.7,4.9,4.7,5.0.
整理如下表:
质量/千克 4.5 4.6 4.7 4.8 4.9 5.0
数量/箱 2 1 7 a 3 1
分析如下表:
1
2
3
4
5
6
7
8
9
10
平均数/千克 众数/千克 中位数/千克
4.75 b c
(1) 直接写出上述表格中a,b,c的值;
解:(1) a=6,b=4.7,c=4.75
(2) 平均数、众数、中位数都能反映这组数据的集中趋势,请根据以上样本数据分析的结果,任意选择其中一个统计量,估算这2000箱荔枝损坏的总质量;
解:(2) 答案不唯一,如选择众数,则这2000箱荔枝损坏的总质量为2000×(5-4.7)=600(千克)
1
2
3
4
5
6
7
8
9
10
(3) 根据(2)中的结果,求该公司出售这批荔枝每千克定价为多少元才不亏本(结果保留一位小数).
解:(3) 由(2),得10×5×2000÷(2000×5-600)≈10.64(元),所以该公司出售这批荔枝每千克定价为10.7元才不亏本
1
2
3
4
5
6
7
8
9
10(共11张PPT)
第3章 数据分析初步
3.4 四分位数与箱线图
第2课时 箱 线 图
01
基础过关
02
能力进阶


箱线图中长方形(即“箱子”)的高度等于m75与m25的差,反映了中间  50% 数据的离散程度.“箱子”越扁,说明中间的数据越  集中 ;“箱子”越高,说明中间的数据越  分散 .
50% 
集中 
分散 
1. 关于箱线图的说法错误的是( D )
A. 箱线图可以反映数据的分布情况
B. 箱线图可以用来对样本数据分布的形状进行判断
C. “箱子”部分包含了样本50%的数据
D. “箱子”左右两侧的每条水平线段包含了样本50%的数据
D
1
2
3
4
5
6
2. 某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),若每班有42名学生,则  丙 班的第11名的分数最高(填“甲”“乙”或“丙”).
第2题
丙 
1
2
3
4
5
6
3. (教材变式)小何是一名射箭爱好者,他将最近三次练习射箭的成绩绘制成如图所示的箱线图.请你分析小何这三次练习成绩有什么特点.
第3题
解:由箱线图可知,这三次练习成绩的中位数依次是7环、8环、9环,说明小何这三次练习的成绩在逐步提高(合理即可)
1
2
3
4
5
6
4. 如图所示为某地区2025年2月和3月的空气质量指数(AQI)箱线图.AQI值越小,空气质量越好;AQI值在201~300之间,说明重度污染.下列说法错误的是( B )
A. 该地区2025年3月有重度污染天气
B. 该地区2025年3月的AQI值比2月集中
C. 该地区2025年2月的AQI值比3月集中
D. 从整体上看,该地区2025年2月的空气质量好于3月
第4题
B
1
2
3
4
5
6
5. 一组被墨水污染的数据:4,17,7,14,★,★,★,16,10,4,4,11,其箱线图如图所示,有下列说法:① 这组数据的下四分位数是4;② 这组数据的中位数是10;③ 这组数据的上四分位数是15;④ 被墨水污染的数据中一个数是3,一个数是18.其中,错误的是  ② (填序号).
② 
1
2
3
4
5
6
6. 已知甲、乙两班人数相同,在一次测试中两班的成绩箱线图如图所示.
(1) 甲班成绩的中位数为  128 分,乙班成绩的上四分位数为  128 分.
第6题
128 
128 
1
2
3
4
5
6
(2) 图中甲班对应的“箱子”被128分成两部分,其中“下半截箱子”较长,这说明了什么?
解:(2) 甲班成绩处于中等偏下的同学的成绩差异要大于中等偏上的同学(合理即可)
第6题
1
2
3
4
5
6
(3) 估计甲、乙两班平均分较高的班级是哪个.
解:(3) 由两班成绩箱线图可以看出,甲班成绩的中位数为128分,而乙班的上四分位数是128分,同时,甲班的下四分位数明显高于乙班,由此估计甲班平均分较高(合理即可)
第6题
1
2
3
4
5
6(共17张PPT)
第3章 数据分析初步
3.1 平 均 数
第1课时 算术平均数与加权平均数
01
基础过关
02
能力进阶
03
思维拓展


1. 一般地,有n个数x1,x2,…,xn,我们把 (x1+x2+…+xn)叫作这n个数的  算术平均数 ,简称平均数,记作    (读作“  x拔 ”).
2. = 这种形式的平均数叫作  加权平均数 ,其中1,3,5,4,2表示各相同数据的个数,称为  权 .
算术平均数 
 
x拔 
加权平均数 
权 
1. (教材变式)(2024·温州瑞安期中)引体向上是某市初中毕业生体育学业考试男生自主选考科目之一.现有10名九年级男生引体向上的成绩(单位:个)如下:7,3,11,11,8,8,2,8,9,3.这10名男生引体向上的平均成绩为( C )
A. 9个 B. 8个
C. 7个 D. 11个
C
1
2
3
4
5
6
7
8
9
10
2. (2025·杭州模拟)某校对班级考核打分采用的方案为卫生占40%,课间纪律占30%,课堂纪律占30%.九年级一班某学期这三部分的分数依次为91分、95分、93分,则九年级一班某学期的考核分数为( C )
A. 92分 B. 92.5分
C. 92.8分 D. 93分
C
1
2
3
4
5
6
7
8
9
10
3. (教材变式)(2024·温州瓯海期末)某校为了解八年级学生的课后作业量,随机调查了30名学生每天完成作业的时长,调查结果统计如下表:
时长/h 2.5 2 1.5 1 0.5
人 数 3 6 12 6 3
估计该校八年级学生每天完成作业的平均时长是  1.5 h.
4. (2025·宿迁)某公司在一次招聘中,分笔试和面试两部分,笔试和面试成绩按6∶4计算最终成绩.小李的笔试成绩为85分,面试成绩为90分,则小李的最终成绩为  87 分.
1.5 
87 
1
2
3
4
5
6
7
8
9
10
参赛者 演讲内容 语言表达 临场表现
甲 90分 85分 80分
乙 84分 83分 91分
(1) 若根据三项得分的平均分从高到低确定名次,则两名同学的排名顺序是怎样的?
解:(1) 甲的平均分为 =85(分),乙的平均分为 =86(分),因为86>85,所以排名顺序为乙排在甲的前面
5. (教材变式)(2024·嘉兴期末)某校举行了一场演讲比赛,甲、乙两名同学的各项得分如下表:
1
2
3
4
5
6
7
8
9
10
(2) 若学校认为这三个项目的重要程度有所不同,而给予“演讲内容”“语言表达”“临场表现”三个项目在总分中的占比为2∶2∶1,则两名同学的排名顺序又是怎样的?
解:(2) 甲的总分为 =86(分),乙的总分为 =85(分),因为86>85,所以排名顺序为甲排在乙的前面
1
2
3
4
5
6
7
8
9
10
6. (2025·绍兴嵊州期末)若数据m,3,5,n的平均数为4,则数据m,n的平均数是( B )
A. 2 B. 4 C. 6 D. 8
B
1
2
3
4
5
6
7
8
9
10
7. 某老师为了解学生周末学习时间的情况,在所任班级中随机调查了10名学生,将统计结果绘制成如图所示的条形统计图,则这10名学生周末学均时间是  3 h.
3 
1
2
3
4
5
6
7
8
9
10
8. 现有甲、乙两种糖果的单价与质量如下表:
种 类 甲种 乙种
单价/(元/千克) 30 20
质量/千克 a b
将这a千克甲种糖果和b千克乙种糖果混合成什锦糖果,则该什锦糖果的单价为    元/千克(用含a,b的代数式表示).
 
1
2
3
4
5
6
7
8
9
10
9. 某射击队为了解队员的年龄情况,进行了一次年龄调查,根据调查结果绘制出如图所示的统计图.
(1) 求m的值.
解:(1) 因为1-10%-30%-25%-15%=20%,所以m的值是20
第9题
1
2
3
4
5
6
7
8
9
10
(2) 求该射击队队员的平均年龄.
解:(2) 13×10%+14×30%+15×25%+16×20%+17×15%=15(岁),所以该射击队队员的平均年龄是15岁
第9题
1
2
3
4
5
6
7
8
9
10
(3) 小文认为,若从该射击队中任意挑选四名队员,则必有一名队员的年龄是15岁.小文的判断正确吗?为什么?
解:(3) 小文的判断是错误的 因为也有可能挑选到的四名队员的年龄分别是13岁、14岁、16岁、17岁
第9题
1
2
3
4
5
6
7
8
9
10
10. 某单位欲从内部招聘管理人员一名,对甲、乙、丙三名候选人进行了笔试和面试两项测试,三名候选人的测试成绩如下表:
候选人 甲 乙 丙
笔试成绩/分 75 80 90
面试成绩/分 93 70 68
根据录用程序,该单位组织200名职工采用投票推荐的方式对三名候选人进行民主评议,三名候选人的得票率(没有弃权票,每名职工只能推荐一名候选人)如图所示,每得一票记1分.
1
2
3
4
5
6
7
8
9
10
第10题
(1) 甲的民主评议成绩为  50 分,如果根据两项测试和民主评议的平均成绩确定录用人选,那么  乙 将被录用;
50 
乙 
1
2
3
4
5
6
7
8
9
10
(2) 根据实际需要,该单位将笔试、面试、民主评议的成绩按4∶3∶3的比确定个人成绩,那么谁将被录用(请写出计算过程)?
解:将笔试、面试、民主评议的成绩按4∶3∶3的比确定个人成绩,则甲的成绩为(4×75+3×93+3×50)÷(4+3+3)=72.9(分),乙的成绩为(4×80+3×70+3×200×40%)÷(4+3+3)=77(分),丙的成绩为(4×90+3×68+3×200×35%)÷(4+3+3)=77.4(分).因为72.9<77<77.4,所以丙将被录用
1
2
3
4
5
6
7
8
9
10(共17张PPT)
第3章 数据分析初步
3.1 平 均 数
第2课时 分布式计算
01
基础过关
02
能力进阶
03
思维拓展


当样本容量较大时,我们可以把样本分成若干个子样本,分别统计出平均数,然后运用计算加权平均数的方法,求出整个样本数据的平均数.将一个大的计算任务分解成若干个小的计算任务分别计算,再将结果汇总处理得到最终结果,这样的计算方式称为  分布式计算 .
分布式计算 
1. 某中学举办跳绳比赛,七、八两个年级的学生参加,平均成绩分别为138次/分、142次/分.若七、八年级参加比赛的学生人数分别为40,30,则所有参赛学生的平均成绩约为 ( C )
A. 139次/分 B. 142次/分
C. 140次/分 D. 138次/分
C
1
2
3
4
5
6
7
8
9
10
11
2. 某城市三个监测点的空气质量数据如下:甲监测点全年365天中,优良天数占80%;乙监测点全年365天中,优良天数占75%;丙监测点全年365天中,优良天数占85%.该城市全年优良天数的占比约为( A )
A. 80% B. 81.1%
C. 79.1% D. 78.1%
A
1
2
3
4
5
6
7
8
9
10
11
3. 某公司有三个部门,员工人数及平均业绩如下表,则该公司员工的平均业绩约为( C )
部 门 员工人数 平均业绩/万元
A 50 8
B 60 10
C 40 12
A. 9.5万元 B. 10万元
C. 9.9万元 D. 10.2万元
C
1
2
3
4
5
6
7
8
9
10
11
4. 某工厂两个车间的产品合格率如下:甲车间生产2000件,合格率为98%,乙车间生产3000件,合格率为97%,则全厂合格产品所占的百分比为  97.4% .
5. 某中学高二年级有文科和理科两个类别,学生人数及平均成绩如下表.若高二年级学生的平均成绩为78分,则高二年级理科学生的平均成绩为  80分 .
类 别 学生人数 平均成绩/分
文科 120 75
理科 180
97.4% 
80分 
1
2
3
4
5
6
7
8
9
10
11
6. 某电商公司有四个部门,各部门员工人数及平均销售额如下表,求该电商公司员工的平均销售额(精确到0.01万元).
部 门 员工人数 平均销售额/万元
家电部 50 10
服装部 60 8
食品部 40 12
美妆部 30 15
1
2
3
4
5
6
7
8
9
10
11
解:总销售额为 50×10+60×8+40×12+30×15=500+480+480+450=1910(万元),总人数为50+60+40+30=180,则该电商公司员工的平均销售额为1910÷180≈10.61(万元)
1
2
3
4
5
6
7
8
9
10
11
7. (新情境·环保意识)某社区组织垃圾分类知识竞赛活动,A,B两个小区的居民参与,A小区的平均成绩为88分,B小区的平均成绩为95分.若A,B两个小区参与活动的居民人数之比为5∶4,则所有参与竞赛的居民的平均成绩约为( A )
A. 91分 B. 92分 C. 89分 D. 93.5分
A
1
2
3
4
5
6
7
8
9
10
11
8. (教材变式)A,B,C三所学校对学生喜爱的体育项目进行调查,分别有a名,b名,c名学生参与调查,其中喜欢足球的学生所占的百分比分别为58%,66%,73%.这三所学校参与调查的所有学生中,喜欢足球的学生所占的百分比为    .
9. 一家兴趣培训机构对某线上课程满意度调查显示:A校区3000名学员中85%满意,B校区2500名学员中78%满意,C校区4000名学员中92%满意.若总满意度超过85%可评为“年度优质课程”,则该线上课程  达标 (填“达标”或“不达标”).
 
达标 
1
2
3
4
5
6
7
8
9
10
11
地 区 投票人数 得票率 作品A 作品B 作品C
甲 10000 70% 65% 85%
乙 8000 85% 80% 75%
丙 12000 75% 75% 80%
如果总得票率超过80%的为一等奖,那么这三部作品中,有获得一等奖的吗 若有,是哪一个
10. (教材变式)某画展举办观众最喜爱的美术作品评选活动.通过票选形式A,B,C三部作品在甲、乙、丙三地的得票情况如下表:
1
2
3
4
5
6
7
8
9
10
11
解:有 作品A的总得票率为
=76%,作品B的总得票率为
=73%,作品C的总得票率为
≈80.3%.因为80.3%>80%,所以这三部作品中有获得一等奖的,是作品C
1
2
3
4
5
6
7
8
9
10
11
11. 某校对八年级学生的身高x(单位:cm)情况进行了抽样调查,x≤150的为中下等水平,150170的为上等水平.5组调查数据如下:
第1组:153,162,148,170,155,163;
第2组:150,164,173,168,146,170,165,154;
第3组:158,169,164,149,152,172,170;
第4组:155,165,146,152,168,170,173,158,150,148,175,166;
第5组:143,158,162,170,168,153.
(1) 分别求各组身高数据的平均数,以及各组身高等级的人数所占的百分比;
解:(1) 各组身高数据的平均数、各组身高等级的人数所占的百分比如下表:
1
2
3
4
5
6
7
8
9
10
11
组 别 人 数 平均数 各组身高等级的人数所占的 百分比(精确到1%) x≤150 150< x≤160 160< x≤170 x>170
第1组 6 158.5 17% 33% 50% 0
第2组 8 161.25 25% 13% 50% 13%
第3组 7 162 14% 29% 43% 14%
第4组 12 160.5 25% 25% 33% 17%
第5组 6 159 17% 33% 50% 0
1
2
3
4
5
6
7
8
9
10
11
(2) 利用(1)中获得的结果,计算所抽样本的身高数据的平均数(精确到0.1),不同等级水平范围内的人数所占的百分比(精确到1%),并对该校八年级学生的身高情况作简要分析.
解:(2) 5个小组共39个数据,利用平均数的分布式计算,可得所抽样本的身高数据的平均数为 =

160.4.中下等水平人数所占的百分比为

21%,中等水平人数所占的百分比为

26%,中上等水平人数所占的百分比为
1
2
3
4
5
6
7
8
9
10
11

44%,上等水平人数所占的百分比为
≈10%.由所抽样本的身高数据的平均数及不同等级水平范围内的人数所占的百分比可知,该校八年级学生的身高属于中上等水平(合理即可)
1
2
3
4
5
6
7
8
9
10
11(共11张PPT)
第3章 数据分析初步
3.3 离差平方和与方差
第2课时 数据的分组
01
基础过关
02
能力进阶


 一般地,设有n个数据x1,x2,x3,…,xn,它们的平均数为 ,离差平方和为D2.如果把这些数据分为两组,第1组有k1个数据,平均数为 ,离差平方和为 ;第2组有k2个数据,平均数为 ,离差平方和为 ,其中k1+k2=n.通过计算可以得到D2=( + )+[k1 +k2 ]. 通常称  ( + ) 为组内离差平方和,它表达了两个组组内数据的离散程度;称[k1 +k2 ]为组间离差平方和,它表达了两个组之间的差异.数据分组方法有许多种,其中使得“  组内离差平方和最小 ”的方法最为常见.
( + ) 
组内离差平方和最小 
1. 在分组时要求“组内离差平方和最小”,其目的是( B )
A. 使每组数据量相等
B. 使每组组内数据差异尽可能小,组间数据差异尽可能大
C. 减少计算复杂度
D. 保证组间的平均数相等
B
1
2
3
4
5
6
2. 若将排序后的数据分为两组,则计算组内离差平方和时( B )
A. 只需计算第一组的离差平方和
B. 需计算两组离差平方和的总和
C. 只需计算最大值与最小值的差
D. 需计算两组离差平方和的平均数
B
1
2
3
4
5
6
3. (教材变式)把5个数据-1,3,1,5,4分成{-1,1}和{3,4,5}两组,则这种分组情况的组内离差平方和为  4 .
4. 某小组8名学生的数学考试成绩(单位:分)分别为88,98,87,92,92,90,91,96,老师决定将这些成绩分为两组,以便更好地分析学生的成绩分布.若按照以下分组方式:第一组{87,88,90,91,92,92},第二组{96,98},求组内离差平方和.
解:第一组数据的平均数为(87+88+90+91+92+92)÷6=90,第一组数据的离差平方和为(87-90)2+(88-90)2+…+(92-90)2=22,第二组数据的平均数为(96+98)÷2=97,第二组数据的离差平方和为(96-97)2+(98-97)2=2,所以组内离差平方和为22+2=24
4 
1
2
3
4
5
6
5. 把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( B )
A. {2},{4,8,10,12} B. {2,4},{8,10,12}
C. {2,4,8},{10,12} D. {2,4,8,10},{12}
B
1
2
3
4
5
6
6. 按照“组内离差平方和达到最小”的方法,把如图所示的10个苹果按直径大小分成两组.
解:将10个数据按照从小到大排序为65,69,70,75,76,76,78,80,80,81,把10个数据分成两组,共有9种情况,分别计算各种情况的组内离差平方和,如下表(结果保留整数):
1
2
3
4
5
6
组 序 分组情况 组内离差
平方和
第1组 第2组 1 65 69,70,75,76,76, 78,80,80,81 147
2 65,69 70,75,76,76, 78,80,80,81 98
3 65,69,70 75,76,76, 78,80,80,81 48
1
2
3
4
5
6
4 65,69,70,75 76,76,78,80,80,81 74
5 65,69,70,75,76 76,78,80,80,81 98
6 65,69,70,75,76,76 78,80,80,81 108
7 65,69,70,75, 76,76,78 80,80,81 136
8 65,69,70,75, 76,76,78,80 80,81 182
1
2
3
4
5
6
9 65,69,70,75,76, 76,78,80,80 81 218
计算结果表明,将数据分成{65,69,70}和{75,76,76,78,80,80,81}两组时,组内离差平方和最小
1
2
3
4
5
6