(共33张PPT)
14.1 获取数据的基本途径及相关概念
第14章
“大数据”是指以多元形式,自许多来源搜集而来的庞大数据组,往往具有实时性.这些数据可能得自社交网络、电子商务网站、顾客来访记录和许多其他来源.
问题 凭你的经验,日常有哪些获取数据的方法和途径呢?
提示 如:通过调查获取数据,通过试验获取数据,通过查询获取数据等.
情景引入
内
容
索
引
知识梳理
题型探究
随堂演练
1
知识梳理
PART ONE
知识点一 获取数据的途径
概念 数据名称
直接获取 通过社会调查或观察、试验等途径获取数据 直接数据或一手数据
间接获取 借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据 间接数据或二手数据
知识梳理
知识点二 普查和抽查
调查方法 概念、特点 普查 抽查
定义 为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式 从全体调查对象中按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况的调查方式
知识梳理
优点 ①所取得的资料更加全面、系统; ②调查特定时段的社会经济现象总体的信息 ①迅速、及时;
②节约人力、物力、财力,对个体信息的了解更详细
缺点 耗费大量的人力、物力、财力、时间长、任务重 获取的信息不够全面、系统,其结果具有不确定性
知识梳理
知识点三 总体和样本
1.总体:一般地,在获取数据时,把所考察对象(某一项指标的数据)的_____叫作总体.
2.个体:把组成总体的每一个考察对象叫作个体.
3.样本:从总体中所抽取的 叫作总体的一个样本.
4.样本容量:样本中 的数目叫作样本容量.
全体
一部分个体
个体
知识梳理
2
题型探究
PART TWO
例1 (多选)2020年4月某市模考共有70 000多名学生参加,教科室为了了解本校3 390名考生的数学成绩,从中抽取300名考生的数学成绩进行统计分析,在这个问题中有以下说法,其中正确的是
A.3 390名考生是总体的一个样本 B.3 390名考生的数学成绩是总体
C.样本容量是300 D.70 000多名考生的数学成绩是总体
一、总体、样本等概念的辨析
解析 总体是3 390名考生的数学成绩,样本是抽取的300名考生的数学成绩,样本容量是300.
√
√
题型探究
解决此类问题要明确概念的实质,应注意两个问题
(1)调查对象是什么,如本例调查对象是“每个考生的数学成绩”,不是“每个考生”.
(2)样本容量是样本中个体的数目,无单位.
反思感悟
跟踪训练1 2020年2月20日,欧盟特别峰会在布鲁塞尔举行,主要讨论2021年至2027年长期预算,有27个国家代表参加,最终因各方分歧太大,未达成共识.会后某记者从每个国家与会人员中采访了两名成员,调查得到各成员国在预算总量、主要政策领域分配额、欧盟收入来源以及激励机制等多方面都存在分歧.在这个问题中样本容量是
A.2 B.27 C.54 D.不确定
解析 样本容量是27×2=54.
√
题型探究
例2 为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获取数据
二、获取数据的途径
√
解析 因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获取数据.
题型探究
获取数据的基本途径
获取数据的基本途径 适用类型 注意问题
通过调查获取数据 对于有限总体问题,一般通过抽样调查或普查的方法获取数据 要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
反思感悟
通过试验获取数据 没有现存的数据可以查询 严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据 自然现象 借助专业测量设备通过长久的持续观察获取数据
通过查询获取数据 众多专家研究过,其收集的数据有所存储 必须根据问题背景知识“清洗”数据,去伪存真
反思感悟
跟踪训练2 “中国天眼”全称为500米口径球面射电望远镜(Five hundred meter Aperture Spherical radio Telescope,简称FAST),是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获取数据
解析 “中国天眼”主要是通过观察获取数据.
√
题型探究
三、普查与抽查
例3 下列问题中,
①调查我市中小学生每天的课外阅读时间;
②某列车中有位乘客感染了2019-nCoV病毒,对乘坐此列车的乘客进行检查;
③调查2020年2月20日济南长清区地震后,济南市民的心理健康状况;
④调查某快餐店中8位店员的收入情况.
适合普查的是________,适合用抽样调查的是________.(填序号)
②④
①③
题型探究
解析 依据普查与抽样调查各自的特点进行判断选取.
②中必须对所有乘客进行隔离、检查,必须做到普查.
④中共8名店员,数量较少,可采用普查方式.
而①③因数量大,普查难以做到,故采用抽样调查的方式.
题型探究
对普查与抽样调查的理解
(1)普查是一项非常艰巨的工作,它要对所有的对象进行调查,当检验对象很大或检验对象具有破坏性时,采用普查的方法是行不通的,要进行抽样调查.
(2)普查与抽样调查的适用条件是不同的,在具体问题中,用普查还是抽样调查的方式,要根据它们的特点和适用范围进行判断.
反思感悟
跟踪训练3 (多选)下面的四个问题中,可以用抽样调查方法的是
A.武汉火神山医院供应库房工作人员对新入库的10万只一次性医用口罩
进行质检
B.中国银行兰山分行对天元公司100万元存款的现钞的真假检验
C.空降兵战士检查20个伞包及伞的质量
D.一汽大众质检部门检验最新的某品牌汽车的防碰撞性能
解析 根据抽样调查与普查的概念可知,B,C一般采用普查的方法,A,D采用抽样调查的方法.
√
√
题型探究
四、抽样调查中样本的抽取问题
例4 为了调查2020年中央电视台春节联欢晚会播出的收视率,节目组设置了《春节联欢晚会收视率调查表》,并向社会广泛征求调查意见.某校有两名同学为电视台设计了调查方案:
同学A:我把《春节联欢晚会收视率调查表》放在互联网上,只要上网登录该网址的人就可以看到这张表,他们填表的信息可以很快反馈到我的电脑中.这样,我就可以很快统计出收视率了.
同学B:我在电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率了.
请问上述两名同学设计的调查方案能够获得比较准确的收视率吗?为什么?
题型探究
解 调查的总体是所有可能看电视的人群.同学A的设计方案考虑的人群是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录该网址的人群就被排除在外了.因此同学A设计的方案抽取样本的代表性差,不能较好的估计总体分布.
同学B的设计方案考虑的人群是:在电话号码本上统计电话的人群,也有一定的片面性,因此同学B设计的方案抽取样本的代表性也差,也不能较好的估计总体分布.
题型探究
延伸探究 你认为怎样设计调查方案,能得到较有说服力的数据?
解 发放调查问卷或打电话询问都要考虑不同的人群,要根据人口比例分别对农村、城市分成不同的群体调查,对各个不同群体中最好要按年龄、职业等属性再细化.
题型探究
根据调查问题的特点设计抽样调查的不同方案,应遵循以下原则
(1)要考虑如何合理地获取样本,以确保其典型性、代表性.即抽取的部分个体具有广泛的代表性,能很好地代表总体.
(2)要考虑如何保证调查内容的真实性.
反思感悟
跟踪训练4 下列调查方式中合适的是
A.某单位将新购买的准备开业庆典的20箱礼炮全部进行质检
B.某班有40名同学,指定家庭最富有的3人参加“学代会”
C.某服装厂的一批5 000件出口服装,随机抽50件进行抽样调查
D.为了调查最近上映影片的一周内的票房情况,特选周六、周日两天进
行调查
√
题型探究
解析 选项A中,对礼炮的质检带有破坏性,虽然总量不大,但不宜采用普查方式.
选项B中,“家庭最富有的”不具有代表性,样本选取错误.
选项D中,因调查一周的票房,时间不长,最好采用普查的方式,即使是用抽样调查,周六、周日两天的选取也不具备代表性.
题型探究
3
随堂演练
PART THREE
1.下列调查中,适合采用普查方式的是
A.调查某品牌电视机的市场占有率
B.调查某电视连续剧在全国的观看人数
C.调查某校七年级各班男女同学的比例
D.调查某型号炮弹的射程
1
2
3
4
5
解析 A项,调查某品牌电视机的市场占有率,适于抽样调查;
B项,调查某电视连续剧在全国的观看人数,适于抽样调查;
C项,调查某校七年级各班男女同学的比例,适于普查;
D项,调查某型号炮弹的射程,适于抽样调查,故选C.
√
随堂演练
2.(多选)从某年级的500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是
A.500名学生的体重是总体
B.每个学生是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量
1
2
3
4
5
解析 由题意可知在此抽样调查中,总体是500名学生的体重,A对;
个体是每个学生的体重,B错;样本是抽取的60名学生的体重,C对;
样本容量为60,D错.
√
√
随堂演练
1
2
3
4
5
解析 人口普查和高考考生的查体都属于普查,调查某商品的质量优劣和对某个事情进行舆论调查只能是抽样,没必要进行普查.故选A.
3.下列调查中属于抽样调查的是
①每隔5年进行一次人口普查;②调查某商品的质量优劣;③某报社对某个事情进行舆论调查;④高考考生的查体.
A.②③ B.①④ C.③④ D.①②
√
随堂演练
1
2
3
4
5
4.小明从网上查询到某贫困地区10户居民家庭年收入(单位:万元)如下所示:
编号 1 2 3 4 5 6 7 8 9 10
年收入 1.2 1.3 1.8 2.0 4.6 1.7 0.9 2.1 1.0 1.6
根据以上数据,我们认为有一个数据是不准确的,需要剔除,这个数据是______.
4.6
解析 由于编号为5的数据为4.6,明显高于其他数据,所以这个数据是不准确的.
随堂演练
1
2
3
4
5
5.国家统计局、国家残联决定对国家残疾人生活、就业等情况进行调查,某同学设计的调查方案是在国家残联的网站上设立一个调查表,根据网站上的数据进行分析.你认为他的方案________(填“合理”或“不合理”).
解析 很多残疾人不具有上网条件,因此获取的数据不具有代表性.
不合理
随堂演练
1.知识清单:
(1)获取数据的途径.
(2)普查和抽查.
(3)总体、样本的概念及样本的选取问题.
2.常见误区:
(1)弄错调查对象导致对总体、样本的叙述错误.
(2)使用不恰当的抽取方法导致抽取的样本代表性差.
课堂小结