专题一:数据、信息、知识与智慧
一、四者的概念
数据:现实世界客观事物的符号记录,信息的载体,计算机加工的对象。
信息:经过加工处理的、具有意义的数据。
【易错点】通过各类传感器或者测量工具等采集到的是数据,比如37℃、90km/h、150cm等,在没有经过加工处理之前,只是反映客观事物的某一个特征;经过加工处理后——比如:“今天的气温达到了37℃,热死了!”或者“37℃,体温正常。谢天谢地终于退烧了!” ——就具有了一定的意义,此时就是信息了。
知识:人脑对信息进行系统地提炼、研究和分析的结果,能精确反映事物的本质。
形成知识路径:做实验→获取观察数据→分析处理→推理简历数学模型→实验验证模型→形成知识
智慧:为了达到预定目标而运用知识解决问题的创新思维能力。
二、四者的关系
四者是逐渐递进的概念,前者是后者的基础和前提,后者是前者的抽象与升华。
三、信息的特征
普遍性(普遍存在,只要有事物运动,就有数据,有数据就会有信息)
传递性(打破时间和空间的限制)
共享性(区别于交换,信息告诉更多的人是共享)
依附性和可处理性(依附性指的是信息通过图像、文字或者是声音等载体来表达)
时效性
真伪性
价值相对性(信息是有使用价值的,对不同的人来说不同的信息价值不一样)
四、计算机中的数据
现实世界中的各种符号,包括图形、图像、视频、音频、文本等数值性和非数值性的符号,都可以被计算机转化为二进制数进行存储、加工。
计算机中的数据有四个基本特征:二进制、语义性、分散性、多样性与感知性。
由于计算机中采用的物理器件主要是电子元件,其特性只有断开或者连接两种状态,可以用0和1来表示,所有的数据就都以0和1的不同的组合来呈现,因此是二进制数。
不同的内容,如文本、图片、音频和视频,需要用不同的数据编码的方式来转化为二进制数进行存储,因此不同的文件存储占用的大小也以二进制数的位数来表示,其大小关系如下:
计算机中存储数据的最小单位是二进制位,用比特(bit)表示。
计算机存储数据的基本单位是字节(Byte,简写为B),1字节=8比特,即8位二进制数。
更高的还有TB太字节、PB拍字节、EB艾字节。
数据编码:
模拟信号与数字信号
模拟信号:是指用连续变化的物理量所表达的信息。如声音信号、图形信号。
缺点:保密性差、抗干扰能力差、不适合远距离传输。
数字信号:是离散时间信号的数字化表示。如开关电路中输出电压、电流脉冲。
优点:抗干扰能力强、可靠性高。缺点:算法复杂、成本较高。
数据编码的三种方式:
(
1
)专题二 数字化学习与创新
数字化工具与资源
数字化工具:指能够采集、获取、检索、表示、传输存储和加工多媒体数字化资源的设备装置。
数字化资源:指经过数字化工具处理,可以在多媒体计算机上或网络环境下运行的,且可以实现共享的多媒体材料。
判断数字化工具的类别:
数字化工具的优势:
获取的便捷性:不受时空和传递呈现方式的限制
形式的多样性:以电子数据的多种形式表现信息内容
资源的共享性:为广泛的使用者所享有,而信息量不变
平台的互动性:双向交流的互动方式
内容的扩展性:可操作性和可再生性
八大类别及数字化工具的优势(表格记忆法)
数字化学习
概念:指个体通过评估并选用常见的数字化资源与工具,有效地管理学习过程与学习资源,创造性地解决问题,从而完成学习任务,形成创新作品的能力。
影响: 数字化学习是伴随计算机多媒体技术、互联网通信技术的发展而产生的,是信息社会的重要特征。
特点:
问题化:强调问题在学习活动中的重要作用。在数字化学习过程中,学习者一方面参与决定学习的问题(或主题),并围绕问题开展学习;另一方面通过学习生成问题、提出问题、分析问题和解决问题。
合作化:数字化学习平台为学习者提供了一个信息交流、资源共享和协作学习的环境。学习者可以在任何时间通过网络向教师提出问题和请求指导;也可以和其他学习者进行学习交流,而且这种交流是双向的,多对多的。
个性化:数字化学习能满足以学习者为中心的、灵活的和个性化学习的需要。学习者可以根据自己的特点自行安排学习进度,选择自己需要的资源,按照适合自己的方式进行学习。
创造性和再生性:数字化资源是非线性组织、多以超文本链接的形式来构建的庞大的资源网络,有助于创新思维发展;采用新颖、熟练的数字化加工方法,利用数字化工具进行知识的整合、再创造,最终形成个人的知识与智慧,作为学习者的学习成果。
5、开放性:人们可以随时随地通过互联网进入数字化的学习环境,实现碎片化学习。学习空间正变得无围墙、无界限。同时,个体的学习也不再是阶段性的,而是终身的;数字化学习为构建学习型社会提供了有力的保障,推动了终身教育的发展。
注意:能够和同学互动指的不是开放性,而是合作性。
体验数字化创新学习过程
(扩展教学部分,学习思维导图工具有助于梳理知识)
绘制思维导图的软件有Xmind、Mindmanager、FreeMind、WPS、希沃电子白板5等。
以Xmind为例,绘制思维导图的操作指导:
(
1
)专题三:大数据与人工智能
一、大数据的概念
无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现里和流程优化能力的海量、高增长率和多样化的信息资产。
来源:人类日益普及的网络行为所伴生的(各种传感器获取的数据,正以大爆发的速度增长)
价值:人们提取信息、做出决策的重要依据,推动信息社会的发展
采集方法:系统日志采集法、网络数据采集法(网络爬虫)、其他数据采集法
二、大数据的特征
大数据的产生角度:4V(大量、多样、低价值密度、高速)
大量、高速——举例:2019年双11,成交额突破100亿只用了1分36秒。/周杰伦2019年巡回演唱会门票开售1秒售罄!
低价值密度——举例:通过监控视频寻找犯罪分子,亿万记录种可能只有几秒钟有效时间。
多样——指的是大数据可以从文字、图像、视频、音频等产生
互联网思维的角度:样本趋于总体、精确让位于模糊、相关性重于因果
大数据的存储与计算的角度:分布式存储和分布式并行计算
记忆口诀:
三、大数据的影响
四方便:方便支付、方便出行、方便购物与产品推介、方便看病与诊病
两负面:个人信息泄露、信息伤害与诈骗
口诀:付行购诊四方便,泄露诈骗两负面。
四、数据可视化表达的方式【图表视频】
反映趋势变化的:柱形图、折线图、柱线混合图
反映比例变化的:圆环图、饼图、圈图、堆叠面积图
反映相关关系的:散点图、雷达图、网络关系图、词云图、数据地图、动态热力图、3D动态显示图
(体验词云图的制作:文字云,词云,专业词频分析,在线制作-标准版,wenziyun.cn)
五、人工智能
概念:研究计算机模拟人的某些感知能力、思维过程和智能行为的学科。
诞生与发展(简单了解)
人工智能的诞生:阿兰·图灵在1950年发表的一篇名为《计算机器与智能》的论文,提出著名的“图灵测试”,测试者在与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。 如果机器能够让平均每个参与者做出超过30%的误判,那么这台计算机就可以被认为具有人类智能。
人工智能的发展:
应用:(七大领域)
智能制造
举例:数控机床、自动识别设备、人机交互系统、工业机器人、智能工厂、智能服务等
智能家居
以住宅为平台,基于物联网技术,由硬件、软件、云计算平台构成的家居生态圈
智能教育
智能交通
举例:ETC(不停车电子收费系统)
智能安防
结合摄像头分析识别安全隐患
生物特征识别技术:指纹识别、人脸识别、指静脉识别、声纹识别等
智能医疗
智能物流
PS:如果给出人工智能应用的例子,无法判断具体是哪个领域的时候,大概率就是智能制造。(因为其他都很好判断)专题四:算法与程序设计
计算机解决问题的过程:
分析问题→设计算法→编写程序→调试运行程序
算法:是指在有限步骤内求解某一问题所使用的一组定义明确的规则。
算法的特征 :可确定有出入(口诀)
可行性、确定性、有穷性、数据输入、数据输出。
描述算法的三种方式:
自然语言描述法:使用日常交流所用语言来描述算法,简单易懂,但也容易歧义。
流程图描述法 :使用程序框图来描述算法,有规定的形状和对应的作用,更通用且清晰明了,缺点是不好修改。
伪代码描述法:介于自然语言与计算机语言之间的文字与符号,它不使用图形符号,书写方便,易于理解。缺点是需要有一定的编程能力。
三种基本的控制结构:【要能看懂】
(1)顺序结构:表示程序中的各步操作按出现的先后顺序执行【从上到下执行】
(2)选择结构:表示程序的处理步骤出现了分支,需要根据某一特定的条件选择其中的一个分支执行;选择结构有单选择、双选择、多选择3种。【有多条路可以选择】
(3)循环结构:表示程序反复执行某个或某些操作,直到判断条件为假(或为真)时才可终止循环。
二、计算机程序:计算机可以识别运行的指令集合。
计算机程序设计语言:
(1)机器语言:由0和1表示的二进制代码组成的语言,能被计算机直接接收和执行。
(2)汇编语言:使用了一种类似英文缩略词且带有助记性符号的语言,但是,计算机不能直接识别和执行这些符号,需要一个专门的语言翻译器,负责将程序中的每条语句都翻译成用二进制数表示的机器语言。如:MOV AL,9;ADD AL,8。
(3)高级语言:接近于数学语言和人的自然语言,不再过度依赖某种特定的机器或环境;同理,高级编程语言也不能被计算机直接识别和执行。 【代码】
第一种高级语言,Fortran语言,主要用于科学和工程计算。
用高级语言编写的程序必须经过编译程序或解释程序将其翻译成机器语言。
编译程序:把高级语言程序的每一条语句都编译成机器语言,并保存成二进制文件后才运行的程序。
解释程序:在执行高级语言程序时,逐条语句解释成机器语言并立即执行的程序。
【编译程序:全文上传,一次性全文翻译;解释程序:带个翻译官,你说一句我译一句】
三、程序设计基础
常量&变量
常量:指在程序运行过程中其值始终不发生变化的量,通常是固定的数值或字符串,在程序中可以直接使用。
数值 有三种类型:整数int、浮点数 float 和复数。(浮点数就是小数)
字符串 就是一堆字符在引号里面排队,从左到右排队,每个字符都有一个编号,叫做索引,左边第一个编号为0,从右边开始数第一个编号为-1
Python的其他类型:(简单了解)
变量 :指在程序运行过程中其值可以发生变化的量,变量由变量的标识符(变量名)和变量的内容(赋值)两部分组成。
变量的命名:可以由字母(A-Z,a-z)、数字(0-9)、下划线( _ )组成。但是第一个字符不能是数字;同时,字母区分大小写,如X和x、sum和Sum都是不同的标识符;不能用系统关键字命名。
一个变量只能保存最后一次赋值的内容。
注意:python中 = 是赋值号, = =才是等于号; * 是乘号, ** 是幂运算,求几次方
运算符&表达式
当一个表达式中有多种运算时,运算的顺序是根据运算符的优先级由高到低进行运算。同级运算则按从左到右的顺序进行。
考试最常用的是写判断大小的表达式,比如 i > 20
函数
【必须掌握】最常考的函数:
输入函数: A = input("请输入:" )
输入函数必须有一个变量名来保存输入的内容,因此前面有 A= ;
input( )函数的返回结果都是字符串,如果需要接收数字并计算的话就必须转换为相应的类型。
将字符串转换为整数:zs = int( A )
将字符串转换为小数:xs = float( A )
输出函数:print( A )
求字符串长度:cd = len( A )
if 语句
单分支
双分支
多分支
循环结构
while循环和for循环——举例区分:
while也叫当型循环,表达式是一个关系表达式或逻辑表达式,值为真(True)或假(False),当值为真时执行循环体;
因此whlie循环的循环体中必须有改变表达式中变量值的语句,否则将成为死循环。
for循环是遍历某一规定范围内的所有值
1.直接罗列的方式举例—— for value in [1,2,3,4,5]:
2.使用range( )函数
range(start,stop,step)
计数从start开始(如果省略默认是0)到stop结束(但不包括stop),即 [a,b) 包头不包尾
step表示步长,即间隔,(如果省略默认为1),step也可以是负数。
循环控制语句
break:由于循环遍历可能存在的可能性过多,有可能浪费很多的时间重复计算无效值,因此可以在循环中加入控制语句,当满足条件时即可结束循环