第 5 单 元 数据分析与人工智能
5.1走近数据分析
数据分析就是对数据进行计算、处理,从而得出一些有意义的结论的技术。
1.数据分析的方法
数据分析主要用于现状分析、原因分析和预测分析。
数据分析首先根据分析的目标提出假设,然后选择恰当的分析方法进行分析,验证假设是否正确,继而得出相应的结论。
数据分析方法有很多,如对比分析和平均分析。
(1)对比分析是指将两个或以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物的发展变化情况和规律。对比有横向对比和纵向对比。
①横向对比是在类似的或同类的事物之间进行比较。
②纵向对比是将相同事物的不同时期进行比较。
(2)平均分析是指运用计算平均值的方法反映总体在一定时间、地点条件下某一数量特征的一般水平。
平均分析和对比分析常结合使用。
2.数据可视化表达
数据可视化表达:是指以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式。
图表是最常用的数据可视化表达方式之一。
利用表格加工软件绘制基本的图表类型,如柱状图、饼图和折线图等;利用专业性工具绘制表现形式更为丰富或者具有互动功能的图表。
3.数据分析报告
数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。通过报告不仅把数据分析的起因、过程、结果及建议完整地展现出来,还可以为决策者提供科学、严谨的决策依据。
数据分析报告内容包括:
首先要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;
其次需要描述数据来源和数据分析的思路、方法和模型;
最后要重点呈现数据分析的过程、结论和建议。
4.大数据
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。
大数据的“大”是一个相对概念,10~100TB通常称为大数据的门槛。实际中,很多企业级用户把多个数据集放在一起,形成了PB级的数据量。
随着数据来源的多样化,数据的类型也更加复杂,如网络日志、音频、视频、图片和地理位置信息等。
大数据的意义在于:我们可以从如此庞杂的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域。
5.大数据分析的应用
大数据分析是指对规模巨大的数据进行分析。例如实时公交系统根据用户当前位置,迅速定位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实时位置。用户和车辆的位置信息通常通过卫星定位系统、Wi-Fi热点和基站的位置确定。
1.下列关于大数据的说法中错误的是( )。
A.从技术上看,大数据与云计算是密不可分的
B.大数据的最小基本单位是MB(兆字节)
C.通常需要对大数据进行专业化处理
D.通过对大数据的分析,可以为人类社会创造更多的价值
2.想要横向比较两条公交线路的客流量,分析哪一条线路更加繁忙,需要用哪种数据分析方法?( )
A.对比分析法 B.平均分析法
C.关联分析法 D.聚类分析法
3.气象部门想绘制某地区近十年来降雨量随时间逐年变化的图表,适合选用的图表类型是( )。
A.柱形图 B.饼图 C.散点图 D.折线图
4.下列选项中,不是数据分析作用的是( )。
A.了解事物的现状 B.方便数据的获取
C.剖析事物的发展历程 D.预测事物的未来走向
5.大数据是以( )、存取速度快、应用价值高为主要特点的数据集合。
A.容量大、类型单一 B.容量小、类型单一
C.容量大、类型多 D.容量小、类型多
5.2探秘人工智能
1.认识人工智能
(1)搜索
搜索:根据问题的实际,不断寻找可利用的知识,构造一条推理路线解决问题过程。
盲目搜索:按预定的控制策略进行搜索,而不考虑问题本身特性的搜索,一般适用于求解比较简单的问题。
启发式搜索:在搜索过程中加入估价函数等启发信息,不断自动调整搜索方向,加速求解进程。
路径规划:是启发式搜索的一种典型应用,如卫星定位、无人驾驶汽车等。
(2)人工智能
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境,获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。1950年,“图灵测试”揭开了人工智能的序幕。
人工智能可分类为:弱人工智能、强人工智能。
弱人工智能一般指实现特定功能的专用智能设备,不能真正实现推理和解决问题。
强人工智能是指真正能思考,有知觉、有自我意识的人类级别的智能机器。
2.揭秘智能算法
(1)机器学习
机器学习是当前人工智能的核心技术之一,目的是使计算机能模拟或实现人类的学习行为,获取新的知识或技能,重新组织已有的知识结构,从而不断完善自身的性能。
(2)人工智能、机器学习、深度学习关系
人工智能:让计算机像人一样去处理工作。
机器学习:运用算法来分析数据,从中学习、测定或预测现实世界的某些事。
深度学习:一种具体实现技术,源自人工神经网络。
(3)神经网络
神经网络是目前人工智能领域的研究热点之一,是一种模仿动物神经网络行为特征,进行并行信息处理的算法模型。
BP(Back Propagation)神经网络是目前应用最广泛的算法,它是一种按照误差逆向传播算法训练的多层前馈神经网络。结构如图所示:
人工智能领域的关键技术主要包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实与增强现实等。
人工智能的核心是算法,基础是数据,本质是计算。
(4)神经元芯片
神经元芯片是带有多个处理器、读写/只读存储器以及通信和I/O接口的单芯片系统,如2016年中国科学院计算技术研究所发布的寒武纪神经元芯片等。
(5)智能传感器
智能传感器是具有信息处理功能的传感器,带有微处理机,具备采集、处理、交换信息等功能,是传感器集成化与微处理机相结合的产物。
功能:属于人工智能的神经末梢,用于全面感知外界环境。
发展趋势:高敏度、高精度、高可靠性、微型化和集成化。
1.人工智能又称为( )。
A.M2M B.AI C.VR D.AR
2.被誉为国际“人工智能之父”的是( )。
A.图灵(Turing) B.费根鲍姆(Fegenbaum)
C.傅京孙(K.S.Fu) D.尼尔逊(Nilsso)
3.卫星定位、无人驾驶等应用中的路径规划,属于( )搜索的典型应用。
A.盲目式 B.启发式 C.全文式 D.分类式
4.某智能报警系统与电话相连,当有人非法进入时系统能通过电话通知主人,主人可以监听现场的声音,也可以启动现场报警。这是信息技术在哪方面的应用?( )
A.社区信息化 B.电子商务 C.电子政务 D.智能家居
5.下列选项中,不属于人工智能技术范畴的是( )。
A.AlphaGo击败世界围棋冠军李世石
B.手机的人脸识别解锁技术
C.使用在线翻译技术,将场景中的日文翻译成中文
D.与好友在微信中视频聊天
第5单元
5.1 1.B 2.A 3.D 4.B 5.C
5.2 1.B 2.A 3.B 4.D 5.D