沪教版(2019) 高中信息技术 必修1:项目9 了解手写数字识别——体验人工智能 课件(共37张PPT,内嵌视频素材)

文档属性

名称 沪教版(2019) 高中信息技术 必修1:项目9 了解手写数字识别——体验人工智能 课件(共37张PPT,内嵌视频素材)
格式 pptx
文件大小 89.9MB
资源类型 教案
版本资源 沪科版(2019)
科目 信息技术(信息科技)
更新时间 2023-05-15 16:57:47

图片预览

文档简介

(共37张PPT)
了解手写数字识别
--体验人工智能
范欣丽
项目九
项目学习目标02.了解人工智能的发展01.了解什么是人工智能即机器学习03.认识人工智能对社会的作用及影响04.了解机器学习的一般过程1.初识字符识别技术2.了解机器学习中数据采集与预处理3.建立手写数字识别模型并进行验证1.初识字符识别技术人工智能,发展及应用初识字符识别技术
人工智能根据中国《人工智能标准化白皮书(2018)》中的定义,人工智能是利用计算机或者计算机控制的机器,模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
什么是人工智能
计算机是如何判断手写内容是什么字的?借助什么软件?
思考
初识字符识别技术
人工智能的发展阶段
初识字符识别技术
从技术角度,通常把人工智能的主要发展阶段分为:运算智能、感知智能和认知智能。
认知智能
让机器像人那样能理解会思考
具有主动思考并采取行动等能力。
价值:
机器可以辅助或替代人类工作。
感知智能
让机器像人那样感知
具有视觉、听觉、触觉等感知能力。
价值:
机器能听懂人类语言,看懂世间万物
帮助人类高效地完成相关工作。
运算智能
让机器像人那样能记(存)会算
具有快速运算能力和记忆存储能力。
价值:
机器能存储和快速处理海量数据。
运算智能是感知智能和认知智能的基础。
人工智能的主要应用领域
初识字符识别技术
人工智能已成为新一轮科技革命和产业革命的核心驱动力,催生了大量新的技术、产品、产业。在语音识别、机器视觉、数据挖掘等多个领域,人工智能已走进了实际应用场合。主要集中在个人助理,安防、自动驾驶、医疗健康、电商零售、金融、教育等
2.了解机器学习中数据采集与预处理机器学习、一般过程
人为什么认识字?为什么人也有认不出他人写的字的情况?计算机有这种情况吗?
提问
了解机器学习中数据采集与预处理
机器学习
机器学习是人工智能的核心研究领域之一,它研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,从而不断改善自身的性能。
近年来,机器学习在许多应用领域中均发挥了重要作用,极大地推动了社会的进步,机器学习在不同产业发挥着不同的作用
了解机器学习中数据采集与预处理
了解机器学习中数据采集与预处理
如此重复多少遍以后,你才能认出种字体?
提问
了解机器学习中数据采集与预处理
机器学习要解决的问题分类
根据要解决的问题可以分为分类(识别)和回归(预测)两类。
根据已有数据可以分为监督学习和无监督学习
了解机器学习中数据采集与预处理
标注:对采集来的数据进行类别(分类)或数值(回归)的指定。通常这个工作是由人工完成。
机器学习根据已有数据的分类
了解机器学习中数据采集与预处理
采集
数据
建立
模型
验证
模型
评估
模型
应用
模型
机器学习的一般过程
了解机器学习中数据采集与预处理
在手写字体识别中,最简单的当属手写数字识别,但这对计算机来说却仍然颇具挑战性。针对手写数字识别,人们开发了可用于机器学习的MNIST数据集。作为机器学习的入门学习者,我们将直接使用现成的MNIST数据集。
验证集合
Validation
5000张
5
训练集合
Train
5500张
4
测试样本Test
10000张
3
训练样本
60000张
2
采集样本
70000张
1
采集的样本使用分配
用于训练以建立模型
用于测试训练效果以验证模型
用于评估最终模型
1.采集数据
MNIST数据集
训练样本
测试样本
Train集合
Validation集合
Test集合
用于评估最终模型
用于测试训练效果以验证模型
用于训练以建立模型
了解机器学习中数据采集与预处理
1.采集数据
了解机器学习中数据采集与预处理
采集到的700000张样本图片,每一张都代表了从0到9中一个数字,所有的数字都出现在图片的正中间。
2.数据预处理
这些图片并非二值图像,而是灰度图像。每一张图片都由28×28个像素点组成,每个像素点用一个灰度值表示。但是这样的灰度图像并不能直接用于机器学习,必须先要对它进行向量化。
灰度图像是用0来表示白色,用1表示黑色,中间名级别的灰色用(0,1)中的相应小数来表示的图像。
二值图像是指像素点的值只能为0或1的图像。
了解机器学习中数据采集与预处理
把各种灰度的像素点转换成具体的数值,就可以得到一个矩阵。把矩阵中除第一行外的每一行依次接在前一行之后,可以得到一个长度为784(28×28)的一维数组,该数组中的每一个元素与图片像素矩阵中的每一个数字是一一对应的。
这样就完成了图片的向量化。对所有的训练样本和测试样本进行同样的向量化处理,就得到了手写数字识别算法所需要的输入样本。
了解机器学习中数据采集与预处理
MNIST数据集可直接在MNIST数据集官方网站下载。在Python语言中,有一些第三方工具,可用来方便地读入 MNIST数据集,并直接完成向量化。
通过以下这行代码,可以读取MNIST数据集。注意先要将下载的数据集存放在指定路径中。
MNIST=input_data.read_data_sets("MNIST_data"one_hot=True)
3.建立手写数字识别模型并进行验证深度学习建立手写数字识别模型并进行验证
战胜人类职业围棋棋手的原因在于其拥有强大的深度学习和搜索运算的能力
建立手写数字识别模型的过程,就是对Train 集合训练的过程,建立的模型其实就是从样本数据中学习得到的结果。
由于大数据的不断积累和计算机性能的提升,基于多层神经网络的深度学习算法表现出更强劲的性能。
建立手写数字识别模型并进行验证
建立手写数字识别模型并进行验证
深度学习的主要算法之一----卷积神经网络,在图像分类上有非常出色的表现,这里用Python语言通过卷积神经网络来建立和验证模型
深度学习——卷积神经网络
for i in range(10000):
batch=MNIST.train.next_batch(100)
If i%200==0:
Print("当前迭代次数为%d,训练正确率为%g"%(i,accuracy.eval
(feed_dict={x:batch[0], y_:batch[1],keep_prob: 1.0})))
train_step.run(feed_dict={x:batch[0],y_: batch[l],keep_prob: 0.5})
训练过程的主要代码如下所示:
建立手写数字识别模型并进行验证
for i in range(10000):
batch=MNIST.train.next_batch(100)
if i%200==0:
print("当前迭代次数为%d,训练正确率为%g"%(i,accuracy.eval
(feed_dict={x:batch[0], y_:batch[1],keep_prob: 1.0})))
train_step.run(feed_dict={x:batch[0],y_: batch[l],keep_prob: 0.5})
第1行代码
设置了一个参数,利用for循环即总的迭代次数为10000次;
建立手写数字识别模型并进行验证
for i in range(10000):
batch=MNIST.train.next_batch(100)
if i%200==0:
print("当前迭代次数为%d,训练正确率为%g"%(i,accuracy.eval
(feed_dict={x:batch[0], y_:batch[1],keep_prob: 1.0})))
train_step.run(feed_dict={x:batch[0],y_: batch[l],keep_prob: 0.5})
第2行代码
设置了另一个参数,即每次送入卷积神经网络中进行训练的图片数为100张;
建立手写数字识别模型并进行验证
for i in range(10000):
batch=MNIST.train.next_batch(100)
if i%200==0:
print("当前迭代次数为%d,训练正确率为%g"%(i,accuracy.eval
(feed_dict={x:batch[0], y_:batch[1],keep_prob: 1.0})))
train_step.run(feed_dict={x:batch[0],y_: batch[l],keep_prob: 0.5})
第3-5行代码
设置了第三个参数,即每间隔200次迭代,在控制台输出当前迭代次数下模型的识别正确率;
建立手写数字识别模型并进行验证
for i in range(10000):
batch=MNIST.train.next_batch(100)
if i%200==0:
print("当前迭代次数为%d,训练正确率为%g"%(i,accuracy.eval
(feed_dict={x:batch[0], y_:batch[1],keep_prob: 1.0})))
train_step.run(feed_dict={x:batch[0],y_: batch[l],keep_prob: 0.5})
第6行代码
train_step.run是最关键的进行训练的代码,它针对当前批次的样本进行训练,得出相应模型。
4.建立手写数字识别模型并进行验证建立手写数字识别模型并进行验证
0
1
9


8
1.8%
94.3%
0.9%

样本
可能性
识别器
识别结果
建立手写数字识别模型的过程,就是对Train 集合训练的过程,建立的模型其实就是从样本数据中学习得到的结果。整个训练结束后,可以用TEST集合评估最终模型的识别正确率。
建立手写数字识别模型并进行验证
1.日常生活中,你还知道哪些应用或产品的背后人工智能的支持?
2.人工智能在推进社会发展的同时也带来了挑战,作为学生,应该如何规划人工智能时代的未来生活
提问
建立手写数字识别模型并进行验证
作用 影响
1、人工智能是引领未来的战略技术,是国际竞争的新焦点。 1、人工智能是一种影响广泛的颠覆性技术,它可能改变就业结构、冲击法律与社会伦理、侵犯个人隐私、挑战国家关系准则等问题。
2、人工智能将人从枯燥的劳动中解放出来,越来越多简单、重复、危险的任务可以由机器完成,它还能够比人做得更快、更准确。 2、人工智能的发展是建立在大数据的信息技术应用之上,这不可避免地涉及个人信息的合理使用问题,而且人工智能技术的发展也让侵犯个人隐私的行为变得更为便利。
3、人工智能在教育、医疗、金融、养老、环境保护、城市运行等领域的广泛作用,能够全面提升人们的生活品质,引发经济结构的重大变革,实现社会生产力的整体跃升,并给人们的生产生活方式和思维模式带来革命性变化。
人工智能的作用和影响
总结
请给自己评价 是/否,几颗星
能说出人工智能的概念吗
了解人工智能的发展阶段吗
可以正确看待人工智能带来的挑战吗
自我评价单
下课