信息技术基础第二章:第1节 人工智能与OCR技术课件(15张幻灯片)+试题

文档属性

名称 信息技术基础第二章:第1节 人工智能与OCR技术课件(15张幻灯片)+试题
格式 zip
文件大小 3.6MB
资源类型 教案
版本资源 通用版
科目 信息技术(信息科技)
更新时间 2019-05-23 14:22:02

文档简介


第1节 人工智能与OCR技术
知识点
目标
考试要求
1.计算机的基本功能与特征
b
必考
2.智能处理
①语音识别
②字符识别
③机器翻译和自然语言处理
b
1.人工智能是计算机科学的一个分支。主要研究用机器来模拟和执行人脑的某些智力功能,并开发相关理论和技术。它主要包含语音识别、字符识别和机器翻译等。
2.汉字输入分为人工键入(键盘输入)和自动输入两种方法。自动输入又有语音识别和字符识别等输入方法,汉字识别技术可以分为印刷体汉字识别和手写体汉字识别技术。
3.OCR(光学字符识别软件)是一款汉字识别技术的软件,从图像中识别出文字,对扫描的印刷体文字识别率较高。
4.OCR技术识别对象的文件类型:BMP、JPEG、TIF等,识别结果的文件类型:TXT。
5.OCR技术影响识别正确率的因素:图片的扫描分辨率,图片是否倾斜、颠倒等位置摆放问题及图片的内容。
一、人工智能的概念及应用
人工智能在于研究用机器来模仿和执行人脑的某些智力功能,并开发相关理论和技术。
1.语音识别。主要有通过语音来执行某个动作和把语音转换成文字两大类。如手机语音智能拨号、微信中把说话的语音转换成文字、搜狗语音助手、百度语音等。但要注意导航等语音播报不属于语音识别。
2.字符识别。主要包括手写字符和标准字符识别两大类,主要的功能是把图片中文字转换成可以编辑的文字。如手机等设备的手写输入,OCR文字识别(对汽车牌照电子摄像,书籍扫描成图片并转换为文本等)
3.机器翻译。把一国语音或文字的语言翻译成另一国语言,或者把方言翻译成普通话或文字。
4.机器人系列。机器对弈,机器人送餐,机器人扫地等。
5.指纹、虹膜、人脸等人类器官识别。通过对人类器官特征的识别来鉴定身份。
6.图片识别。如百度识图(百度对图片的搜索),相机跟踪人脸并自动对焦,Photoshop、Facebook Messenger等软件的智能处理等。
【例1】 某电子产品能将地方方言和少数民族语言的语音转换为汉字。这一产品主要运用的技术是(  )
A.语音识别 B.机器翻译
C.字符识别 D.虚拟现实
解析 本题考核的知识点是人工智能。将不能理解的语言转换为可以理解的汉字,称为翻译。
答案 B
[方法总结] 熟记人工智能可以运用的场合,是解决这类问题的关键。
【变式训练】 下列属于人工智能的是(  )
A.网站自动统计歌曲下载次数
B.相机在拍摄时,会自动对焦到人脸
C.进出商店门口的“欢迎光临”语音播报
D.在Word文档中,使用查找替换功能把“English””全部替换为“英语”
答案 B
二、OCR文字识别技术
1.属于人工智能的一种,适合识别图片文件中的印刷体文字,并存储为文本文件。
2.影响识别正确率的因素有:①是手写体还是印刷体;②图片有无颠倒或倾斜;③图片的分辨率高低情况。
3.基本步骤有:①打开图片文件或扫描图片;②版面分析(选择识别范围);③识别;④校对;⑤保存。
4.版面分析能识别区域中的横排正文、竖排正文、表格、图等,把图片按内容划成一块块识别区域以提高识别正确率。
【例2】 下列对于OCR文字识别技术识别正确率说法不正确的是(  )
A.对手写体的汉字,识别正确率不高
B.只能识别简体汉字,不能识别繁体汉字
C.能识别除宋体外的常见字体的简体汉字
D.对于中英文混排的文字识别正确率低于纯汉字识别率
解析 OCR识别图片中文字的本质是把图片分割成一个个单独的文字,再把分割的图形与库中文字的外形对比,找到相似度较高的文字,并输出为文本文件。因此对于每个人书写写的习惯不一样,对比的难度较大,繁体汉字、其他字体的汉字,也有相应的字库,是可以识别的,对于混排情况,识别的库是不一样的,因此识别率会低于单纯的字库。
答案 B
【变式训练】 一般情况,下列图片中文字识别率最高的是(  )
A.合金元素作用:①增大钢的淬透性。除Co外,几乎所有合金元素如 Mn、Mo、Cr、Ni、Si和C、N、B等都能提高钢的淬透性,其中 Mn、Mo、Cr、B作用最强。
B.早在1798年,英国经济学家马尔萨斯就提出了自然状态下的人口增长模型:y=y0ert,其中t表示经过的时间,y0表示t=0时的人口数
C.
D.汉字基本笔划的变化,印刷体字体的规范性较强,其笔划基本上都是横平竖直的,笔划的拐角处大都是锐角、直角或尖锐的钝角
答案 D
【例3】 下图是用OCR软件识别某个图片时的界面,
对上述识别的过程,理解不正确的是(  )
A.识别的结果保存在SAMPLEJT2.TXT文件中
B.当前识别的区域中有表格
C.图中“2”指向加方框的为识别前的文字
D.鼠标单击“1”左侧的文字“主”,“2”指向的方框不会发生移动
答案 D
1.下列有关手机的使用,体现了人工智能的是(  )
A.用指纹解锁手机上的屏保密码
B.利用手机上的QQ进行语音聊天
C.手机10秒内没有使用,会自动进入屏保
D.用手机拍摄旅游景点的名称,便于撰写游记
答案 A
2.长按微信中语音,选择“转换为文字(仅普通话)”的命令,会出现有关该语音的文字。主要运用的技术是(  )
A.语音识别 B.机器翻译
C.字符识别 D.虚拟现实
答案 A
3.某银行系统利用人的相貌特征代替传统的钥匙或密码,可以防止盗用钥匙或密码打开金库的行为。这主要体现了信息技术中的(  )
A.语音识别 B.机器翻译
C.字符识别 D.人脸识别
答案 D
4.下列应用中,体现了人工智能技术的是(  )
A.使用在线二维码生成器制作二维码
B.拨打中国移动语音查询热线,并获取话费信息
C.在Word文档中输入“不齿下问”会自动变为“不耻下问”
D.使用扫描笔内置的朗读功能对扫描到的中英文进行实时朗读
答案 D
5.下列应用中,没有体现了人工智能技术的是(  )
A.银行通过拍摄图像进行远程身份认证
B.扫描图书中文字并保存为图片
C.在手机中用手写输入的方法进行微信聊天
D.利用语音控制器控制智能电视并选择电视节目
答案 B
6.下列对于OCR软件中版面分析功能理解不正确的是(  )
A.有助于提高识别正确率
B.把图片划分成一个个识别区域
C.能识别区域中的横排正文、竖排正文、表格、图片等
D.即使使用了版面分析功能,还必须重新选择识别区域,才能进行文字识别
答案 D
7.写出下列提高OCR识别正确率的方法:
原因
处理办法
图片上下颠倒
图片左右颠倒
图片倾斜
分辨率太低
答案 将图片垂直翻转 将图片水平翻转 将图片进行倾斜校正 调高分辨率,进行扫描
8.用OCR软件识别某文件中文字的界面如下图所示:
根据以上内容,回答下列问题
(1)识别后的主文件名与识别前是一致的,则识别前的文件名可能是________________(多选)
A.sam.bmp B.sam.tif
C.sam.rtf D.sam.txt
(2)识别前的图片和识别后的文字分别是图中数字__________、__________ 所指的内容。
(3)当前所处的步骤是______________________。
(4)图中的“相似字”一栏指的是________。
A.识别前的图片内容
B.识别后的文本
C.识别过程中与图片相似的文字
答案 (1)AB (2)2 1 (3)文字校正 (4)C
1.中国“神威·太湖之光”计算机每秒超过10亿亿次的超级计算,可以在30天内完成未来100年地球气候模拟。这事例说明了计算机的特征是(  )
A.运算速度快 B.准确性高
C.存储容量大 D.稳定性好
答案 A
2.下列应用中,没有体现了人工智能技术的是(  )
A.机器人AlphaGo与人对弈
B.利用人眼虹膜进行考勤
C.用拼音输入法,规划导航线路
D.在网络搜索引擎中用手写的方式输入关键词,并进行信息搜索
答案 C
3.下列应用中,没有用到OCR技术的是(  )
A.测速点获取超速汽车牌照
B.扫描银行卡的数字,并获取账号信息
C.利用邮件自动分拣系统提高信函分拣速度
D.在Photoshop软件中,利用魔棒获取相同颜色的文字
答案 D
4.某手机软件会自动扫描手机图片库中的照片,识别你的朋友们,每次拍照后,它会将这张照片发给照片中的朋友们。以上事例说明(  )
A.该事例的功能类似于停车场车牌识别技术
B.识别图片库中的朋友属于信息的表达
C.这是面部识别技术具体应用,属于虚拟现实
D.识别手机图片库中的朋友,这一过程可以不使用网络技术
答案 D
5.用手机扫一扫景点介绍牌上的“二维码”,就能立即用语音朗读该景区游览线路、景点介绍等相关信息。下列说法正确的是(  )
A.该过程主要体现了语音识别的应用
B.该过程中应用到多媒体技术和网络通信技术
C.即使手机没有上网功能,也能正常进行语音朗读
D.该二维码中包含了景区游览线路、景点介绍等相关信息
答案 B
6.百度识图通过图像底层局部特征的比对,具备寻找相同或近似图像的能力,并能根据互联网上存在的相同图片资源猜测用户上传图片的对应文本内容。下列有关百度识图说法不正确的是(  )
A.这是人工智能的具体应用之一
B.百度识图想要获取的信息是图片
C.百度识图比对的信息来自网上数据库
D.这是通过搜索引擎来获取信息的方法
答案 B
7.某软件使用时的界面如图所示,该软件最有可能采用的技术是(  )
A.语音识别 B.手写文字识别
C.机器翻译 D.光学字符识别
答案 B
8.机器人AlphaGo集合了3 000万种职业棋手的下法,经过数百万次深度学习,其智能十分接近人类大脑。根据上述材料,下列说法不正确的是(  )
A.现代信息技术是无所不能的
B.机器人AlphaGo在围棋比赛中对战属于人工智能的应用
C.机器人下棋实际上是用计算机语言实现算法的过程
D.机器人AlphaGo数百万次深度学习,最终战胜世界冠军,说明信息可以被加工处理。
答案 A
9.小明使用OCR软件进行字符识别,部分界面如图所示,
下列说法不正确的是(  )
A.“Oracle.jpg”文件还未进行识别
B.通过手动输入可将识别结果中的“课”字进行修正
C.识别对象的文件类型可以是jpg、bmp和psd等
D.通过扫描得到“Bl.jpg”文件是信息采集的过程
答案 C
10.某用户用OCR软件进行文字识别,操作界面如图所示,下列说法正确的是(  )
A.除BMP类型外,OCR软件还能打开JPG、GIF等类型的图片素材
B.若要取消已划分的识别区域,可使用的命令是清除区域
C.对所选区域进行识别后,默认会自动生成“报纸.txt”文件
D.当前状态下,点击“识别”按钮,将识别整个图片中的文字
答案 A
11.谷歌助理让我们摆脱了传统的搜索引擎,当你询问“金刚狼”这部电影时,会得到相关的影评,最后对它说“我想要2张今晚8:30的电影票”,即可完成购买。谷歌助理主要应用的技术是(  )
A.机器翻译 B.图像识别
C.语音识别 D.OCR文字识别
答案 C
12.下列说法中,不正确的是(  )
A.淘宝造物节上首次亮相的有“大脑”的无人零售店“淘咖啡”,这使用了人工智能技术
B.扫描二维码这个过程应用了基于内容检索的技术
C.在网上浏览故宫博物馆,如同身临其境般感知其内部的方位和物品,应用了虚拟现实技术
D.某同学要去西藏自助游,利用搜索引擎查找资料,这一过程主要应用了多媒体技术
答案 D
课件15张PPT。第1节 人工智能与OCR技术1.__________是计算机科学的一个分支。主要研究用机器来模拟和执行人脑的某些智力功能,并开发相关理论和技术。它主要包含__________、__________和机器翻译等。
2.汉字输入分为_____________________________两种方法。自动输入又有____________________等输入方法,汉字识别技术可以分为_____体汉字识别和_____体汉字识别技术。人工智能语音识别字符识别人工键入(键盘输入)和自动输入语音识别和字符识别印刷手写3.OCR(光学字符识别软件)是一款汉字识别技术的软件,从图像中识别出文字,对扫描的____________识别率较高。
4.OCR技术识别对象的文件类型:______、______、_____等,识别结果的文件类型:_____。
5.OCR技术影响识别正确率的因素:图片的扫描_______,图片是否倾斜、颠倒等位置摆放问题及图片的内容。印刷体文字BMPJPEGTIFTXT分辨率一、人工智能的概念及应用
人工智能在于研究用机器来模仿和执行人脑的某些智力功能,并开发相关理论和技术。
1.语音识别。主要有通过语音来执行某个动作和把语音转换成文字两大类。如手机语音智能拨号、微信中把说话的语音转换成文字、搜狗语音助手、百度语音等。但要注意导航等语音播报不属于语音识别。2.字符识别。主要包括手写字符和标准字符识别两大类,主要的功能是把图片中文字转换成可以编辑的文字。如手机等设备的手写输入,OCR文字识别(对汽车牌照电子摄像,书籍扫描成图片并转换为文本等)
3.机器翻译。把一国语音或文字的语言翻译成另一国语言,或者把方言翻译成普通话或文字。4.机器人系列。机器对弈,机器人送餐,机器人扫地等。
5.指纹、虹膜、人脸等人类器官识别。通过对人类器官特征的识别来鉴定身份。
6.图片识别。如百度识图(百度对图片的搜索),相机跟踪人脸并自动对焦,Photoshop、Facebook Messenger等软件的智能处理等。【例1】 某电子产品能将地方方言和少数民族语言的语音转换为汉字。这一产品主要运用的技术是(  )
A.语音识别 B.机器翻译
C.字符识别 D.虚拟现实
解析 本题考核的知识点是人工智能。将不能理解的语言转换为可以理解的汉字,称为翻译。
答案 B
[方法总结] 熟记人工智能可以运用的场合,是解决这类问题的关键。【变式训练】 下列属于人工智能的是(  )
A.网站自动统计歌曲下载次数
B.相机在拍摄时,会自动对焦到人脸
C.进出商店门口的“欢迎光临”语音播报
D.在Word文档中,使用查找替换功能把“English””全部替换为“英语”
答案 B二、OCR文字识别技术
1.属于人工智能的一种,适合识别图片文件中的印刷体文字,并存储为文本文件。
2.影响识别正确率的因素有:①是手写体还是印刷体;②图片有无颠倒或倾斜;③图片的分辨率高低情况。
3.基本步骤有:①打开图片文件或扫描图片;②版面分析(选择识别范围);③识别;④校对;⑤保存。
4.版面分析能识别区域中的横排正文、竖排正文、表格、图等,把图片按内容划成一块块识别区域以提高识别正确率。【例2】 下列对于OCR文字识别技术识别正确率说法不正确的是(  )
A.对手写体的汉字,识别正确率不高
B.只能识别简体汉字,不能识别繁体汉字
C.能识别除宋体外的常见字体的简体汉字
D.对于中英文混排的文字识别正确率低于纯汉字识别率解析 OCR识别图片中文字的本质是把图片分割成一个个单独的文字,再把分割的图形与库中文字的外形对比,找到相似度较高的文字,并输出为文本文件。因此对于每个人书写写的习惯不一样,对比的难度较大,繁体汉字、其他字体的汉字,也有相应的字库,是可以识别的,对于混排情况,识别的库是不一样的,因此识别率会低于单纯的字库。
答案 B【变式训练】 一般情况,下列图片中文字识别率最高的是(  )
A.合金元素作用:①增大钢的淬透性。除Co外,几乎所有合金元素如 Mn、Mo、Cr、Ni、Si和C、N、B等都能提高钢的淬透性,其中 Mn、Mo、Cr、B作用最强。
B.早在1798年,英国经济学家马尔萨斯就提出了自然状态下的人口增长模型:y=y0ert,其中t表示经过的时间,y0表示t=0时的人口数C.
D.汉字基本笔划的变化,印刷体字体的规范性较强,其笔划基本上都是横平竖直的,笔划的拐角处大都是锐角、直角或尖锐的钝角
答案 D【例3】 下图是用OCR软件识别某个图片时的界面,对上述识别的过程,理解不正确的是(  )
A.识别的结果保存在SAMPLEJT2.TXT文件中
B.当前识别的区域中有表格
C.图中“2”指向加方框的 为识别前的文字
D.鼠标单击“1”左侧的文字“主”,“2”指向的方框不会发生移动答案 D
同课章节目录