资源详情

（新川教版）九上3.1《爬取网络信息》课件+教案(共31张PPT)

文档属性

名称	（新川教版）九上3.1《爬取网络信息》课件+教案(共31张PPT)
格式	zip
文件大小	10.2MB
资源类型	试卷
版本资源	川教版
科目	信息技术（信息科技）
更新时间	2021-10-12 16:36:13

点击下载

文档简介

中小学教育资源及组卷应用平台
九年级上册信息技术教学设计
课题《爬取网络信息》单元三单元学科信息技术年级九年级
学习目标 1.分析任务要达到的目标。2.学会将任务分解成小任务并梳理出方法和步骤。3.学会在Python中使用requests模块访问网络，获取信息。
重点将任务分解成小任务并梳理出方法和步骤。
难点在Python中使用requests模块访问网络，获取信息。
教学过程
教学环节教师活动学生活动设计意图
导入新课单元导入随着信息技术的迅速发展，互联网上涌现大量信息，网络爬虫可以有效地筛选并提取我们需要的信息。本单元同学们将通过完成“我的课外读物”项目，掌握Python网络爬虫的编写技术，学会处理和保存信息的方法。
二、新课导入
1、情景展示欢欢：老师，您给我们推荐了很多课外阅读书，我去网上查了一下，找到了书约内容简介、好评度和价格等信息，但是要一一去比较,好庥烦呢……老师：我有一个好方法。可以先用搜索引擎找到一个书目介绍网页，再用Python编写一个小程序，快速从这个网页上获双到书的各种信息。欢欢：Python真是太强大了。老师，快给我们讲讲怎么做吧！老师：好呀！但你不要着急，我们需要一步一步来完成这个任务。我们先来分析一下这个任务并梳理出实现的方法。2、学习目标（1）分析任务要达到的目标。（2）学会将任务分解成小任务并梳理出方法和步骤。（3）学会在Python中使用requests模块访问网络，获取信息。了解本单元的的学习内容观看小故事了解使学生对本单元的学习内容有一个大致的了解创设趣味的学习情境，更能激发学生的兴趣；明确本节课所学知识目标
讲授新课三、新知学习（一）、明确任务情景展示：欢欢：老师，我搜索了一下，有很多书目介绍的网站呢。老师：嗯，网上类似的网站很多，我给你推荐一个网页“好书推荐”,网址是“http://localhost/haoshu.html"。欢欢：这个网页上有好多书的介绍，还有好评数和价格呢。老师：对，你可以用程序把这个网页的信息获取下来，对信息进行筛选和整理，并且保存下来，还可以进行简单的处理，最后得到你起要的信息。欢欢：嗯，我明白了！我们要做一个表格来存储书籍的各种信息，如表3-1-1所示。按以下的过程来进行:1.搜索满足要求的网站;2.编写程序从网页获取信息；3.筛选出所需信息;4.将信息转化成表格的格式；5.保存信息;6.使用/分析信息。上面的过程可概括为获取信息、处理信息、保存信息、使用/分析信息等步骤。可以用这几个步骤来分析上面描述的过程，如图3-1-1所示。请同学们想一想，上图的括号中你觉得填入什么词合适呢（二）、实现方法根据上面的任务分析图，我们需要一些相关的知识才能完成各任务,如表3-1-2所示。表中的知识与方法，是我们编写爬虫程序的基础，表中列举的requests和BeautifulSoup模块请提前安装。只要掌握了这些知识，就可以编写出符合我们需求的爬虫程序。三、Python爬虫访问网页编写程序，让程序访问网络并获取我们需要的信息，这样的程序，我们叫它“网络爬虫”。首先，请从浏览器中打开“好书推荐”的网页，页面上有很多书，每本书有书籍名、内容简介、好评数、作者、价格等信息，如图3-1-2所示。在页面上点击右键，选择“查看页面源代码”，这些源代码就是一些纯文本。有如…,,…,

…

这些文本，它们叫Html标签，用来控制页面文本或者图片在网页中的显示，如图3-1-3所示。情景展示：欢欢：哇！好复杂！我们写爬虫程序是不是先要用程序把这些源代码“取”下来呢老师：我们使用requests模块的get函数可以获取这个页面的源代码。获取“好书推荐”页豆信息并显示的完整代码如课本所示。将上面代码保存为文件“我的课外读物.py”，然后执行。执行结果如图3-1-4所示。通过上面五条语句获取到网页的源代码。但是我们不需要全部的内容，只需要书籍名称及它的好评数和价格、作者、内容简介等信息。仔细观察源代码，发现书籍名称代码中有些相同的代码:…。这就是Html标签书籍名称不同，但标签中的class="title”却是相同的，我们使用class="uitle”做关键字来查找书籍名。再找找好评数、价格和内容简介的标签与关键字，统一大小写、规范填写。如表3-1-3所示。根据代码特征就可以从全部源代码中提取出我们需要的信息。这需要对‘xt文件中的“字符串”进行操作。七年级上学期我们了解到通过input函数获取到的数据默认是字符串类型，前面获取的页面源代码resTxt”也是一个字符串。下面我们来进一步了解字符串。小提示:字符串：在Python中，字符串通常都放在单引号或者双引号之中，如果字符串较长，甚至有分段，我们还可以使用三个单引号或者三个双引号，来将这种长字符串“包括”在其中。请同学们运行下面代码，观察运行结果，总结定义字符串的方式。从上面代码中，可以看出，定义字符串有4种不同的方式，请填写在下表中，如表3-1-4所示。四、拓展延伸网络爬虫及其作用网络爬虫，又被称为网页蜘蛛、网络机器人等。它的本质，是一种按照一定的规则，自动爬取网络信息的程序或脚本。网络爬虫帮助搜索引擎从互联网上读取网页，是搜索引擎最重要也是最基础的组成部分网络爬虫能快速、高效地帮助我们获取到有用的信息，特别是当我们需要从网络上大规模的获取某类信息时，网络爬虫将会使我们的工作事半功倍。所以，理解网络爬虫的基本原理，甚至能够自己编写爬虫，是我们生活在信息时代应该具备的技能。观看小故事学习，实践思考学习听老师讲解交流学习学习观看学习帮助学生明确任务，做到心中有数学生利用自主探究、小组合作、实践操作的方法去解决问题；师生直观演示更具说服力，加深印象。锻炼思维，培养表达能力了解实现方法培养学生举一反三、学习迁移的能力；鼓励学生尝试完成操作练习采用了分层教学法，关注学生差异，发展学生个性。帮助学生了解字符串拓展知识面
课堂小结五、课堂小结今天你有哪些收获？遇到了哪些困难？是怎么解决的？还有哪些困惑？分享交流学习反馈学会倾听
作业布置六、作业布置预习下一课《处理网络信息》。预习下一课培养自主学习能力
板书爬取网络信息明确任务实现方法Python爬虫访问网页
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页（共 2 页）
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)(共31张PPT)
九年级上册
爬取网络信息
随着信息技术的迅速发展，互联网上涌现大量信息，网络爬虫可以有效地筛选并提取我们需要的信息。
本单元同学们将通过完成“我的课外读物”项目，掌握Python网络爬虫的编写技术，学会处理和保存信息的方法。
我有一个好方法。可以先用搜索引擎找到一个书目介绍网页，再用Python编写一个小程序，快速从这个网页上获双到书的各种信息。
老师，您给我们推荐了很多课外阅读书，我去网上查了一下，找到了书约内容简介、好评度和价格等信息，但是要一一去比较,好庥烦呢……
好呀！但你不要着急，我们需要一步一步来完成这个任务。我们先来分析一下这个任务并梳理出实现的方法。
Python真是太强大了。老师，快给我们讲讲怎么做吧！
学习目标
01.分析任务要达到的目标。
02.学会将任务分解成小任务并梳理出方法和步骤
03.学会在Python中使用requests模块访问网络，获取信息
(一)、明确任务
嗯，网上类似的网站很多，我给你推荐一个网页“好书推荐”,网址是“http://localhost/haoshu.html"。
老师，我搜索了一下，有很多书目介绍的网站呢。
这个网页上有好多书的介绍，还有好评数和价格呢。
对，你可以用程序把这个网页的信息获取下来，对信息进行筛选和整理，并且保存下来，还可以进行简单的处理，最后得到你起要的信息。
嗯，我明白了！我们要做一个表格来存储书籍的各种信息，如表3-1-1所示。
表3-1-1 书籍信息清单表
书名好评数/个价格/元内容简介
水浒传 56082 26 《水浒传》是中国文学史上首部白话章回体小说，开创了中国百话文长篇小说的先河，与《红楼梦》《三国演义》《西游记》被合称为“中国古典文学四大名著”……
按以下的过程来进行:
4.将信息转化成表格的格式
6.使用/分析信息
5.保存信息
1.搜索满足要求的网站
3.筛选出所需信息
2.编写程序从网页获取信息
上面的过程可概括为获取信息、处理信息、保存信息、使用/分析信息等步骤。可以用这几个步骤来分析上面描述的过程，如图3-1-1所示。
1
请同学们想一想，上图的括号中你觉得填入什么词合适呢
(二)、实现方法
根据上面的任务分析图，我们需要一些相关的知识才能完成各任务,如表3-1-2所示。
表中的知识与方法，是我们编写爬虫程序的基础，表中列举的requests和BeautifulSoup模块请提前安装。只要掌握了这些知识，就可以编写出符合我们需求的爬虫程序。
(三)、Python爬虫访问网页
编写程序，让程序访问网络并获取我们需要的信息，这样的程序，我们叫它“网络爬虫”。
首先，请从浏览器中打开“好书推荐”的网页，页面上有很多书，每本书有书籍名、内容简介、好评数、作者、价格等信息，如图3-1-2所示。
在页面上点击右键，选择“查看页面源代码”，这些源代码就是一些纯文本。有如…,,…,

…

这些文本，它们叫Html标签，用来控制页面文本或者图片在网页中的显示，如图3-1-3所示。
我们使用requests模块的get函数可以获取这个页面的源代码。
哇！好复杂！我们写爬虫程序是不是先要用程序把这些源代码“取”下来呢
获取“好书推荐”页豆信息并显示的完整代码如下：
将上面代码保存为文件“我的课外读物.py”，然后执行。执行结果如图3-1-4所示。
通过上面五条语句获取到网页的源代码。但是我们不需要全部的内容，只需要书籍名称及它的好评数和价格、作者、内容简介等信息。
仔细观察源代码，发现书籍名称代码中有些相同的代码:…。这就是Html标签书籍名称不同，但标签中的class="title”却是相同的，我们使用class="uitle”做关键字来查找书籍名。再找找好评数、价格和内容简介的标签与关键字，统一大小写、规范填写。如表3-1-3所示。
根据代码特征就可以从全部源代码中提取出我们需要的信息。这需要对‘xt文件中的“字符串”进行操作。七年级上学期我们了解到通过input函数获取到的数据默认是字符串类型，前面获取的页面源代码resTxt”也是一个字符串。下面我们来进一步了解字符串。
小提示
字符串：在Python中，字符串通常都放在单引号或者双引号之中，如果字符串较长，甚至有分段，我们还可以使用三个单引号或者三个双引号，来将这种长字符串“包括”在其中。
请同学们运行下面代码，观察运行结果，总结定义字符串的方式。
从上面代码中，可以看出，定义字符串有4种不同的方式，请填写在下表中，如表3-1-4所示。
网络爬虫及其作用
网络爬虫，又被称为网页蜘蛛、网络机器人等。它的本质，是一种按照一定的规则，自动爬取网络信息的程序或脚本。网络爬虫帮助搜索引擎从互联网上读取网页，是搜索引擎最重要也是最基础的组成部分网络爬虫能快速、高效地帮助我们获取到有用的信息，特别是当我们需要从网络上大规模的获取某类信息时，网络爬虫将会使我们的工作事半
功倍。所以，理解网络爬虫的基本原理，甚至能够自己编写爬虫，是我们生活在信息时代应该具备的技能。
下课啦！

点击下载

同课章节目录

点击下载

VIP下载