中小学教育资源及组卷应用平台
九年级上册信息技术教学设计
课题 《爬虫中的法律和道德》 单元 三单元 学科 信息技术 年级 九年级
学习目标 1.了解编写爬虫程序可能带来的法律和道德问题。2.了解并遵守爬虫道德规范。
重点 编写爬虫程序可能带来的法律和道德问题。
难点 遵守爬虫道德规范。
教学过程
教学环节 教师活动 学生活动 设计意图
导入新课讲授新课 新课导入1、情景导入爬虫所带来的道德风险与法律责任你了解多少?播放视频。学习目标(1)了解编写爬虫程序可能带来的法律和道德问题。(2)了解并遵守爬虫道德规范。二、新知讲解(一)、《中华人民共和国网络安全法》全国人民代表大会常务委员会在2016年11月7日通过了《中华人民共和国网络安全法》,2017年6月1日正式实施。法律规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息;爬取数据过程中不应侵犯他人的知识产权。我们在编写爬虫程序时,一定要遵守相关道德准则和法律法规。三、案列分享案列一情景展示:欢欢:爬虫真好玩,我准备在我的个人网站上加个“欢欢推荐四川旅游”栏目。把九寨沟、杜甫草堂等这些四川风景名胜景区的相关评价“爬”取出来放到这个栏目上,这样我的网站访问量肯定会大大提升。乐乐:恩,好主意,还可以再加个“乐乐推荐四川美食”分析:公开的数据不一定被允许用于第三方盈利,这样可能会面临法律风险。成熟的大数据公司在爬取并使用一个网站的数据时,一般都需要专业的律师进行审核,看是否有禁止爬取或者禁止用于商业用途的相关内容。(二)案例二情景展示:欢欢:这次半期考试的成绩我们只能看到自己的,看不到其他人的,我想知道我在年级上排名多少呢。乐乐:我写了一个爬虫程序从学校教务处的网站上爬取到了所有人的半期考试成绩,再进行加工处理,可以看到每个人每个学科的成绩,还有排名呢。我到时候发一份给你看看。分析:每个人只能通过登录自己的账号查看自己的成绩。编写程序爬取所有人的成绩,甚至公开数据,可能违反学校相关规定。(三)案例三情景展示:互联网公司A向网络用户提供生活服务App,主要内容是商户基本信息及点评信息。互联网公司B使用技术手段在此App上爬取了商户的基本信息及点评信息,用户使用其运营的地图App查询位置时,无须跳转至A公司运营的生活服务App界面,就可直接在地图App界面获取商户的基本信息和点评信息。分析:互联网公司B使用技术手段爬取并使用互联网公司A软件平台的用户点评等内容,被认定为构成不正当竞争。四、拓展阅读如何查看Robots协议R obots协议,又称作爬虫协议,全名是网终肥虫排除标准(RobotsExclusion Protocol),用来告诉爬虫和搜索引擎哪些页面可以爬取,哪些不可以爬取,通常是一个robots.txt文本文件,一般放在网站的根目录下。搜索引擎爬虫爬取的网站的第一个文件便是Robots文件,可以在浏览器的地址栏上使用“主域名/robots.txt”来查看,如图3-3-1所示。在图3-3-1中我们可以看到里面有很多脚本语言,主要是下面两种:1.User-agent:爬虫名称代表下面设置的规则对这个“爬虫名称”是有效的,如果有很多条的“User-agent:”,就会有多个爬虫受到限制。如“User-agentBaiduspider",是指对百度爬虫有限制。2.Disallow:目录指定不允许爬取的目录,如果只为/,则表示不允许爬取所有页面。如“Disallow:/baidu"。除了这两种,你可能会在其他的测试链接看到“Allow”。3.Allow:目录指定允许爬取的目录,用来排除某些限制、一般是和Disallow一起使用,不会单独使用。 观看视频了解本节课的学习内容学习观看案例观看学习案例二观看学习了解如何查看Robots协议探索学习 创设情景,激发学习兴趣使学生对本节课的学习内容有一个大致的了解了解《中华人民共和国网络安全法》了解公开的数据不一定被允许用于第三方盈利,这样可能会面临法律风险。了解编写程序爬取所有人的成绩,甚至公开数据,可能违反学校相关规定增加知识面了解如何查看Robots协议增加知识面
课堂小结 五、课堂小结今天你有哪些收获?遇到了哪些困难?是怎么解决的?还有哪些困惑? 分享交流 学习反馈学会倾听
作业布置 六、作业布置 复习本学习所学知识与技能。 复习 培养自主学习能力
板书 第3节 爬虫中的法律和道德学习目标《中华人民共和国网络安全法》案列分享如何查看Robots协议
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://www.21cnjy.com/" 21世纪教育网(www.21cnjy.com)(共23张PPT)
九年级上册
爬虫中的法律和道德
爬虫中的法律和道德
(1)了解编写爬虫程序可能带来的法律和道德问题。
(2)了解并遵守爬虫道德规范。
学习目标
《中华人民共和国网络安全法》
全国人民代表大会常务委员会在2016年11月7日通过了《中华人民共和国网络安全法》,2017年6月1日正式实施。
01
法律规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息;爬取数据过程中不应侵犯他人的知识产权。
02
我们在编写爬虫程序时,一定要遵守相关道德准则和法律法规。
03
案例一
恩,好主意,还可以再加个“乐乐推荐四川美食”。
爬虫真好玩,我准备在我的个人网站上加个“欢欢推荐四川旅游”栏目。把九寨沟、杜甫草堂等这些四川风景名胜景区的相关评价“爬”取出来放到这个栏目上,这样我的网站访问量肯定会大大提升。
公开的数据不一定被允许用于第三方盈利,这样可能会面临法律风险。成熟的大数据公司在爬取并使用一个网站的数据时,一般都需要专业的律师进行审核,看是否有禁止爬取或者禁止用于商业用途的相关内容。
案例二
我写了一个爬虫程序从学校教务处的网站上爬取到了所有人的半期考试成绩,再进行加工处理,可以看到每个人每个学科的成绩,还有排名呢。我到时候发一份给你看看。
这次半期考试的成绩我们只能看到自己的,看不到其他人的,我想知道我在年级上排名多少呢。
每个人只能通过登录自己的账号查看自己的成绩。编写程序爬取所有人的成绩,甚至公开数据,可能违反学校相关规定。
案例三
互联网公司A向网络用户提供生活服务App,主要内容是商户基本信息及点评信息。互联网公司B使用技术手段在此App上爬取了商户的基本信息及点评信息,用户使用其运营的地图App查询位置时,无须跳转至A公司运营的生活服务App界面,就可直接在地图App界面获取商户的基本信息和点评信息。
互联网公司B使用技术手段爬取并使用互联网公司A软件平台的用户点评等内容,被认定为构成不正当竞争。
如何查看Robots协议
R obots协议,又称作爬虫协议,全名是网终肥虫排除标准(RobotsExclusion Protocol),用来告诉爬虫和搜索引擎哪些页面可以爬取,哪些不可以爬取,通常是一个robots.txt文本文件,一般放在网站的根目录下。
搜索引擎爬虫爬取的网站的第一个文件便是Robots文件,可以在浏览器的地址栏上使用“主域名/robots.txt”来查看,如图3-3-1所示。
在图3-3-1中我们可以看到里面有很多脚本语言,主要是下面三种:
01
User-agent:爬虫名称
02
Disallow:目录
03
Allow:目录
1.User-agent:爬虫名称
代表下面设置的规则对这个“爬虫名称”是有效的,如果有很多条的“User-agent:”,就会有多个爬虫受到限制。如“User-agentBaiduspider",是指对百度爬虫有限制。
2.Disallow:目录
指定不允许爬取的目录,如果只为/,则表示不允许爬取所有页面。如“Disallow:/baidu"。
3.Allow:目录
指定允许爬取的目录,用来排除某些限制、一般是和Disallow一起使用,不会单独使用。
谢谢观看!
谢谢观看!