中小学教育资源及组卷应用平台
川教版信息技术九年级上册《爬虫中的法律和道德》教学设计
课题 爬虫中的法律和道德 单元 三 学科 信息技术 年级 九年级
学习 目标 了解编写爬虫程序可能带来的法律和道德问题。 了解并遵守爬虫道德规范。
重点 爬虫道德规范
难点 遵守爬虫道德规范
教学过程
教学环节 教师活动 学生活动 设计意图
导入新课 学习完网络爬虫的知识,我们可以在网络上更好的获取所需要的信息,在获取信息的过程中需要注意什么? 在编写爬虫程序获取信息的过程中要遵守相关的道德准则和法律法规,接下来我们来详细的了解一下。 学生进行思考,准备回答问题。 调动学生的积极性,更好的开展课程内容。
讲授新课 新知讲解 全国人民代表大会常务委员会在2016年11月7日通过了《中华人民共和国网络安全法》在2017年6月1日正式实施。 《中华人民共和国网络安全法》是为保障网络安全,维护网络空间主权和国家安全、社会公共利益,保护公民、法人和其他组织的合法权益,促进经济社会信息化健康发展而制定的法律。 网络安全法共有7章79条;在内容上有6方面突出亮点。 1.明确了网络空间主权的原则 2.明确了网络产品和服务提供这的安全义务 3.明确可网络运营者的安全义务 4.进一步完善了个人信息保护原则 5.建立了关键信息基础设施安全保护制度 6.确立了关键信息基础设施重要数据跨境传输的规则 《中华人民共和国网络安全法》规定: 任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得危害网络安全,不得利用网络从事危害国家安全、荣誉和利益,煽动颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,传播暴力、淫秽色情信息,编造、传播虚假信息扰乱经济秩序和社会秩序,以及侵害他人名誉、隐私、知识产权和其他合法权益等活动。 法律规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息;爬取数据过程中不应侵犯他人的知识产权。 在编写爬虫程序时我们该如何避免风险? 1.严格遵守网站设置的robots协议; 2.在规避反爬虫措施的同时,需要优化自己的代码,避免干扰被访问网站的正常运行; 3.在设置抓取策略时,应注意编码抓取视频、音乐等可能构成作品的数据,或者针对某些特定网站批量抓取其中的用户生成内容; 4.在使用、传播抓取到的信息时,应审查所抓取的内容,如发现属于用户的个人信息、隐私或者他人的商业秘密的,应及时停止并删除。 robots协议 Robots协议, 又称作爬虫协议,全名是网络爬虫排除标准( RobotsExclusion Protocol) ,用来告诉爬虫和搜索引擎哪些页面可以爬取,哪些不可以爬取,通常是一个 robots.xt文本文件,一般放在网站的根目录下。搜索引擎爬虫爬取的网站的第一个文件便是Robots文件,可以在浏览器的地址栏上使用“主域名/robots.txt”来查看。 那么通过上图中我们可以看到里面有很多脚本语言,主要是下面两种: 1.User-agent:爬虫名称 代表下面设置的规则对这个“爬虫名称”是有效的,如果有很多条的“User-agent:”,就会有多个爬虫受到限制。如“User-agent:Baiduspider”,是指对百度爬虫有限制。 2.Disallow:目录 指定不允许爬取的目录,如果只为/,则表示不允许爬取所有页面。 如“Disallow;/baidu。 除了以上两种,我们可能会在其他的测试链接看到“Allow” Allow:目录 指定允许爬取的目录,用木排除某些限制,一般是和Disallow一起使用,不会单独使用。 课堂练习 思考以下几个案例是否遵守了相关的法律法规。 1、周先生在个人网站上增加了“美食探店”“玩转**市”等栏目。编写了一个爬虫程序,将相关的景区、商铺、美食店家的简介、好评数、相关评价等内容爬取出来,直接放置到其中。 公开的数据不一定被允许使用在第三方盈利,周先生的做法存在一定的法律风险。成熟的大数据公司在爬取并使用一个网站的数据时,一般都需要专业的律师进行审核,看是否有禁止爬取或者禁止用于商业用途的相关内容。 2、公司A向网络用户提供生活服务App,主要内容是商户基本信息及点评信息。公司B使用技术手段在此App上爬取了商户的基本信息及点评信息,用户使用其运营的地图App查询位置时,无须跳转至A公司运营的生活服务App界面,就可直接在地图App界面获取商户的基本信息和点评信息。 不符合,公司B使用技术手段爬取并使用公司A软件平台用户点评等内容,被认定为构成不当竞争。 3、小李参加了一场大型考试,考试主办方不公开全部的成绩和排名,小李编写一个爬虫程序,从主办方的网站上爬取到了所有参考人员的成绩和排名,进行整理后发布在了社交网站上。 不符合,每个人只能通过登录自己的账号查看自己的成绩。编写程序获取所有人的成绩,甚至在社交网络公开数据,侵犯了其余参考人员的隐私,并且违反了考试主办方的相关规定。 4、小明在某电商平台开了一家网店,通过爬虫程序筛选了顾客的个人信息,包括姓名、电话号码、购买物品、购买金额等相关的信息。将这些信息转售给某组织。 不符合,法律规定在爬取数据过程中,不得窃取或以其他方式获取个人信息,并且不得非法出售或者。向他人提供个人信息。 听老师讲解,了解基本的法律规定。 学生进行思考,回答相关的问题。 详细讲解,让学生充分的认识到相关的知识。 用具体的案例让知识更加生动。
课堂小结 任何个人和组织不得窃取或者以其他非法方式获取个人信息 不得非法出售或者非法向他人提供个人信息 爬取数据过程中不应侵犯他人的知识产权 在编写爬虫程序时一定要遵守相关的道德准则和法律法规 听老师的讲解 梳理本节课的知识点,进行系统的总结。
板书 《中华人民共和国网络安全法》 2017年6月1日正式实施。
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)(共19张PPT)
爬虫中的法律和道德
川教版 九年级上
新知导入
学习完网络爬虫的知识,我们可以在网络上更好的获取所需要的信息,在获取信息的过程中需要注意什么?
在编写爬虫程序获取信息的过程中要遵守相关的道德准则和法律法规,接下来我们来详细的了解一下。
新知讲解
全国人民代表大会常务委员会在2016年11月7日通过了《中华人民共和国网络安全法》在2017年6月1日正式实施。
《中华人民共和国网络安全法》是为保障网络安全,维护网络空间主权和国家安全、社会公共利益,保护公民、法人和其他组织的合法权益,促进经济社会信息化健康发展而制定的法律。
新知讲解
网络安全法共有7章79条;在内容上有6方面突出亮点。
1.明确了网络空间主权的原则
2.明确了网络产品和服务提供这的安全义务
4.进一步完善了个人信息保护原则
5.建立了关键信息基础设施安全保护制度
6.确立了关键信息基础设施重要数据跨境传输的规则
3.明确可网络运营者的安全义务
新知讲解
《中华人民共和国网络安全法》规定:
任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得危害网络安全,不得利用网络从事危害国家安全、荣誉和利益,煽动颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,传播暴力、淫秽色情信息,编造、传播虚假信息扰乱经济秩序和社会秩序,以及侵害他人名誉、隐私、知识产权和其他合法权益等活动。
法律规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息;爬取数据过程中不应侵犯他人的知识产权。
新知讲解
在编写爬虫程序时我们该如何避免风险?
1.严格遵守网站设置的robots协议;
2.在规避反爬虫措施的同时,需要优化自己的代码,避免干扰被访问网站的正常运行;
3.在设置抓取策略时,应注意编码抓取视频、音乐等可能构成作品的数据,或者针对某些特定网站批量抓取其中的用户生成内容;
4.在使用、传播抓取到的信息时,应审查所抓取的内容,如发现属于用户的个人信息、隐私或者他人的商业秘密的,应及时停止并删除。
新知讲解
robots协议
新知讲解
Robots协议, 又称作爬虫协议,全名是网络爬虫排除标准( RobotsExclusion Protocol) ,用来告诉爬虫和搜索引擎哪些页面可以爬取,哪些不可以爬取,通常是一个 robots.xt文本文件,一般放在网站的根目录下。搜索引擎爬虫爬取的网站的第一个文件便是Robots文件,可以在浏览器的地址栏上使用“主域名/robots.txt”来查看。
新知讲解
那么通过上图中我们可以看到里面有很多脚本语言,主要是下面两种:
1.User-agent:爬虫名称
代表下面设置的规则对这个“爬虫名称”是有效的,如果有很多条的“User-agent:”,就会有多个爬虫受到限制。如“User-agent:Baiduspider”,是指对百度爬虫有限制。
2.Disallow:目录
指定不允许爬取的目录,如果只为/,则表示不允许爬取所有页面。
如“Disallow;/baidu。
Allow:目录
指定允许爬取的目录,用木排除某些限制,一般是和Disallow一起使用,不会单独使用。
新知讲解
除了以上两种,我们可能会在其他的测试链接看到
“Allow”
思考以下几个案例是否遵守了相关的法律法规。
课堂练习
课堂练习
周先生在个人网站上增加了“美食探店”“玩转**市”等栏目。编写了一个爬虫程序,将相关的景区、商铺、美食店家的简介、好评数、相关评价等内容爬取出来,直接放置到其中。
公开的数据不一定被允许使用在第三方盈利,周先生的做法存在一定的法律风险。成熟的大数据公司在爬取并使用一个网站的数据时,一般都需要专业的律师进行审核,看是否有禁止爬取或者禁止用于商业用途的相关内容。
公司A向网络用户提供生活服务App,主要内容是商户基本信息及点评信息。公司B使用技术手段在此App上爬取了商户的基本信息及点评信息,用户使用其运营的地图App查询位置时,无须跳转至A公司运营的生活服务App界面,就可直接在地图App界面获取商户的基本信息和点评信息。
不符合,公司B使用技术手段爬取并使用公司A软件平台用户点评等内容,被认定为构成不当竞争。
课堂练习
小李参加了一场大型考试,考试主办方不公开全部的成绩和排名,小李编写一个爬虫程序,从主办方的网站上爬取到了所有参考人员的成绩和排名,进行整理后发布在了社交网站上。
不符合,每个人只能通过登录自己的账号查看自己的成绩。编写程序获取所有人的成绩,甚至在社交网络公开数据,侵犯了其余参考人员的隐私,并且违反了考试主办方的相关规定。
课堂练习
课堂练习
小明在某电商平台开了一家网店,通过爬虫程序筛选了顾客的个人信息,包括姓名、电话号码、购买物品、购买金额等相关的信息。将这些信息转售给某组织。
不符合,法律规定在爬取数据过程中,不得窃取或以其他方式获取个人信息,并且不得非法出售或者。向他人提供个人信息。
课堂总结
任何个人和组织不得窃取或者以其他非法方式获取个人信息
不得非法出售或者非法向他人提供个人信息
爬取数据过程中不应侵犯他人的知识产权
在编写爬虫程序时一定要遵守相关的道德准则和法律法规
板书设计
《中华人民共和国网络安全法》
2017年6月1日正式实施。
爬虫中的法律和道德
https://www.21cnjy.com/help/help_extract.php