第三单元 第3课《大模型时代》课件【清华版】人工智能通识( 中学)

文档属性

名称 第三单元 第3课《大模型时代》课件【清华版】人工智能通识( 中学)
格式 pptx
文件大小 98.5MB
资源类型 试卷
版本资源 清华大学版
科目 信息技术(信息科技)
更新时间 2025-09-17 09:02:12

图片预览

文档简介

(共48张PPT)
第三单元 第3课
大模型时代
清华版(中学)

02
新知导入
深度学习的核心优势
深度学习通过海量数据训练,模型规模达到阈值后展现出超越人类特定领域的能力。
02
新知导入
大模型时代的特征
参数规模与多模态数据融合,推动AI向通用智能迈进。
1
学习目标
3
新知讲解
5
拓展延伸
7
板书设计
2
新知导入
4
课堂练习
6
课堂总结
课后作业
8
01
教学目标
(1)理解大模型的时代背景、基本原理及其代表性技术。
(2)认识大模型时代的人工智能的特征。
(3)探讨大模型技术带来的社会影响和潜在挑战。
03
新知导入
描述词语前后连接关系的数学模型就是语言模型,简单地说,就是概率统计,一串词后应该接什么词,类似词语接龙。
什么是语言模型?


×
×
03
新知讲解
1
大语言模型的兴起
大语言模型的定义与范畴
“大语言模型”(LLM)特指参数超百亿、依赖海量数据训练的神经网络模型,其核心是通过规模效应涌现智能。
03
新知讲解
1
大语言模型的兴起
传统模型的限制
语言能力被视为人类智能的核心特征,也是AI领域长期以来的重大挑战。传统模型受限于计算能力,无法处理超长上下文。
前面的历史词串越长,预测就会越准确
03
新知讲解
1
大语言模型的兴起
Transformer架构的突破
2017年谷歌提出Transformer模型,通过自注意力机制实现无限制长序列建模,解决了传统RNN的梯度消失问题,为超长上下文处理奠定基础。
03
新知讲解
1
大语言模型的兴起
GPT模型的演进与发现
2018年OpenAI基于Transformer推出GPT,2019年的GPT-2展现出“任务描述→自动生成答案”的类理解能力,颠覆了对语言模型的认知。
03
新知讲解
1
大语言模型的兴起
规模效应的启示
GPT-2证明了当模型参数与训练数据足够大时,简单预测词序列的模型可涌现出复杂语义理解能力,预示“量变引发质变”的AI发展路径。
03
新知讲解
1
大语言模型的兴起
大语言模型的规模跃升与技术突破
大语言模型通过扩大参数规模(如GPT-3到GPT-4)和上下文窗口,显著提升了语义理解和多任务能力。
03
新知讲解
1
大语言模型的兴起
文本生成:
根据给定的主题生成高质量的文章、古诗、诗歌和技术文档。
03
新知讲解
1
大语言模型的兴起
翻译:
在多个语言之间进行高质量的翻译,提供合理的翻译结果。
03
新知讲解
1
大语言模型的兴起
对话系统:
在对话人物中表现出色,能够和人进行自然流畅的对话。广泛应用于智能客服和智能聊天机器人,提升用户体验和服务效率。
03
新知讲解
1
大语言模型的兴起
编程辅助 :
GPT-4 以后,大语言模型拥有了生成和理解代码的能力,可以生成代码、调试错误,通过集成IDE(集成开发环境)提供代码建议、自动补全和文档生成等功能。
03
新知讲解
1
大语言模型的兴起
医疗和法律:
在医疗领域,GPT模型可以帮助医生生成诊断报告和治疗建议。在法律领域,它可以协助律师撰写法律文件和合同,提供法律咨询。
03
新知讲解
1
大语言模型的兴起
”涌现“现象
是指当模型规模到达一定程度后,就好像忽然“开窍”了一样,学会了融会贯通,可以生成训练数据中不存在的思路和方案,甚至产生推理能力。
03
新知讲解
2
视觉大模型
1、Transformer在图像生成中的创新应用
OpenAI的DALL-E1首次将Transformer的长序列建模能力应用于图像生成,通过像素序列建模(类似文本词序列)实现图像合成。
03
新知讲解
2
视觉大模型
2、扩散模型与文本引导的突破
DALL-E2升级为扩散模型技术,通过建模对图像的破坏过程可以学习到对图片进行去噪的反向过程。通过反向过程可以从纯噪音开始一步步生成清晰的图片。
03
新知讲解
2
视觉大模型
ALL-E2生成的“七彩咖啡”图片展现了色彩斑斓的咖啡杯,充满梦幻艺术感。
03
新知讲解
2
视觉大模型
03
新知讲解
2
视觉大模型
思考与讨论
大规模神经语言模型的另一个优势是利用了大量数据。
最新的GPT-4几乎用尽了人类的文本数据源,这意味着它学到了人类各种知识和表达方式。
等一下… 用尽了?
那接下来怎么办?模型的提升空间在哪里?
03
新知讲解
2
视觉大模型
3、Sora的突破性发布
2024年OpenAI推出视频生成模型Sora,基于类似DALL-E2的噪声重建技术,但扩展至三维时空维度,实现逼真动态画面生成。
Sora生成的逼真而奇幻的视频(截图)
03
新知讲解
2
视觉大模型
4、物理规律的机器学习表达
Sora通过Transformer建模时空依赖性,初步展现AI对物理世界相关性的理解能力。它将视频看作一张立体的画,将这幅画用VAE编码到隐空间中,用这些隐空间编码训练扩散模型。
03
新知讲解
2
视觉大模型
03
新知讲解
2
视觉大模型
03
新知讲解
2
视觉大模型
6、Sora的三大应用领域
(1) 教育革新 :将抽象知识转化为动态视频,提升学习直观性与趣味性。
(2) 医疗辅助 :基于患者数据生成诊断可视化视频,辅助医生分析病情。
(3) 创意产业 :为广告、游戏、影视行业生成定制化动态内容。
03
新知讲解
3
大模型时代
大模型时代是2016年AlphaGo战胜李世石之后AI领域的又一次深刻变革,其影响力远超以往。
03
新知讲解
3
大模型时代
大模型时代AI的三大特征
(1) 数据-算力-规模三位一体 :以海量数据、超强算力训练万亿参数模型,形成技术新范式。
(2) 通用智能初现端倪 :大语言模型在语言理解与多任务处理上接近人类水平,展现跨领域适应性。
(3) 超级智能的迫近 :AI在创作、推理等任务上已超越多数人类,技术奇点可能性显著提升。
03
新知讲解
3
大模型时代
智能机器对人类的影响
(1)积极影响 :提升工作效率、辅助学习、替代高危任务,推动社会生产力进步。
(2)消极影响 :引发隐私泄露、伦理争议及安全威胁(如AI武器),需警惕技术滥用风险。
03
新知讲解
4
总结
1、大模型的技术革命与跨学科影响
以GPT(文本)、DALL-E(图像)、Sora(视频)为代表的大模型,推动了自然语言处理、计算机视觉、教育、医疗等领域的突破性进展,展现多模态智能潜力。
03
新知讲解
4
总结
2、大模型面临的四大挑战
(1) 数据与安全 :隐私泄露、偏见放大等风险;
(2) 资源与能耗 :千亿级参数训练的算力与电力消耗;
(3) 伦理与社会 :AI生成内容滥用、职业替代等争议;
(4) 技术可靠性 :模型可解释性差、对抗攻击脆弱性。
03
新知讲解
4
总结
3、大模型时代的里程碑意义
标志着AI从专用窄域迈向通用智能的关键转折,伴随着技术与社会挑战,为智能时代奠定基础,未来需平衡创新与治理。
03
新知讲解





1、讨论一下,为什么说大模型带来了通用人工智能的曙光?
(1)技术通用性 :大模型通过统一架构处理多任务、多语言和多模态问题,打破了传统AI的专用局限。
(2) 能力全面性 :大模型在理解、生成、逻辑和记忆四项基础能力上显著提升,创作和推理能力已接近人类水平,为跨领域应用奠定基础。
(3) 工业化生产特征 :大模型依托标准化训练平台、模块化工具链和自动化流程,推动AI从“手工作坊”迈向规模化生产,加速AGI落地。
03
新知讲解




绘本是通过精美图画与简洁文字共同叙事的艺术形式,图画不仅是辅助更是核心叙事载体。
03
新知讲解




先确定一个主题,使用ChatGPT、ChatGLM等大模型工具生成故事情节,再使用这些模型生成绘本。以小组方式完成,并进行作品展示。
04
课堂练习
一、判断题。
1、大语言模型仅能处理文本数据,无法生成图像。(  )
2、扩散模型通过逐步去噪生成图像。(  )
3、GPT-4的参数规模比GPT-3小。(  )
4、“涌现”现象指模型通过小数据训练获得新能力。(  )
5、Sora的视频生成完全依赖预编程物理规则。(  )

×
×
×
×
04
课堂练习
二、选择题
1、 Transformer架构的核心创新是? ( )
A. 卷积运算 B. 自注意力机制 C. 递归神经网络 D. 贝叶斯推理
2、 GPT-4的参数量级约为? ( )
A. 1.17亿 B. 1750亿 C. 1.8万亿 D. 100万亿
3、 Sora视频生成模型的基础技术是? ( )
A. 生成对抗网络(GAN) B. 扩散模型(Diffusion Model)
C. 强化学习 D. 支持向量机
4、 大语言模型“涌现”现象的条件是? ( )
A. 数据标注精细化 B. 参数规模超临界值
C. 训练时间足够长 D. 使用多模态输入
B
C
B
B
04
课堂练习
三、填空题
1、2017年谷歌提出的____ ____架构解决了长序列建模难题。
2、OpenAI的DALL-E2通过_____ ___技术从噪声生成图像。
3、大模型的三大特征是数据、____ ____和规模。
4、Sora通过建模_____ ___依赖性理解物理规律。
5、GPT-3的上下文窗口长度为____ ____个token。
Transformer
扩散模型
算力
时空
2048
05
拓展延伸
1、神经符号结合
通过融合符号系统的逻辑推理能力(如规则引擎)与神经网络的模式学习能力(如深度学习),构建可解释性强、推理清晰的混合AI模型。
05
拓展延伸
2、绿色AI技术
采用模型蒸馏、稀疏训练等方法,显著降低大模型训练的能耗与碳排放,推动可持续发展。
05
拓展延伸
3、多模态学习
联合训练文本、图像、视频等跨模态数据(如CLIP的图文对齐),突破单一模态局限,实现更接近人类的多维认知能力。
06
课堂总结
1
大语言模型的兴起
2
视觉大模型
3
大模型时代
4
完成课堂练习
5
进行相关知识拓展
1
2
3
4
5
大模型时代
07
板书设计
大模型时代
1、大语言模型的兴起
2、视觉大模型
3、大模型时代
4、完成课堂练习
5、进行知识拓展
课后作业。
1、如何设计监管框架以兼顾创新与患者安全?
08
课后作业
1、大模型在医疗诊断中表现优异,但“黑箱”特性可能导致误诊责任纠纷。如何设计监管框架以兼顾创新与患者安全?
(1) 风险分级 :按AI应用风险等级差异化监管,高风险领域强制临床验证。
(2) 透明可解释 :要求算法提供决策依据,避免“黑箱”操作。
(3) 责任明确 :医生拥有最终决策权,企业承担技术缺陷责任。
(4) 动态更新 :定期评估模型性能,利用真实数据持续优化。
(5) 数据安全 :采用隐私计算技术,确保患者数据合规使用。
https://www.21cnjy.com/recruitment/home/fine
同课章节目录