(共17张PPT)
必修1
第五章数据处理和可视化表达
项目范例:网络购物平台客户行为数据分析和可视化表达
5.1认识大数据
⑤
1009%
809
60g
5.2数据的采集
409
209
5.3数据的分析
5.4数据的可视化表达
teacher表:
Tno
Tname
Tsex
Department
T001
石云丹
女
计算机系
0年年0年
互联网
T002
罗莉
女
计算机系
844440
T003王国强
男
计算机系
THE INTERNET
海量欧据
T004
吴栋
裂
计算机系
80年800
T005高鸿轩
数学系
…
T006张怀良
数学系
80年840
T007刘晓伟
数学系
0t80
T108马莉莲
物电学院
卡目子5开无专行目不无无
于无98导+
9于+180
+0开行于无
个人简历
时间
在何处工作
职务工种
高注
结构化数据
年月至年月
年月至年月
就像上面举的例子。这种类别的数据最好处理,只要简单的建立一个对应的表就可以了。
年月至年月
非结构化数据
年月系年丹
单月至今
像图片、声音、视频等等。这类信息我们通常无法直接知道他的内容,数据库也只能将它保存在一个LOB字段中,对以后
检索非常麻烦。一般的做法是,建立一个包含三个字段的表(编号number、.内容描述varchar(1024)、内容blob)。引用通过编
无屋年有候》州香何可)度定
家得监 大~~女新00
第64章夜忘川
号,检索通过内容描述。还有很多非结构化数据的处理工具,市面上常见的内容管理器就是其中的一种。
达门相两:州日树平机生名黄光物书草5年州口状生古带工问然事准有基然事来有基让生远海然平电联里用神康售1国银事黑学工请表之黑海神这
半结构化数据
江上烟水弥漫,绰绰影影可见水雾中的青山逶海,恍如一
幅精致的水墨画。
这样的数据和上面两种类别都不一样,它是结构化的数据,但是结构变化很大。因为我们要了解数据的细节所以不能将数据
“这里对你们这些凡间来的鬼魂来这里像幅画儿,可在我
简单的组织成一个文件按照非结构化数据处理,由于结构变化很大也不能够简单的建立一个表和他对应。本文主要时论针对半结
们点了几干年阴魂灯的来,这里是生死场,当年上古先神征战
构化数据存储常用的两种方式。
的时候,居戮下来的尸首把这忘川水都填满了。·鬼差解开挂
开船尾的绳,“你们跟着船走,很快就能看到奈何桥。·
先举一个半结构化的数据的例子,比如存储员工的简历。不像员工基本信息那样一致每个员工的简历大不相同。有的员工的
颜淡悄悄打量周围的鬼魂,每一个都神情呆滞,人事不
知,鬼差什么,他们便照着做。地虽然没被打入轮回道,却失
简历很简单,比如只包括教有情况:有的员工的简历却很复杂,比如包括工作情况、婚姻情况、出入境情况、户口迁移情况、党
了仙籍,依照冥府的规矩定不会容易让她随便离开的,真非她
籍情况、技术技能等等。还有可能有一些我们没有预料的信急。通常我们要完整的保存这些信息并不是很容易的,因为我们不会
也要同这么凡人的鬼魂一般渡过夜忘川,然后再世为人
希望系统中的表的结构在系统的运行期间进行变更。