(共19张PPT)
POI数据的组织与应用
单击此处添加副标题
01
POI数据的组织与应用
单击此处添加文本具体内容
02
POI数据的概念与应用
任务一:为商铺选址
单击此处添加文本具体内容
03
POI数据的组织与表示
任务二:体验“搜周边”
空间索引之网格索引
空间索引之Geohash算法
单击此处添加文本具体内容
目录
越来越多的年轻人将梦想“种”在家乡。你的是一名刚毕业的大学生,想要回乡创业。请选择一种行业类型,使用在线地图为商铺选择一个合适的位置。为了更好的让客户能在App上搜索到店铺的信息,请你给地图运营商提供关于商铺尽可能完整的信息。
任务一 为商铺选址
商铺信息
名称 地址
小艾书店 浙江省杭州市**区**路*号
经度 纬度
119.9319262 30.05228887
POI数据
Point of Interest 兴趣点
指一些与人们生活密切相关的地标建筑和地理实体的点数据,如学校、医院、商场、公园等。它的数据样本量大、涵盖信息丰富,能在一定程度上反映出城市的各类活动。
基本信息包括名称、类别、坐标、地址、电话、邮政编码等。
书店
POI数据
POI数据的应用
共享单车POI数据
城市功能区划分
城市中心区和边界识别
业态集聚分布
兴趣点推荐
某地区书店POI数据
某地公共厕所POI数据
在自己选择的商铺所在位置,体验在线地图“搜周边”功能,搜索同类店铺,并回答下列问题。
1.搜索速度如何?
2.查看POI数据集,思考如何实现快速搜周边功能?打开pthon文件,体验在大数据集中实现搜周边功能程序,完成活动二实验报告。
活动二 体验“搜周边”
活动二 体验“搜周边”
查询数据量 1万 5万 20万
查询时间 1.5s 7.5s 29.8s
同一个区域
全年级有600个学生,如何从中快速找到离你家最近的同学?
活动二 体验“搜周边”
空间索引之网格索引
0 1 2 3
4 5 6 7
8 9 10 11
M行
N列
pos
pos-N
pos-N-1
pos-1
pos+1
pos-N+1
pos+N
pos+N-1
pos+N+1
空间索引之网格索引
0 1 2 3
4 5 6 7
8 9 10 11
0
1
2
3
4
5
6
7
8
9
10
11
["悠佳水果","工夫营养店"]
1.二维数组
["泽元面包","优智培训","小李电动车","油漆店"]
[]
["天工美术"]
["如意旅社"]
["新出外带寿司","伊华"]
["小艾书店","同芙","然味餐厅","土鸡蛋专卖店"]
["依依服饰"]
["幼儿艺术","衣语无香"]
[]
[]
["卡卡书店","黄金屋书屋"]
pos-N+1
pos
pos-N
pos-N-1
pos-1
pos+1
pos+N
pos+N-1
pos+N+1
空间索引之网格索引
数组&链表
0 1 2 3
4 5 6 7
8 9 10 11
0
1
2
3
4
5
6
7
8
9
10
11
悠佳水果
工夫营养店
^
……
……
……
……
……
……
……
……
……
衣语无香
空间索引之网格索引
查询数据量 1万 5万 20万
查询时间 0.5s 0.5s 0.6s
索引效率:______________
1/(M*N)
存在不足:______________
______________
存储空间易浪费
网格大小难确定
空间索引之Geohash算法
01
00
10
11
00
01
10
11
1100
1101
1110
1111
00
01
10
11
1100
1101
1110
1111
空间索引之Geohash算法
11 10 01 10 01 10 01 10 01 10 01 01 11 01 00
纬度:30.05228887
经度:119.9319262
空间索引之Geohash算法
十进制 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Base32 0 1 2 3 4 5 6 7 8 9 b c d e f g
十进制 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Base32 h j k m n p q r s t u v w x y z
11100 11001 10011 00110 01011 10100
28
25
19
6
11
20
w
五位一组:
t
m
6
十进制:
c
n
Geohash编码:
经纬度
四叉树分割成二进制
五个一组
转十进制
按Base32
编码
Geohash编码
11 10 01 10 01 10 01 10 01 10 01 01 11 01 00
存在不足:____________
____________
空间索引之Geohash算法
适合点数据
索引效率:_________
O(log n)
小艾书店
存在突变性
网格空间索引
Geohash算法
没有最完美的算法与数据结构,
只有根据实际问题合理地、创造性地改进,
不断迭代出最合适的算法与数据结构。
课堂小结
POI数据的概念与应用
POI数据的组织与表示