700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 全球地区资料json 含中英文 经纬度_爬虫实战(三)使用百度API获取经纬度/地址...

全球地区资料json 含中英文 经纬度_爬虫实战(三)使用百度API获取经纬度/地址...

时间:2023-07-27 23:20:02

相关推荐

全球地区资料json 含中英文 经纬度_爬虫实战(三)使用百度API获取经纬度/地址...

点击上方“蓝字”关注我们百度API获取经纬度/地址Mar 28,

本期介绍给定地址/经纬度,使用百度API来获取经纬度/地址。

本文约3k字,预计阅读18分钟。

本次是第三篇爬虫实战,这一次只是涉及最基础的爬虫知识,只需要会调用「requests包」即可完成该项目。

起因:因为论文需要,将获取的1000多个地址转化为经纬度以便后续计算,我嫌使用别人的工具麻烦,因此自己写了个简单的函数来获取经纬度,现在拿出来分享下。

不同的API地图的坐标系标准各有不同:

谷歌地图采用的是WGS84地理坐标系(中国范围除外),谷歌中国地图采用的是GCJ02地理坐标系,百度采用的是BD09坐标系,而设备一般包含GPS芯片或者北斗芯片获取的经纬度为WGS84地理坐标系,为什么不统一用WGS84地理坐标系这就是国家地理测绘总局对于出版地图的要求,出版地图必须符合GCJ02坐标系标准了,也就是国家规定不能直接使用WGS84地理坐标系。(具体内容自行查阅,本次我们使用百度API)

获取AK

首先我们打开百度API开放平台,注册/登陆自己的账号,成为百度开发者,在「应用管理」--- 「我的应用」中创建应用,如下所示:

在「创建应用」中输入「应用名称」,并且「请求校验方式」选择「IP白名单交验」,这里我们不使用「sn校验方式」,因为需要计算sn,并且为了方便,IP白名单选择了“0.0.0.0/0”,不对IP进行限制(这里是为了Debug,如果想要上线,请设置合理的IP白名单),然后提交即可。

在「我的应用」中出现如下应用:

「访问应用(AK)」是我们所需的。

获取地址对应的经纬度---地理编码

查看百度开放平台中的「开发文档」---「Web服务API」,选择「地点输入提示」---「地理编码」,我们可以找到地理编码接口的url:

完整的请求参数如下:

主要的返回结果参数为:

接下来我们使用「request包」爬取对应的json内容:

def BaiduQuery(address, currentkey): """ :param address: address :param currentkey: AK """ url = 'http://api./geocoding/v3/?' params = {"address": address, "city": '北京市', "output": 'json', "ak": currentkey, } response = requests.get(url, params=params) answer = response.json()

以北京东四地区为例,执行函数:

BaiduQuery('东四', currentkey="sLTKStSk6QGaAK2XriSseziy9FghVXkV")

得到的json结果如下:

{'status': 0, 'result': {'location': {'lng': 116.43043084078596, 'lat': 39.93757214936878}, 'precise': 0, 'confidence': 50, 'comprehension': 100, 'level': '商圈'}}

分析json数据,我们需要的内容应该是「result」中的「location」中的「lng(经度)」和「lat(纬度)」,当然你也可以获取其他信息。

查询该经纬度:

结果正确!

结合上述分析,最终我们的代码如下:

def geocoding(address, currentkey): """ address convert lat and lng :param address: address :param currentkey: AK :return: places_ll """ url = 'http://api./geocoding/v3/?' params = {"address": address, "city": '北京市', "output": 'json', "ak": currentkey, } response = requests.get(url, params=params) answer = response.json() if answer['status'] == 0: tmpList = answer['result'] coordString = tmpList['location'] coordList = [coordString['lng'], coordString['lat']] places_ll.append([address, float(coordList[0]), float(coordList[1])]) print([address, float(coordList[0]), float(coordList[1])]) else: return -1

地址:

l=['东四', '天坛','官园','万寿公园','奥体中心', '农展馆','万柳','北部新区','丰台花园','云岗','石景山古城','房山','大兴','亦庄','通州','顺义','昌平','门头沟','平谷','怀柔','密云','延庆','定陵','八达岭','密云水库','东高村','永乐店','榆垡','琉璃河','前门','永定门内','西直门北','南三环','东四环']

结果:

['东四', 116.430431, 39.937572]['天坛', 116.419342, 39.888663]['官园', 116.37293, 39.933926]['万寿公园', 116.37434, 39.885845]['奥体中心', 116.406138, 39.990549]['农展馆', 116.473398, 39.943151]...['南三环', 116.38953, 39.864106]['东四环', 116.494326, 39.895722]

注意:

地址的名字相当关键,当你自己使用百度地图时,输入地址,百度会帮你进行「联想修正」,但你通过百度API进行查找时,地址不匹配的话,它会返回一个默认的经纬度:116.413384,39.910925,这里我举例北京市的地区,要是限定其他地区,返回的默认经纬度可以自行测试(看经纬度相同的数量)。举例:

「万寿公园」这个地名我之前得到的是「万寿西宫」,结果无法匹配,查找资料后,才知道在百度地图上匹配的是万寿公园。

可以通过比较经纬度的方法,人工进行地名的修正(其他方法没有想到,我自己查找了1000多条地名,自己修正了400多例)

获取经纬度对应的地址---逆地理编码

查看「全球逆地理编码」,我们可以找到逆地理编码接口的url:

http://api./reverse_geocoding/v3/?ak=您的ak&output=json&coordtype=wgs84ll&location=31.225696563611,121.49884033194 //GET请求

主要的请求参数为:

主要的返回参数:

代码如下:

def reverse_geocoding(lng, lat, currentkey): """ lat and lng convert address :param lng: longitude :param lat: latitude :param currentkey: AK :return: places_ll """ url = 'http://api./reverse_geocoding/v3/?' params = {"location": str(lat)+','+str(lng), "output": 'json', "ak": currentkey, "coordtype": "wgs84ll", } response = requests.get(url, params=params) answer = response.json() if answer['status'] == 0: tmpList = answer['result'] address = tmpList['formatted_address'] print([lng, lat, address]) places_ll.append([address, lng, lat]) else: return -1

以东四的经纬度为例,json结果为:

{'status': 0, 'result': {'location': {'lng': 116.44318395258946, 'lat': 39.94483923411242}, 'formatted_address': '北京市东城区东中街16号', 'business': '东四,东直门,东四十条', 'addressComponent': {'country': '中国', 'country_code': 0, 'country_code_iso': 'CHN', 'country_code_iso2': 'CN', 'province': '北京市', 'city': '北京市', 'city_level': 2, 'district': '东城区', 'town': '', 'town_code': '', 'adcode': '110101', 'street': '东中街', 'street_number': '16号', 'direction': '附近', 'distance': '23'}, 'pois': [], 'roads': [], 'poiRegions': [], 'sematic_description': '', 'cityCode': 131}}

最后输出:

[116.430431, 39.937572, '北京市东城区东中街16号']

Github

GitHub地址:/BlackSpaceGZY/Crawler

往期精彩回顾今日头条爬虫实战----爬取图片

哔哩哔哩爬虫实战----验证码识别扫码关注更多精彩

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。