A8
书 名:Python 3爬虫 数据清洗与可视化实战
作 译 者:零一,韩要宾,黄园园
出版时间:-03
千 字 数:200
版 次:01-01
页 数:212
开 本:16开
I S B N :9787121333590
定价:¥49.00
1 章 Python 基础 1
11 安装Python 环境 1
111 Python 362 安装与配置 1
112 使用IDE 工具——PyCharm 4
113 使用IDE 工具——Anaconda 4
12 Python 操作入门 6
121 编写一个Python 代码 6
122 Python 基本操作 9
123 变量 10
13 Python 数据类型 10
131 数字 10
132 字符串 11
133 列表 13
134 元组 14
135 集合 15
136 字典 15
14 Python 语句与函数 16
141 条件语句 16
142 循环语句 16
143 函数 17
2 章 写一个简单的爬虫 18
21 关于爬虫的合法性 18
22 了解网页 20
221 认识网页结构 21
222 写一个简单的HTML 21
23 使用requests 库请求网站 23
Python 3 爬虫、数据清洗与可视化实战
231 安装requests 库 23
232 爬虫的基本原理 25
233 使用GET 方式抓取数据 26
234 使用POST 方式抓取数据 27
24 使用Beautiful Soup 解析网页 30
25 清洗和组织数据 34
26 爬虫攻防战 35
3 章 用API 爬取天气预报数据 38
31 注册免费API 和阅读技术文档 38
32 获取API 数据 40
33 存储数据到MongoDB 45
331 下载并安装MongoDB 45
332 在PyCharm 中安装Mongo Plugin 46
333 将数据存入MongoDB 49
34 MongoDB 数据库查询 52
4 章 大型爬虫案例:抓取某电商网站的商品数据 55
41 观察页面特征和解析数据 55
42 工作流程分析 64
43 构建类目树 65
44 获取产品列表 68
45 代码优化 70
46 爬虫效率优化 74
47 容错处理 77
5 章 Scrapy 爬虫 78
51 Scrapy 简介 78
52 Scrapy 安装 79
53 案例:用Scrapy 抓取股票行情 80
6 章 Selenium爬虫 88
61 Selenium 简介 88
62 案例:用Selenium 抓取电商网站数据 90
7 章 数据库连接和查询 100
71 使用PyMySQL 100
711 连接数据库 100
712 案例:某电商网站女装行业T O P100 销量数据 102
72 使用SQLAlchemy 104
721 SQLAlchemy 基本介绍 104
722 SQLAlchemy 基本语法 105
73 MongoDB 107
731 MongoDB 基本语法 107
732 案例:在某电商网站搜索“连衣裙”的商品数据 107
8 章 NumPy 109
81 NumPy 简介 109
82 一维数组 110
821 数组与列表的异同 110
822 数组的创建 111
83 多维数组 111
831 多维数组的高效性能 112
832 多维数组的索引与切片 113
833 多维数组的属性 113
84 数组的运算 115
9 章 pandas 数据清洗 117
91 数据读写、选择、整理和描述 117
911 从CSV 中读取数据 119
912 向CSV 写入数据 120
913 数据选择 120
914 数据整理 122
915 数据描述 123
92 数据分组、分割、合并和变形 124
921 数据分组 124
922 数据分割 127
923 数据合并 128
924 数据变形 134
925 案例:旅游数据的分析与变形 136
Python 3 爬虫、数据清洗与可视化实战
93 缺失值、异常值和重复值处理 140
931 缺失值处理 140
932 检测和过滤异常值 144
933 移除重复数据 147
934 案例:旅游数据的值检查与处理 149
94 时序数据处理 152
941 日期/时间数据转换 152
942 时序数据基础操作 153
943 案例:天气数据分析与处理 155
95 数据类型转换 158
96 正则表达式 160
961 元字符与限定符 161
962 案例:用正则表达式提取网页文本信息 162
10 章 综合应用实例 164
101 按给用户推荐旅游产品 164
1011 数据采集 165
1012 数据清洗、建模 169
102 通过热力图分析为用户提供出行建议 172
1021 某旅游网站热门景点爬虫代码(qunaer_sightspy) 175
1022 提取CSV 文件中经纬度和销量信息 178
1023 创建景点门票销量热力地图HTML 文件 179
11 章 数据可视化 182
111 matplotlib 183
1111 画出各省份平均价格、各省份平均成交量柱状图 183
1112 画出各省份平均成交量折线图、柱状图、箱形图和饼图 184
1113 画出价格与成交量的散点图 185
112 pyecharts 186
1121 Echarts 简介 186
1122 pyecharts 简介 187
1123 初识pyecharts,玫瑰相送 187
1124 pyecharts 基本语法 188
1125 基于商业分析的pyecharts 图表绘制 190
1126 使用pyecharts 绘制其他图表 199
1127 pyecharts 和Jupyter 203
本书内容来自笔者在浙江某高校授课内容,主要介绍运用Python工具获取电商平台的页面数据,并对数据做清洗和存储。本书简化了Python基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容,对于Python基础,建议新手可以选购对应的基础书籍配合本书一起学习。0123456789
python爬取淘宝商品做数据挖掘_Python 3爬虫 数据清洗与可视化实战 Python数据抓取技术 python3网络爬虫教程书籍 运用Python工具获取电商平台页面数据挖掘书籍...