系列文章目录
python爬虫实战
前言
本文主要用python爬取豆瓣电影TOP250数据并将爬取到的数据保存到MySQL中。同时也介绍了该项目中遇到的问题。
爬取内容:电影名称,电影别名,导演,主演,电影类型,评分分数,评价人数,电影描述。
一、使用的库
import requestsfrom lxml import etreeimport pymysqlimport refrom pymysql.converters import escape_string
二、运行图
三、项目遇到的问题
1.python将包含有单引号或者双引号的字符串保存到MySQL中
案例
给出一个含有单引号的字符串,将其保存到Mysql中会发现错误。
无法保存,是因为单引号’ 无法保存?想想也不可能。去验证:
可以看到是可以保存单引号的,也能保存双引号。是什么原因导致的呢?
原因
是因为字符串中添加了单引号或者双引号,python在读取过程中会将其进行字符串分割,例如:“Smith’s Friend” 读取到单引号后就会以为是 Smith s Friend两个字符串,从而与你sql语句不相符,出现错误
解决办法
将含有单引号或者双引号的字符串不进行转义,这样就能将其正常保存到数据中了。
from pymysql.converters import escape_strings = "Smith's friend"s = escape_string(s)