700字范文 > 洗礼灵魂修炼python（68）--爬虫篇—番外篇之webbrowser模块

洗礼灵魂修炼python（68）--爬虫篇—番外篇之webbrowser模块

时间：2020-05-08 18:17:58

题外话：

爬虫学到这里，我想你大部分的网站已经不再话下了对吧？有检测报文头的，我们可以伪造报文头为浏览器，有检测IP，我们可以用代理IP，有检测请求速度的，我们可以用time模块停顿一下，需要登录验证的，我们可以用cookielib模块搞定登录，HTML标签嵌套太多层的，我们可以用BeautifulSoup轻松取出来，等等方法，反正反爬虫机制怎么样，我们基本都有方法解决。

很厉害对吧？别得意忘形了，还有些反爬虫机制，网页是JS动态加载的，或者AJAX异步加载的，还有动态验证码验证的等等的，这些机制造成的难度那才是真正的难度。后期也会跟着解析

其实你有没有发现，在我们写爬虫的过程中，在潜移默化的复习前面的基础知识，很不错对吧？既能写爬虫，还能复习，在其中能掌握好多好多知识，是的。不过在这里，我还是建议大家稍微的了解一下html标签和css样式，或者你还可以学习一下js，这样对后期搞爬虫很有帮助，需要去了解每个标签或者代码是什么含义，什么作用，当写爬虫时遇到了，才能立马做出解决方法对吧？

好的，有没有朋友想过，既然爬虫这么厉害，可以伪造浏览器，那么可以用真实的浏览器操作吗？那是当然可以的，python，就是这么灵活，那么怎么控制真实的浏览器呢？终于说道本篇文章的主角了——webbrowser模块

webbrowser模块

1.简介

顾名思义，web不用说是什么意思了吧？browser就是浏览器的意思嘛，那么webbrower就是web浏览器嘛。通俗简短的说，它可以打开本地计算机的浏览器，然后进行更一步的操作，怎么操作就随你了

webbrowser是一个内置的模块，python2和python3都有的

2.方法/属性

python2下：

python3下：

稍稍的有一些不同，不过不影响，那些我们基本很少用

3.常用方法/属性解析

webbrowser.open(url[, new=0[, autoraise=1]])：用本机默认的浏览器操作

url：网页链接/地址new = 0, 那么url会在同一个浏览器窗口下打开；如果new = 1, 会打开一个新的窗口，如果new = 2, 会打开一个新的浏览器标签页；autoraise ＝ true，窗口会自动增长

例：

首先，我本机默认的浏览器是火狐浏览器

import webbrowserwebbrowser.open('') #这里可以不用加http://了，这直接是在浏览器上操作了，会自动识别

结果：

使用new参数后，其实没多大区别，效果一样的，自己测试了

webbrowser.open_new(url)：在默认浏览器中打开一个新的窗口来打开url

其效果等价于webbrowser.open(url,new=1)，自己测试了

webbrowser.open_new_tab(url)：在默认浏览器中当开一个新的tab来打开url

其效果等价于webbrowser.open(url,new=2)，略过

webbrowser.get([name])：根据name返回一个浏览器对象，如果name为空，则获取到系统默认浏览器的操作对象

webbrowser.register(name, construtor[, instance])：注册一个名字为name的浏览器，如果这个浏览器类型允许被注册就可以用get()方法来获取

允许被注册的浏览器类型有：

其中，以上的Chrome，Chromium，MacOSX等等的都是webbrowser里的属性或者方法

例：

import webbrowserprint(webbrowser.get())webbrowser.register('chrome',None,webbrowser.Chrome('chrome'))print(webbrowser.get('chrome'))

结果：

启动指定浏览器

我们已经知道webbrowser模块会启动本机默认浏览器，那么我们想启动指定的浏览器呢？

也是可以的：

import webbrowserbrowser_path = r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chrome.exe' #你的浏览器主程序路径webbrowser.register('chrome',None,webbrowser.BackgroundBrowser(browser_path)) #此处的'chrome'可以用其它任意名字，如test,但是必须给一个，不然又会是默认浏览器执行webbrowser.get('chrome').open('',new=1,autoraise=True)

结果：

关闭浏览器

有打开自然有关闭对吧，关闭命令：taskkill /F /IM XX.exe（XX为主程序名）

这次我打开ie浏览器：

import webbrowser,os,timebrowser_path = r'C:\Program Files\Internet Explorer\iexplore.exe' #你的浏览器主程序路径，linux，mac等操作环境也一样webbrowser.register('chrome',None,webbrowser.BackgroundBrowser(browser_path)) webbrowser.get('chrome').open('',new=1,autoraise=True) time.sleep(3)os.system('taskkill /F /IM iexplore.exe') #这里的'ieexplore.exe'是进程名称，必须和浏览器主程序名一致，不然无法关闭，taskkill是windows下的命令，linux下没记错是kill

在三秒过后确实自动关闭，由于效果不好展示，你们在本机体验吧

webbrowser可以打开其他程序吗？

这里有朋友有个想法了，你说，既然打开的是一个主程序，我可以打开QQ吗？甚至可以打开其他任何的exe程序吗？好像可行啊，注意一个命令：webbrowser.open()，这个命令打开的必须是一个合法的url，不然报错，所以，当然是不可以打开其他程序，能传入一个url的是不是只有浏览器啊？

实战，刷博客访问量

首先，我个人是不喜欢刷访问量的，刷来有什么用，自己骗自己嘛对吧？这里做个案例讲解一下，我建议大家还是不要去刷博客访问量，没什么意思，又不能体现自己的价值，也换不了钱对吧？

import webbrowser,time,oscount = 1browser_path = r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chrome.exe' #由于我用默认的浏览器火狐正在编辑本篇文章呢，所以使用的指定打开浏览器方法，你们可以直接默认的，减少代码while count <= 9: #最多打开九个窗口，超过就杀死进程webbrowser.register('chrome',None,webbrowser.BackgroundBrowser(browser_path))webbrowser.get('chrome').open_new_tab('/yangva/p/7811622.html')count += 1time.sleep(2)else:os.system('taskkill /F /IM chrome.exe')

结果：这里我设置只有注册用户才能查看，所以提示需要登录的，不影响，结果是实现了的

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。