700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > Python打印公众号文章范例 解决微信公众号文章采集打印pdf图片无法显示的问题...

Python打印公众号文章范例 解决微信公众号文章采集打印pdf图片无法显示的问题...

时间:2020-11-30 21:49:46

相关推荐

Python打印公众号文章范例 解决微信公众号文章采集打印pdf图片无法显示的问题...

python第三方库pdfkit非常好用,基本上应用它就可以打印出pdf文件,作为学渣收藏干货吃灰简直是完美匹配,本渣渣也写了不少爬取不少干货打印成pdf的文章,其中就有微信公众号文章,前段时间又继续折腾了公众号文章打印pdf,发现如果存在图片就挂比,歇菜了!

SO,因此有了这样一篇文章,解决微信公众号文章打印pdf图片无法显示的问题,不懂的话直接搜大佬的参考方案,百试百灵!!

下面就来复盘一下解决方案!

就以本渣渣的公众号文章链接为例:

【微信采集助手】Python Tkinter 微信公众号文章批量采集工具

爬取打印pdf效果:

关键要点

解决pdfkit直接转换url成为pdf会出现图片无法显示问题,参考了博客园xuzifan提供的思路,利用wechatsogou中的get_article_content函数,将url中的代码提取出来转换为html字符串,然后将html字符串转换为pdf,完美解决。

pipinstallwechatsogou--upgrade

wechatsogou是一个基于搜狗微信搜索的微信公众号爬虫接口,没错,还是调用接口!!

使用Python爬取微信公众号文章并保存为PDF文件(解决图片不显示的问题)

/xuzifan/p/11121878.html

不过本渣渣测试了一下代码,老是出验证码,死活没有运行下去!

这里再提供一下最近的代码参考,一个大佬老哥的源码:

搞定,爬取公众号文章转换成PDF,自动邮件发送给自己!

可自行参考!

附完整源码参考:

#采集微信公众号文章内容转pdf文件#by 微信:huguo00289#-*-coding:UTF-8-*-importwechatsogouimportpdfkit#pdfkit本地路径config=pdfkit.configuration(wkhtmltopdf=r'D:\wkhtmltox-0.12.5-1.mxe-cross-win64\wkhtmltox\bin\wkhtmltopdf.exe')#初始化APIws_api=wechatsogou.WechatSogouAPI(captcha_break_time=3)defdypdf(h1,data):#处理后的htmldatas=f'''<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>{h1}</title></head><body><h2style="text-align:center;font-weight:400;">{h1}</h2>{data}</body></html>'''print("开始打印内容!")pdfkit.from_string(datas,f'{h1}.pdf',configuration=config)print("打印保存成功!")defwx(h1,url):#该方法根据文章url对html进行处理,使图片显示content_info=ws_api.get_article_content(url)#得到html代码(代码不完整,需要加入head、body等标签)html_code=content_info['content_html']dypdf(h1,html_code)if__name__=='__main__':url="https://mp./s?src=11&timestamp=1621327798&ver=3075&signature=jmB-1M7nuTd-tKOj-8WmSLcmLK7fWIfIeWsZvtIKw5AkYd4U0R5cOz*QSjaVDfg38UkPtUqfxL2Lut0jrWNuTAtQMiyWd*tJHqLlPnWH-ewQ46cpjjp-Pyke0ab57WdM&new=1"h1="【微信采集助手】PythonTkinter微信公众号文章批量采集工具"wx(h1,url)

调用接口什么的,还是比较简单,做一个调包侠,还是非常给力的!

往期精彩

01

Python爬虫,微信公众号话题标签内容采集打印PDF输出

02

Python爬取杜赛博客教程内容,应用pdfkit打印pdf文件

03

Python知乎专栏爬虫,pdfkit专栏文章制作PDF电子书

04

Python爬虫,B站视频下载源码脚本工具助手附exe

05

【福利】Python抖音小视频无水印下载工具助手exe

·················END·················

你好,我是二大爷,

革命老区外出进城务工人员,

互联网非早期非专业站长,

喜好python,写作,阅读,英语

不入流程序,自媒体,seo . . .

公众号不挣钱,交个网友。

读者交流群已建立,找到我备注 “交流”,即可获得加入我们~

听说点 “在看” 的都变得更好看呐~

关注关注二大爷呗~给你分享python,写作,阅读的内容噢~

扫一扫下方二维码即可关注我噢~

关注我的都变秃了

说错了,都变强了!

不信你试试

扫码关注最新动态

公众号ID:eryeji

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。