700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 哔哩哔哩网页数据清洗

哔哩哔哩网页数据清洗

时间:2024-05-10 15:38:46

相关推荐

哔哩哔哩网页数据清洗

清洗网页数据

#encoding:utf-8 #注意编码格式要为utf-8,否则会编码错误text1 = ''' xxxxx'''text1 = text1.split("rank-list-wrap")[1]#切割,扔掉前面的会对数据清晰造成影响的文字#print(text1)for i in range(0,100):text = text1.split('</li>')[i]#分块切割#print(text)rank = text.split('data-rank=')[1].split('\"')[1].split('\"')[0]#获取排名title = text.split('title">')[1].split('<')[0]#获取标题play_number = text.split('b-icon play\"></i>')[1].split('</span>')[0].strip()#获取播放量author = text.split('b-icon author\"></i>')[1].split('<')[0].strip()#获取UP主grade = text.split('pts\"><div>')[1].split('<')[0]#获取综合评分print("排名{},《{}》,播放量{},UP主{}。评分:{}".format(rank,title, play_number, author, grade))```

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。