加入收藏 | 设为首页 | 会员中心 | 我要投稿 江门站长网 (https://www.0750zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 搭建环境 > Unix > 正文

爬了知乎“沙雕问题”,笑死个人!

发布时间:2019-11-28 09:17:48 所属栏目:Unix 来源:站长网
导读:副标题#e# 这两天偶然上网的时候,被知乎上一个名为玉皇大帝住在平流层还是对流层的问题吸引。 图片来自 Pexels 本以为只是小打小闹,殊不知这个问题却在知乎上引发了强烈共鸣,浏览次数 500W+,7000+ 关注: 于是乎就激发了去探索知乎上沙雕问题的想法,通

questions_df = pd.DataFrame(columns = ['title','visit','follower','answer','is_open']) 

 

for i in range(len(questions)): 

    try: 

        url = 'https://www.zhihu.com/'+questions[i] 

        html = requests.get(url,cookies=cookie, headers=header).content 

        bsObj = BeautifulSoup(html.decode('utf-8'),"html.parser") 

        text = str(bsObj) 

        title = bsObj.find('h1',attrs={'class':'QuestionHeader-title'}).text 

        visit = int(re.findall('"visitCount":d+',text)[0].replace('"visitCount":','')) 

        follower = int(re.findall('"followerCount":d+',text)[0].replace('"followerCount":','')) 

        answer = int(re.findall('"answerCount":d+',text)[0].replace('"answerCount":','')) 

        is_open = int(len(re.findall('问题已关闭',text))==0) 

        questions_df = questions_df.append({'title':title,'visit':visit, 

(编辑:江门站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读