1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 爬豆瓣正在热映和即将上映电影信息

爬豆瓣正在热映和即将上映电影信息

时间:2024-05-29 09:38:58

相关推荐

爬豆瓣正在热映和即将上映电影信息

之前有个需求就是获取豆瓣电影上正在热映和即将热映的电影信息,开始求希望于豆瓣电影的api,发现豆瓣电影的这两个接口的权限是需要商业合作的,最后索性自己爬下来!

爬的是豆瓣电影的ID,通过这个ID可以通过豆瓣电影的开放API获取对应ID电影的详细信息,豆瓣总算没有把事情做绝了!

需要用的python模块有BeautifulSoup,请自行下载之!

#coding:utf-8importurllib2fromBeautifulSoupimportBeautifulStoneSoupimportcookielibHOST_URL='classDoubanMovies:def__init__(self):self.url=''defopenUrl(self):cj=cookielib.CookieJar()openUrl=urllib2.urlopen(self.url)cjHander=urllib2.HTTPCookieProcessor(cj)opener=urllib2.build_opener(cjHander)urllib2.install_opener(opener)returnopenUrl.readlines()#tag=p是正在热映的影片id#tag=h3是即将上映影片的iddefgetMovieId(self,tag):movieStr=''movieId=[]forhtmlinself.openUrl():movieStr+=str(html).strip()soup=BeautifulStoneSoup(movieStr.strip(''))forconinsoup.findAll(tag):res=BeautifulStoneSoup(str(con))movieId.append(str(res.a["href"]).split("/")[-2])returnmovieId#正在热映影片IDdefnowPlaying(self):movie_id=[]foriinrange(1,3,1):url=HOST_URL+'/movie/recent/now?page='+str(i)+'&session=833b8d4c'self.url=urlforidinself.getMovieId('p'):movie_id.append(id)returnmovie_id#即将上映影片IDdefsoonPlaying(self):url=r'/later/shanghai/'self.url=urlself.openUrl()returnself.getMovieId('h3')#/v2/movie/subject/movieId(豆瓣接口)if__name__=="__main__":printDoubanMovies().nowPlaying()

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。