用python爬取豆瓣前50数据

时间2023-04-17 20:52:31 提问来自重庆市重庆市的网友 分类创作浏览429

```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/chart' #豆瓣电影排行榜页面地址 res = requests.get(url) #发送请求，获取响应数据 html = res.text #将响应数据转为文本格式 soup = BeautifulSoup(html,'html.parser') #使用BeautifulSoup创建对象，并使用html格式进行解析 # 找到所有class为item的div 其中包含了前50部电影信息 items = soup.find_all('div',class_='item') # 遍历items，依此处理前50部电影信息：各字段信息的定位方法如下图所示： https://img-blog.csdnimg.cn/20200804171914407.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM1Njg5MjUw,size_16,color_FFFFFF,t_70#pic_center for item in items: #遍历items title = item.find('span',class_='title').text # 电影名称 score = item.find('span',class_='rating_num').text # 电影评分 directorAndActor = item['data-staff'] # 导演、主要演员 releaseDateAndCountry = item['data-region'] + ' | ' + item['data-release'] #上映日期、国家/地区 categoryAndDurationTime=item['data-category']+' | '+item['data-duration'] #类型、片长 print('片名: ',title) print('评分: ',score) print('导演&主要演员: ',directorAndActor) print('上映日期&国家/地区: ',releaseDateAndCountry) print('类型&片长: ',categoryAndDurationTime,' ') ```

不满意？免费深度重写！

免责声明：
以上内容除特别注明外均来源于网友提问，创作工场回答，未经许可，严谨转载。

上一篇 赚不钱怎么办 下一篇 谈谈你对新质生产力的认识和理解，题目自拟，字数不少于1000字