爬虫练习网站 -http://quotes.toscrape.com的爬虫练习-CSDN博客

网站介绍:文章浏览阅读1.5k次。本人是纯新手自学,所以代码的变量命名都不是很专业,有些变量的名字起的还不是很好理解,菜鸡本人。本文思路:用requests请求页面,用xpath解析页面,用for循环对xpath返回的字典进行逐个的元素保存出现的错误:在尝试获取网页右侧的链接页面时,返回一个空列表,后来检查发现是url的拼接出现了错误;在对xpath获取的页面尝试进行直接的存储,报错:提示write只能保存str类型的数据,于是想到用for循环的方法对列表中的元素进行逐个的保存import requestsfrom lxml im_爬虫练习网站