python 我的爬虫工具类-python爬虫
这是一个自己撰写的爬虫工具类,作用包含:推送get/post要求获得网页页面,cookie实际操作,网页页面正则表达式和xpath分析,简易的检索网络爬虫。 除开lxml库全是基础python杜兰特就会有的物品。 要是没有这一库可以用pip安装,或是删掉from lxml import etree和getXpath方式 $ pip install lxml 编码: #! /usr/bin/python #coding=utf-8 import sys import urllib import u