msyz999明仕亚洲官网用pyspider框架爬虫时,怎样完成全局变量的修正,转达?

刚打仗pyspider,想用pyspider爬去知乎,但是无法实如今这个框架内的变量转达。
我先把变量定义成东西的属性
以下是我题目最根底的代码:

from pyspider.libs.base_handler import *


class HandlerBaseHandler:
    crawl_config = {
        
    }
    
    def __init__self:
        self.num = 0

    @everyminutes=24 * 60
    def on_startself:
        self.num += 1
        print self.num
        self.index_page
        

    @configage=10 * 24 * 60 * 60
    def index_pageself:
        self.num +=1
        print self.num
        self.crawlhttp://www.baidu.com,callback=self.detail_page
        
        

    @configpriority=2
    def detail_pageself:
        print self.num   #**调用这个语句的时分发明self.num 变回了我初始定义的值,阐明在index_page函数中对其的改动没有被传给detail_page函数。**
        self.num += 1
        print self.num  
      

讨教self.crawl中能否有某个参数可以完成变量的转达?

我试着用global定义全局变量:

from pyspider.libs.base_handler import *

global num
num = 0

class HandlerBaseHandler:
    crawl_config = {
        
    }
    

    @everyminutes=24 * 60
    def on_startself:
        global num
        num += 1
        print num
        self.index_page
        

    @configage=10 * 24 * 60 * 60
    def index_pageself:
        global num
        num +=1
        print num
        self.crawlhttp://www.baidu.com,callback=self.detail_page
        print num
        
        

    @configpriority=2
    def detail_pageself:
        global num
        print num
        num += 1
        print num

还是呈现这个题目,detail_page函数实行时,num的值是初始值。

根底比较薄弱,望大神辅导

http://docs.pyspider.org/en/l…

找到题目了,pyspider文档中的crawl参数save 可以转达变量

(看完/读完)这篇文章有何感想! msyz999明仕亚洲官网的分享…

发表评论

姓名 *
电子邮件 *
站点