import scrapy,re
from scrapy.selector import Selector
from scrapy.http import Request
from novelspider.items import NovelspiderItem
import re
class novelSpider(scrapy.Spider):
name = 'novelSpider'
allowed_domains = ["www.tibetif.com"]
url = "http://www.tibetif.com/index.php?m=content&c=index&a=lists&catid=955"
start_urls = [url]
def parse(self, response):
item = NovelspiderItem()
list = response.xpath(".//table[@class='proinfo']/tbody/tr")
for i in range(2,len(list)):
item['projectNo'] = list[i].xpath(".//td/text()").extract()[0].strip()
item['url'] = list[i].xpath(".//td[2]/a/@href").extract()[0]
item['title'] = list[i].xpath(".//td[2]/a/text()").extract()[0]
item['money'] = list[i].xpath(".//td[4]/text()").extract()[0]
item['date'] = list[i].xpath(".//td[5]/text()").extract()[0]
yield scrapy.Request(item['url'],meta={'item':item},callback=self.detail)
def detail(self,response):
item = response.meta['item']
selector = Selector(response)
text = selector.xpath(".//div[@class='wrapper']/table[3]").xpath('string(.)').extract()[0].replace("\n"," ").replace("\t"," ").replace("\r"," ").strip('\n').strip('\t').strip('\r').lstrip().rstrip()
print(item['title'])
companyObj = re.search(r'標的企業(yè)名稱\s*(\S+)',text)
if companyObj:
item['company'] = str(companyObj.group(1))
priceObj = re.search(r'注冊資本\(元\)\s*(\S+)',text)
if priceObj:
item['price'] = str(priceObj.group(1))
return item
問題:Python3 Scrapy框架中不進入yield scrapy.Request(item['url'],meta={'item':item},callback=self.detail)中的callback=self.detail函數(shù),導致數(shù)據(jù)庫中在parse函數(shù)中取得的值都是最后一個頁面的值
北大青鳥APTECH成立于1999年。依托北京大學優(yōu)質(zhì)雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國家
北大青鳥中博軟件學院創(chuàng)立于2003年,作為華東區(qū)著名互聯(lián)網(wǎng)學院和江蘇省首批服務外包人才培訓基地,中博成功培育了近30000名軟件工程師走向高薪崗位,合作企業(yè)超4
中公教育集團創(chuàng)建于1999年,經(jīng)過二十年潛心發(fā)展,已由一家北大畢業(yè)生自主創(chuàng)業(yè)的信息技術與教育服務機構,發(fā)展為教育服務業(yè)的綜合性企業(yè)集團,成為集合面授教學培訓、網(wǎng)
達內(nèi)教育集團成立于2002年,是一家由留學海歸創(chuàng)辦的高端職業(yè)教育培訓機構,是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市,融資1
曾工作于聯(lián)想擔任系統(tǒng)開發(fā)工程師,曾在博彥科技股份有限公司擔任項目經(jīng)理從事移動互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍懿科技有限責任公司從事總經(jīng)理職務負責iOS教學及管理工作。
浪潮集團項目經(jīng)理。精通Java與.NET 技術, 熟練的跨平臺面向?qū)ο箝_發(fā)經(jīng)驗,技術功底深厚。 授課風格 授課風格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫,具有快速界面開發(fā)的能力,對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁制作和網(wǎng)頁游戲開發(fā)。
具有10 年的Java 企業(yè)應用開發(fā)經(jīng)驗。曾經(jīng)歷任德國Software AG 技術顧問,美國Dachieve 系統(tǒng)架構師,美國AngelEngineers Inc. 系統(tǒng)架構師。