Scrapy - Definisci un oggetto

Descrizione

Gli elementi sono i contenitori utilizzati per raccogliere i dati che vengono scartati dai siti web. Devi avviare il tuo ragno definendo il tuo oggetto. Per definire gli elementi, modificaitems.py file trovato nella directory first_scrapy(directory personalizzata). Il file items.py ha il seguente aspetto:

import scrapy  

class First_scrapyItem(scrapy.Item): 
   # define the fields for your item here like: 
      # name = scrapy.Field()

La classe MyItem eredita da Item contenente un numero di oggetti predefiniti che Scrapy ha già creato per noi. Ad esempio, se si desidera estrarre il nome, l'URL e la descrizione dai siti, è necessario definire i campi per ciascuno di questi tre attributi.

Quindi, aggiungiamo quegli oggetti che vogliamo raccogliere -

from scrapy.item import Item, Field  

class First_scrapyItem(scrapy.Item): 
   name = scrapy.Field() 
   url = scrapy.Field() 
   desc = scrapy.Field()