Scrapy - Altre impostazioni
La tabella seguente mostra altre impostazioni di Scrapy -
Suor n | Impostazione e descrizione |
---|---|
1 | AJAXCRAWL_ENABLED Viene utilizzato per abilitare le grandi ricerche per indicizzazione. Valore predefinito: False |
2 | AUTOTHROTTLE_DEBUG È abilitato per vedere come vengono regolati i parametri di limitazione in tempo reale, che mostra le statistiche su ogni risposta ricevuta. Valore predefinito: False |
3 | AUTOTHROTTLE_ENABLED Viene utilizzato per abilitare l'estensione AutoThrottle. Valore predefinito: False |
4 | AUTOTHROTTLE_MAX_DELAY Viene utilizzato per impostare il ritardo massimo per il download in caso di latenze elevate. Valore predefinito: 60,0 |
5 | AUTOTHROTTLE_START_DELAY Viene utilizzato per impostare il ritardo iniziale per il download. Valore predefinito: 5,0 |
6 | AUTOTHROTTLE_TARGET_CONCURRENCY Definisce il numero medio di richieste che uno Scrapy invia parallelamente a siti remoti. Valore predefinito: 1.0 |
7 | CLOSESPIDER_ERRORCOUNT Definisce il numero totale di errori che dovrebbero essere ricevuti prima che lo spider venga chiuso. Valore predefinito: 0 |
8 | CLOSESPIDER_ITEMCOUNT Definisce un numero totale di elementi prima di chiudere lo spider. Valore predefinito: 0 |
9 | CLOSESPIDER_PAGECOUNT Definisce il numero massimo di risposte di cui eseguire la scansione prima che lo spider si chiuda. Valore predefinito: 0 |
10 | CLOSESPIDER_TIMEOUT Definisce la quantità di tempo (in secondi) per la chiusura di un ragno. Valore predefinito: 0 |
11 | COMMANDS_MODULE Viene utilizzato quando si desidera aggiungere comandi personalizzati nel progetto. Valore predefinito: '' |
12 | COMPRESSION_ENABLED Indica che il middleware di compressione è abilitato. Valore predefinito: vero |
13 | COOKIES_DEBUG Se impostato su true, vengono registrati tutti i cookie inviati nelle richieste e ricevuti nelle risposte. Valore predefinito: False |
14 | COOKIES_ENABLED Indica che il middleware dei cookie è abilitato e inviato ai server web. Valore predefinito: vero |
15 | FILES_EXPIRES Definisce il ritardo per la scadenza del file. Valore predefinito: 90 giorni |
16 | FILES_RESULT_FIELD Viene impostato quando si desidera utilizzare altri nomi di campo per i file elaborati. |
17 | FILES_STORE Viene utilizzato per memorizzare i file scaricati impostandolo su un valore valido. |
18 | FILES_STORE_S3_ACL Viene utilizzato per modificare la policy ACL per i file archiviati nel bucket Amazon S3. Valore predefinito: privato |
19 | FILES_URLS_FIELD Viene impostato quando si desidera utilizzare un altro nome di campo per gli URL dei file. |
20 | HTTPCACHE_ALWAYS_STORE Spider memorizzerà accuratamente le pagine nella cache se questa impostazione è abilitata. Valore predefinito: False |
21 | HTTPCACHE_DBM_MODULE È un modulo database utilizzato nel backend di archiviazione DBM. Valore predefinito: "anydbm" |
22 | HTTPCACHE_DIR È una directory utilizzata per abilitare e memorizzare la cache HTTP. Valore predefinito: "httpcache" |
23 | HTTPCACHE_ENABLED Indica che la cache HTTP è abilitata. Valore predefinito: False |
24 | HTTPCACHE_EXPIRATION_SECS Viene utilizzato per impostare l'ora di scadenza per la cache HTTP. Valore predefinito: 0 |
25 | HTTPCACHE_GZIP Questa impostazione, se impostata su true, tutti i dati memorizzati nella cache verranno compressi con gzip. Valore predefinito: False |
26 | HTTPCACHE_IGNORE_HTTP_CODES Indica che le risposte HTTP non devono essere memorizzate nella cache con codici HTTP. Valore predefinito: [] |
27 | HTTPCACHE_IGNORE_MISSING Questa impostazione, se abilitata, le richieste verranno ignorate se non trovate nella cache. Valore predefinito: False |
28 | HTTPCACHE_IGNORE_RESPONSE_CACHE_CONTROLS È un elenco contenente i controlli della cache da ignorare. Valore predefinito: [] |
29 | HTTPCACHE_IGNORE_SCHEME Afferma che le risposte HTTP non devono essere memorizzate nella cache con schemi URI. Valore predefinito: ["file"] |
30 | HTTPCACHE_POLICY Definisce una classe che implementa la politica della cache. Valore predefinito: "scrapy.extensions.httpcache.DummyPolicy" |
31 | HTTPCACHE_STORAGE È una classe che implementa l'archiviazione della cache. Valore predefinito: "scrapy.extensions.httpcache.FilesystemCacheStorage" |
32 | HTTPERROR_ALLOWED_CODES È un elenco in cui tutte le risposte vengono passate con codici di stato diversi da 200. Valore predefinito: [] |
33 | HTTPERROR_ALLOW_ALL Questa impostazione, se abilitata, tutte le risposte vengono passate nonostante i suoi codici di stato. Valore predefinito: False |
34 | HTTPPROXY_AUTH_ENCODING Viene utilizzato per autenticare il proxy su HttpProxyMiddleware . Valore predefinito: "latin-1" |
35 | IMAGES_EXPIRES Definisce il ritardo per la scadenza delle immagini. Valore predefinito: 90 giorni |
36 | IMAGES_MIN_HEIGHT Viene utilizzato per rilasciare immagini troppo piccole utilizzando una dimensione minima. |
37 | IMAGES_MIN_WIDTH Viene utilizzato per rilasciare immagini troppo piccole utilizzando una dimensione minima. |
38 | IMAGES_RESULT_FIELD Viene impostato quando si desidera utilizzare un altro nome di campo per le immagini elaborate. |
39 | IMAGES_STORE Viene utilizzato per memorizzare le immagini scaricate impostandolo su un valore valido. |
40 | IMAGES_STORE_S3_ACL Viene utilizzato per modificare la policy ACL per le immagini archiviate nel bucket Amazon S3. Valore predefinito: privato |
41 | IMAGES_THUMBS È impostato per creare le miniature delle immagini scaricate. |
42 | IMAGES_URLS_FIELD Viene impostato quando si desidera utilizzare un altro nome di campo per gli URL delle immagini. |
43 | MAIL_FROM Il mittente utilizza questa impostazione per inviare le e-mail. Valore predefinito: "scrapy @ localhost" |
44 | MAIL_HOST È un host SMTP utilizzato per inviare e-mail. Valore predefinito: "localhost" |
45 | MAIL_PASS È una password utilizzata per autenticare SMTP. Valore predefinito: Nessuno |
46 | MAIL_PORT È una porta SMTP utilizzata per inviare e-mail. Valore predefinito: 25 |
47 | MAIL_SSL Viene utilizzato per implementare la connessione utilizzando la connessione crittografata SSL. Valore predefinito: False |
48 | MAIL_TLS Se abilitato, forza la connessione utilizzando STARTTLS. Valore predefinito: False |
49 | MAIL_USER Definisce un utente per autenticare SMTP. Valore predefinito: Nessuno |
50 | METAREFRESH_ENABLED Indica che il middleware di meta refresh è abilitato. Valore predefinito: vero |
51 | METAREFRESH_MAXDELAY È un ritardo massimo per il reindirizzamento di un meta refresh. Valore predefinito: 100 |
52 | REDIRECT_ENABLED Indica che il middleware di reindirizzamento è abilitato. Valore predefinito: vero |
53 | REDIRECT_MAX_TIMES Definisce il numero massimo di volte per il reindirizzamento di una richiesta. Valore predefinito: 20 |
54 | REFERER_ENABLED Indica che il middleware del referrer è abilitato. Valore predefinito: vero |
55 | RETRY_ENABLED Indica che il middleware per i tentativi è abilitato. Valore predefinito: vero |
56 | RETRY_HTTP_CODES Definisce quali codici HTTP devono essere ritentati. Valore predefinito: [500, 502, 503, 504, 408] |
57 | RETRY_TIMES Definisce il numero massimo di volte per riprovare. Valore predefinito: 2 |
58 | TELNETCONSOLE_HOST Definisce un'interfaccia su cui la console telnet deve ascoltare. Valore predefinito: "127.0.0.1" |
59 | TELNETCONSOLE_PORT Definisce una porta da utilizzare per la console telnet. Valore predefinito: [6023, 6073] |