Il mio nuovo Blog: Design Multimedia Cos’è uno Spider?

Design & Multimedia Blog

Cos’è uno Spider?

Uno Spider (o robot) è un sistema automatico di navigazione internet che i motori di ricerca utilizzano per scandagliare la rete alla ricerca di pagine nuove o aggiornate…

spider web

La frequenza o l’accettazione di visite degli Spider in un sito, è gestibile dai metatag di pagina. Prendete come esempio il seguente codice:

Che è praticamente l’invito agli spider di tornate ogni 3 giorni.

Le prime visite, degli Spider, saranno saltuarie e poco regolari e non registreranno oltre che l’Index del sito.
Inseguito gli Spider, dopo aver verificato che il sito continua ad esestere, si muoveranno sempre più nell’interno “dell’albero” del sito.
Un codice html pulito facilita il passagio di questi benvenuti(quasi sempre) ospiti. Per codice pulito intendo dire che, il link riferiti alle pagine interne del sito, è bene che siano semplici url e non Javascript, Applet, Flash link, altrimenti lo spider non potrà valicare l’ostacolo e la pagina non sarà mai indicizzata e di conseguenza, mai trovata via motore di ricerca.
A volete accade di trovarsi davanti a siti con Pagerank 3/4 nella pre homepage (o intropage), ma con Pagerank zero nelle sue interne. Questo è un tipico caso duvuto dal fatto che lo spider non riesce a risalire sulla homepage per colpa di un link non “pulito” (come ho spiegato sopra).
Per lo stesso motivo i siti in Flash hanno poco potere sui motori di ricerca. Comunque è già stato comunicato che in futuro anche gli .SWF saranno indicizzati.

Per questioni di scelta si può anche proibire l’indicizzazione di pagine o consentirne il solo passaggio come in questo esempio di codice:

Ecco altri CONTENT che possono essere utilizzati:

all indica che tutte le pagine possono essere indicizzati

  • none indica che nessun file va indicizzato e che non vanno attuati i collegamenti inseriti nella pagina
  • index indica che la pagina può essere indicizzata
  • noindex indica che la pagina non può essere indicizzata
  • follow indica che lo spider può seguire i collegamenti dalla pagina in oggetto ad altre pagine
  • nofollowindica che lo spider non può seguire i collegamenti dalla pagina in oggetto ad altre pagine
scritto da: DesMM
DesMM
martedì, 18 gennaio 2005
Esprimi anche il tuo parere...

scrivi cosa ne pensi!


2 commenti su Cos’è uno Spider?

  1. chatexpert

    Complimenti per il sito..l’ho trovato molto interesante.

    domenica, 30 gennaio 2005
  2. Valore del Pagerank - DesMM.com

    [...] Googlebot è lo spider di Google ed è colui che scansiona la rete alla ricerca di pagine nuove ed aggiornamenti, in questo caso il Pagerank farà in modo di far capire allo spider, quanto in profondità debba entrare nell’albero del sito. Naturalmente più sarà alto il PR maggiore sarà il numero di pagine monitorate dello stesso sito. [...]

    sabato, 07 gennaio 2006







Template DesMM 4
Engine by WordPress
Design & Multimedia Blog © 2002 - 2010 | Curriculum webmaster
Progetto e Design sono esclusiva proprietà di Massimo Mastromarino
designmultimedia (RSS) | Licenza d'uso