Aldo Agostinelli

L’errore 404 – o Page Not Found – è un messaggio che capita spesso di incontrare sul web e che si presenta perché le pagine possono essere state spostate oppure eliminate. Sia per l’utente, sia per il gestore di un sito, esiste il modo per aggirare l’errore e per risolverlo. Vediamo come

Tutti siamo incappati nel famoso e “misterioso” errore 404. È questa la dicitura che compare quando una pagina web “sparisce”. Ma che cosa significa? L’errore 404 fa parte dei codici di stato di http, e viene generato dai robot dei motori di ricerca di quando una pagina web non esiste più. Vedremo meglio più avanti di cosa si tratta e come risolvere la pagina di errore 404 in due situazioni. Da parte dell’utente che naviga sul web e voglia visitare delle pagine web che sono state spostate o dei siti web che non si trovano più. E dal punto di vista di chi, gestendo un sito web, venga a sapere che è stato trovato un errore http 404 e voglia risolverlo.

A cosa serve la pagina 404?

L’errore 404, o 404 Not Found, fa parte dei codici di stato di http, il protocollo che gestisce la navigazione sul web. Si tratta di un errore generato dal client e indica l’impossibilità di raggiungere, in quel momento, una pagina web. È possibile, per capirci, che quella stessa pagina possa tornare disponibile in un altro momento. Al contrario dell’errore 410 gone (molto meno frequente) che viene generato quando una pagina web non è raggiungibile né potrà mai più esserlo. L’avviso di errore 404 compare quando i robot dei motori di ricerca, analizzando i link presenti nelle diverse pagine web, incappano in un contenuto che non esiste più. Questa “sparizione” può indicare ad esempio che un sito è stato spostato oppure rimosso, che un’immagine o un contenuto multimediali sono stati eliminati e così via.

Cosa causa l’errore 404

Come abbiamo detto, l’errore 404 indica una pagina web non più esistente. Questa pagina potrebbe essere stata spostata su un altro url oppure eliminata. Ma può anche capitare che questo messaggio compaia se si digita l’indirizzo in modo scorretto: basta un carattere, e in questo caso la soluzione è immediata. Alternativamente, la causa può risalire a un server web non in funzione o a una connessione interrotta. Le cause sono insomma molteplici. E la presenza di link inattivi sul web è abbastanza diffusa, perché i gestori dei siti non se ne rendono conto. Per farlo, bisognerebbe controllare periodicamente i link esterni inseriti nei propri contenuti.

Come aggirare l’errore 404

Gli errori 404 possono essere “aggirati” dall’utente che naviga sul web grazie alla cache. La copia cache è una versione precedente della pagina web che non si riesce a raggiungere. Quindi bisogna tenere a mente che potrebbe non essere aggiornata e contenere informazioni non più attuali. Consapevoli di ciò, in questo modo si può almeno visionare il contenuto desiderato. Per farlo, si deve prima di tutto cercare il nome del sito o l’indirizzo della pagina non più esistente sulla finestra di ricerca di Google. Osservando i risultati, in corrispondenza dell’indirizzo della pagina cercata, noterete una freccetta rivolta in basso. Cliccandola, potrete selezionare la voce “copia cache”. E a questo punto si aprirà la versione non aggiornata del sito “scomparso”.

Oltre a Google, si può utilizzare, per ottenere lo stesso risultato, il portale Wayback Machine, nato proprio con l’obiettivo di archiviare vecchie versioni di pagine e siti web. Una volta entrati sul portale, si digita l’indirizzo della pagina web non più esistente nell’apposita casella. Premendo invio arriveranno diversi risultati, corrispondenti alle versioni precedenti di quella pagina. Si può selezionare l’anno desiderato e visualizzare la relativa versione. Wayback Machine rappresenta una valida alternativa a Google, se il primo tentativo di ricerca della copia cache non dovesse funzionare (può capitare).

Come risolvere error 404?

Per risolvere gli errori 404 presenti nel proprio sito web bisogna eliminare tutti i riferimenti a contenuti non più esistenti. Come? La soluzione arriva da Google Search Console. Questo portale offre diversi strumenti che permettono di monitorare lo stato di un sito web e di ottimizzarlo. Per prima cosa bisogna verificare che il file robots.txt del proprio sito web consenta la scansione da parte dello spider di Google. Dopodiché, dalla home di Google Search Console, si clicca sulla finestra “sito web” e si digita l’indirizzo della home page del proprio sito, in modo da associarlo alla piattaforma.

Dopo aver validato la proprietà del sito, scaricando un file di verifica e caricandolo sul sito stesso, si può procedere alla scansione dalla voce “scansione” e “sitemap”. Da qui si clicca su “aggiungi/testa sitemap” e poi si seguono le istruzioni. Perché la scansione venga completata e gli errori siano rilevati, possono trascorrere alcuni giorni. Per visualizzare i risultati, tornando sulla home page della Search Console basta cliccare sulla voce “scansione ed errori”. Esiste proprio la categoria specifica “non trovato” dove vengono raccolti tutti gli errori 404 presenti.  A questo punto, le pagine non più raggiungibili possono essere eliminate dal proprio sito.

Plugin per CMS

Risolvere l’errore 404 su WordPress o qualsiasi altro CMS è più facile, perché ci si può avvalere dell’aiuto dei plugin integrati.  I più noti sono Yoast SEO e Broken Link Checker per WordPress, Link Checker per Joomla. Questi plugin provvedono a scansionare il sito web in modo automatico, eliminando gli eventuali errori 404 e, ove possibile, generando dei redirect automatici. In alternativa, possono anche creare delle pagine d’errore personalizzate più “piacevoli” di quelle standard e fredde generate automaticamente. Chi ha un blog o un sito in WordPress, quindi, può preoccuparsi meno degli errori 404.

Che problemi crea l’errore 404

Normalmente l’errore 404 non influisce sul posizionamento SEO di un sito web. Dunque, da questo punto di vista non c’è da preoccuparsi. Tuttavia, la comparsa di una pagina di errore crea sicuramente problemi per quanto riguarda l’esperienza di navigazione degli utenti. Incappare in queste pagine infastidisce i “naviganti”, che potrebbero spazientirsi e approdare altrove. In presenza di molti errori 404 il tasso di rimbalzo si alza. Specialmente se parliamo di un e-commerce, e l’errore interrompe l’esperienza di acquisto. Per questo, è importante tenere sotto controllo il proprio sito web e risolvere gli eventuali errori seguendo le procedure che abbiamo indicato sopra.

Siccome la risoluzione del problema non è sempre immediata e qualche pagina di errore potrebbe sfuggire, un’altra cosa da fare è personalizzare il messaggio di “page not found”. Ormai molti siti lo fanno, puntando su qualche frase o immagine simpatica o ad effetto. In modo da riuscire a strappare un sorriso e creare una forma di vicinanza con chi naviga. Per farlo si possono scegliere diversi stili: l’importante, come sempre, è saper rivolgersi al proprio pubblico nel modo giusto. Per alcuni brand, la pagina 404 può diventare una vera e propria occasione di marketing: date un’occhiata a questi esempi. D’altronde, anche questo è un contenuto che va curato.

Quando non è necessario correggerlo

In alcuni casi non vale la pena correggere gli errori 404, e si può semplicemente lasciar perdere. Ad esempio, se esiste una nuova pagina o una pagina sostitutiva di quella che è stata eliminata. In questa situazione basta rimuovere i link interni  – se presenti – che collegano alla pagina vecchia. Così, col tempo, anche Google eviterà di restituire la pagina non più esistente nei risultati di ricerca. Non vale la pena correggere l’errore anche quando parliamo di pagine che non sono mai esistite e se non si riconosce un indirizzo sul proprio sito web.

Gli errori soft 404

Gli errori soft 404 vengono generati da codici di risposta diversa dai 404 e 410 nonostante la pagina ricercata sia inesistente. Può accadere quando i server gestiscono indirizzi che non funzionano correttamente, e di conseguenza l’utente viene reindirizzato a un’altra pagina. A differenza dei “normali” errori 404, gli errori soft possono creare problemi di indicizzazione, perché gli spider dei motori di ricerca impiegano molto tempo a scansionarli. Vanno quindi verificati e, tra le due opzioni, fare in modo che restituiscano un meno problematico errore 404. Se si tratta di pagine spostate, si può invece procedere a un reindirizzamento 301 che porti l’utente alla destinazione corretta.

Aldo Agostinelli