Google indicizzazione https

Il 6 agosto 2014 su Google Webmaster Central Blog viene pubblicato un articolo intitolato HTTPS as a ranking signal.

L’articolo inizia con:

Security is a top priority for Google. We invest a lot in making sure that our services use industry-leading security, like strong HTTPS encryption by default. That means that people using Search, Gmail and Google Drive, for example, automatically have a secure connection to Google.

Già da diverso tempo molti dei servizi di Google come Search, Gmail, Drive, Youtube, AdWords, Analytics, ecc.  interagiscono con gli utenti attraverso connessioni crittografate su HTTPS.

Google attraverso questo post su Webmaster Central Blog, inizia a manifestare la volontà di voler fornire agli utenti, contenuti e servizi attraverso connessioni sicure, in un contesto di sicurezza più ampio che va oltre le proprie App o servizi.

Rendere Internet più sicuro, lavorando soprattutto sui risultati forniti dal motore di ricerca, proponendo agli utenti contenuti ritenuti più attendibili, perché forniti attraverso connessioni crittografate.

Le risorse messe in campo sono diverse, qualche mese prima di questo post, al Google I/O 2014 con un video disponibile su youtube viene presentato il progetto HTTPS Everywhere, mentre i Webmaster già da diverso tempo hanno a disposizione in Search Control un tool per prevenire e risolvere violazioni della sicurezza sui siti web.

Per queste ragioni già a partire dall’agosto 2014 l’HTTPS diventa un fattore di ranking, non rilevante come i contenuti di qualità, ma viene preso in considerazione come un elemento che può influire sul ranking stesso.

Il post chiude con questo auspicio:

We hope to see more websites using HTTPS in the future. Let’s all make the web more secure!

HTTPS_icon

Indicizzazione di default della pagine https

Il 17 dicembre 2015 con un altro articolo su Google Webmaster Central Blog – Indexing HTTPS pages by default viene annunciata l’indicizzazione di default delle pagine HTTPS.

L’https diventa elemento di ranking inserito definitivamente anche nelle linee guida di Google per i webmaster.

Google rafforza e conferma la volontà di voler promuovere l’adozione di HTTPS ovunque. Il web inteso come esplorazione privata tra utente e sito web, senza avere problemi legati a rischi per la sicurezza come intercettazioni, man-in-the-middle o modifica dei dati stessi.

Come avverrà l’indicizzazione di default della pagine https?

Nel post si legge che inizieranno a scansionate tutte le pagine HTTPS che già hanno un equivalente HTTP.

In presenza di due URL identiche dello stesso dominio, con contenuti equivalenti, ma servite su protocolli diversi, verranno scelte ed indicizzate URL fornite su HTTPS se:

  • Non contengono dipendenze insicure
  • Non sono risorse bloccate da robots.txt
  • Non reindirizzano l’utente su una pagina HTTP
  • Non contengono un rel = “canonical ” alla pagina HTTP
  • Non contengono un robot noindex tag
  • La sitemap contiene URL HTTPS e non elenca la versione HTTP delle URL
  • Il Server dispone di un certificato TLS valido

In questo modo nel motore di ricerca inizieranno ad essere indicizzate pagine HTTPS che verranno successivamente fornite agli utenti attraverso il motore di ricerca Google.

In generale dopo aver attivato un certificato HTTPS che lavora sia per un dominio www che non www, sul proprio sito sarà sufficiente inserire nell’ .htaccess:

<IfModule mod_rewrite.c>
RewriteEngine on	
RewriteCond %{HTTPS} off
RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]
</IfModule>

in questo modo tutti i link http://tuodominio.com e http://www.tuodominio.com verranno reindirizzati e forniti su https://tuodominio.com.

Sarà importante attivare una nuova proprietà web su Google Search control inviando una nuova sitemap con link HTTPS del tipo https://tuodominio.com/sitemap.xml

Sarà necessario attivare anche una nuova proprietà su Google Analytics, fornendo come dominio il link servito su HTTPS e sostituendo il vecchio codice UA-XXXXXX (con riferimento ad HTTP) con il nuovo codice UA-XXXXXXX che fa riferimento al dominio HTTPS.