<?xml version="1.0" encoding="UTF-8"?> <rss version="2.0"
xmlns:content="http://purl.org/rss/1.0/modules/content/"
xmlns:wfw="http://wellformedweb.org/CommentAPI/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:atom="http://www.w3.org/2005/Atom"
xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
><channel><title>Fortunecat.it &#187; SEO</title> <atom:link href="http://www.fortunecat.it/argomenti/seo/feed/" rel="self" type="application/rss+xml" /><link>http://www.fortunecat.it</link> <description>SEO, web marketing e notizie dal mondo dei motori di ricerca</description> <lastBuildDate>Thu, 29 Jul 2010 09:28:15 +0000</lastBuildDate> <language>it</language> <sy:updatePeriod>hourly</sy:updatePeriod> <sy:updateFrequency>1</sy:updateFrequency> <generator>http://wordpress.org/?v=3981</generator> <item><title>Oltre la personalizzazione dei risultati di ricerca</title><link>http://www.fortunecat.it/2010/07/personalizzazione-risultati-ricerca/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=personalizzazione-risultati-ricerca</link> <comments>http://www.fortunecat.it/2010/07/personalizzazione-risultati-ricerca/#comments</comments> <pubDate>Fri, 09 Jul 2010 10:48:53 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=1376</guid> <description><![CDATA[Un saluto ai lettori&#8230; questo è l&#8217;ultimo post di approfondimento prima della pausa estiva. Il sito comunque verrà aggiornato con le Flash News e &#8211; per chi volesse approfondire &#8211; anche con le risorse segnalate su Social Breed, per cui se volete potete abbonarvi ai rispettivi feed rss. Oggi vi presento un brevetto molto interessante, [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/07/personalizzazione-risultati-ricerca/">Oltre la personalizzazione dei risultati di ricerca</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Un saluto ai lettori&#8230; questo è l&#8217;ultimo post di approfondimento prima della pausa estiva. Il sito comunque verrà aggiornato con le Flash News e &#8211; per chi volesse approfondire &#8211; anche con le risorse segnalate su Social Breed, per cui se volete potete abbonarvi ai rispettivi <a href="http://feeds.fortunecat.it/seofortunecat" target="_blank">feed</a> <a href="http://feeds.fortunecat.it/social-bookmark" target="_blank">rss</a>.</p><p>Oggi vi presento un brevetto molto interessante, &#8220;<strong>Model generation for ranking documents based on large data sets</strong>&#8221; assegnato a Google in data 22 Giugno 2010.</p><p>Questo brevetto merita un&#8217;attenta analisi, perché introduce nuove modalità per il ranking di grandi quantità di documenti (e ricordiamo che il nuovo indice di Google &#8211; Caffeine &#8211; è stato progettato anche per questa ragione).</p><p>Tutti i fattori di ranking esistenti possono essere condensati da Google in un unico singolo fattore: nella probabilità che l&#8217;utente <strong>u</strong>, data la query <strong>q</strong>, scelga il documento <strong>d</strong>.</p><p><span style="color: #e82c2b;"><strong>L&#8217;utente diventa centrale nel ranking dei documenti</strong></span></p><p>Per calcolare il posizionamento di un sito Google prende in considerazione la terna <strong>(utente, query, documento)</strong> ed è proprio l&#8217;utilizzo di una terna a costituire l&#8217;aspetto più innovativo.</p><p>Il documento non viene più valutato in termini assoluti; non si tratta più unicamente di personalizzazione dei risultati di ricerca. Google si spinge oltre: cerca di generare un modello di ranking ad hoc per ogni specifico utente che effettua una specifica query.</p><p><span style="color: #e82c2b;"><strong>Generazione del modello</strong></span></p><p>Partiamo da un&#8217;istanza (u, q, d). Ossia: c&#8217;è un utente <strong>u</strong>, che effettua una query <strong>q</strong> e seleziona un documento <strong>d</strong>. Di ogni istanza vengono memorizzate le caratteristiche (<span style="text-decoration: underline;">feature</span>) più importanti in un <strong>feature-to-istance index</strong>.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-1399" title="feature-to-istance index" src="http://www.fortunecat.it/wp-content/uploads/2010/07/feature-to-istance.png" alt="personalizzazione risultati ricerca" width="622" height="479" /></p><p>I dati memorizzati da Google possono essere i seguenti:</p><ul><li>paese di provenienza dell&#8217;utente u;</li><li>ora del giorno in cui l&#8217;utente u effettua la query q;</li><li>lingua parlata nel paese di provenienza dell&#8217;utente u;</li><li>le tre query effettuate dall&#8217;utente u prima dell&#8217;attuale query q;</li><li>il linguaggio della query q;</li><li>l&#8217;esatta stringa della query q, i singoli termini che la compongono e il numero di parole;</li><li>i termini contenuti nel documento d;</li><li>i termini contenuti nell&#8217;url del documento d;</li><li>gli ancor text dei link che puntano al documento d;</li><li>le parole nel titolo del documento d e nei documenti mostrati al di sotto e al di sopra di d nei risultati di ricerca;</li><li>il numero di volte in cui una parola della query q è contenuta nel documento d;</li><li>il numero di volte in cui l&#8217;utente u ha avuto accesso al documento d.</li></ul><p>A partire da questi dati viene generato un <strong>ranking model</strong> specifico, che valuta appunto la probabilità che l&#8217;utente u, effettuando la query q decida di cliccare proprio sul documento d. Ed è proprio questa probabilità a costituire lo score, il punteggio in base al quale viene effettuato l&#8217;ordinamento dei risultati di ricerca.</p><p><span style="color: #e82c2b;"><strong>Facciamo un esempio</strong></span></p><p>L&#8217;utente accede a Google per la prima volta ed effettua una ricerca. In assenza di dati pregressi sul suo comportamento (l&#8217;utente non ha mai effettuato query analoghe in passato) viene calcolata una probabilità <strong>a priori</strong>.</p><p>Cosa accade quando l&#8217;utente, servito con un determinato set di risultati di ricerca clicca su un dato documento d?</p><p>Le probabilità a priori calcolate in precedenza vengono aggiornate tenendo conto di questa nuova probabilità misurata a posteriori (cioè dopo che l&#8217;utente ha scelto). E conseguentemente viene aggiornato il modello di ranking.</p><p>Grazie ai dati raccolti nel feature-to-istance index il motore di ricerca è in grado di aggiornare continuamente i propri modelli stabilendo non solo i <strong>pesi</strong> per ponderare ciascun criterio di ranking ma anche quali <strong>criteri</strong> utilizzare in funzione della specifica istanza.</p><p>Questo brevetto è fondamentale per capire:</p><ol><li>come funzionano i meccanismi della personalizzazione dei risultati di  ricerca;</li><li> come Google utilizza i dati degli utenti per perfezionare i propri algoritmi.</li></ol><p>Se siete loggati in Google, effettuate una query e cliccate su un dato documento, Google utilizzerà quell&#8217;informazione per aggiornare il modello di ranking.</p><p>Ma l&#8217;aggiornamento del modello non riguarda solo voi. Google utilizza le informazioni memorizzate nel feature-to-istance index come <strong>training data</strong> per perfezionare il modello da utilizzare per <span style="text-decoration: underline;">tutti</span> gli utenti con caratteristiche simili alle vostre.</p><p><span style="color: #e82c2b;"><strong>Conclusione</strong></span></p><p>Se vi loggate in Google, fate una ricerca e cliccate su un sito, il sito in questione  guadagna posizioni nei vostri risultati di ricerca personalizzati.</p><p>Ma non solo. La vostra scelta influenza in qualche modo anche il ranking per gli utenti &#8220;simili&#8221; a voi.</p><p>Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/07/personalizzazione-risultati-ricerca/">Oltre la personalizzazione dei risultati di ricerca</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/07/personalizzazione-risultati-ricerca/feed/</wfw:commentRss> <slash:comments>10</slash:comments> </item> <item><title>Google MayDay: un po&#8217; di chiarezza</title><link>http://www.fortunecat.it/2010/05/google-mayday/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=google-mayday</link> <comments>http://www.fortunecat.it/2010/05/google-mayday/#comments</comments> <pubDate>Mon, 17 May 2010 15:40:38 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=1259</guid> <description><![CDATA[[Update 27/05/2010] Matt Cutts ha confermato che alla base del Google MayDay c&#8217;è una modifica degli algoritmi di Google. SearchEngineLand riporta: Based on Matt’s comment at Google I/O, the pages that are now ranking well for these long tail queries are from “higher quality” sites (or perhaps are “higher quality” pages). My complete speculation is [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/05/google-mayday/">Google MayDay: un po&#8217; di chiarezza</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p><strong>[Update 27/05/2010] </strong></p><p>Matt Cutts ha confermato che alla base del Google MayDay c&#8217;è una modifica degli algoritmi di Google. <a href="http://searchengineland.com/google-confirms-mayday-update-impacts-long-tail-traffic-43054" target="_blank">SearchEngineLand</a> riporta:</p><blockquote><p>Based on Matt’s comment at Google I/O, the pages that are now ranking  well for these long tail queries are from “higher quality” sites (or  perhaps are “higher quality” pages). My complete speculation is that perhaps the relevance algorithms have  been tweaked a bit.</p></blockquote><p><span style="color: #e82c2b;"><strong>Fortunecat.it ve lo ha detto con 10 giorni di anticipo.</strong><strong>..</strong></span> <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p><strong>[/Update]</strong></p><p>Google MayDay: in questi giorni ho ricevuto parecchie richieste a riguardo, quindi ho pensato di scrivere un post per fare po&#8217; di chiarezza.</p><p><strong>Ma cos&#8217;è Google MayDay?</strong></p><p>In questo periodo numerosi webmaster hanno riscontrato una vistosa riduzione degli accessi provenienti da Google. Molti hanno notato che il calo più significativo di visite riguarda le cosiddette long tail, le frasi chiave costituite da 3 o più termini.</p><p>Questo problema è stato ironicamente battezzato &#8220;MayDay&#8221;, sia perche &#8220;la parola mayday è utilizzata in radiofonia per indicare un&#8217;immediata necessità di aiuto da parte di un&#8217;imbarcazione o di un velivolo&#8221; (da Wikipedia), sia perchè il calo di visite è stato notato nei primi giorni di Maggio (May Day).</p><p><strong>Quali sono le possibili cause?</strong></p><p>La mia opinione è la seguente: <strong>Google ha semplicemente &#8220;snellito&#8221; il proprio indice di ricerca</strong>.</p><p>Sicuramente avrete sentito parlare di Google Caffeine: Caffeine in sostanza è un aggiornamento dell&#8217;infrastruttura di Google, e tra gli obiettivi dichiarati di tale aggiornamento vi è proprio quello di <span style="text-decoration: underline;">aumentare la velocità delle ricerche</span>.</p><p><strong>Come si può &#8220;snellire&#8221; il Google Index?</strong></p><p>Cerchiamo di capire come innanzitutto come è costituito un indice, facendo riferimento al brevetto “Index server architecture using tiered and sharded phrase posting list”.</p><p>Tutti i moderni motori di ricerca utilizzano le frasi per indicizzare, cercare, organizzare e descrivere i documenti. I documenti sono indicizzati tenendo conto delle frasi in essi contenute utilizzando una <strong>phrase posting list</strong>.</p><p>Le phrase posting list sono memorizzate in un cluster dell&#8217;index server e per motivi di performance possono essere raggruppate oppure partizionate in vario modo. Le frasi sono individuate considerando anche ogni possibile &#8220;phrasification&#8221; o variazione sul tema.</p><p><strong>In termini più semplici:</strong></p><ul><li>I motori di ricerca creano un indice che collega i documenti alle frasi presenti nel documento stesso.</li><li>L&#8217;indice generato è denominato pertanto <strong>inverted index</strong>, perché fa corrispondere ad ogni frase chiave un set di documenti rilevanti.</li><li>Possiamo immaginare l&#8217;intero indice come un&#8217;insieme di &#8220;blocchi&#8221; (le posting list), ciascuno relativo ad una frase chiave.</li></ul><p>E qui arriviamo al punto fondamentale. Per rendere l&#8217;indice più &#8220;leggero&#8221; Google può agire su due fattori:</p><ul><li>sul numero di frasi chiave memorizzate;</li><li>sul numero delle pagine indicizzate.</li></ul><p><strong>Iniziamo dal primo punto: come vengono processate le query?</strong></p><p>I motori di ricerca di vecchia concezione scomponevano le query complesse in singole parole chiave. La query dell&#8217;utente veniva soddisfatta fornendo come risposta i documenti contenenti tutte le parole chiave, seguendo un matching “booleano” diretto.</p><p>I motori di ricerca attuali cercano di indicizzare i concetti, più che le semplici parole chiave. Proprio per questo le frasi chiave non vengono decomposte nelle singole parole ma in <strong>sottofrasi</strong>, generando un <strong><span style="text-decoration: underline;">albero di frasi</span></strong> per modellare concettualmente una query complessa.</p><p><strong>Andiamo con ordine</strong></p><p>Un insieme di parole non costituisce di per sé una frase. Come fa il motore di ricerca a distinguere le frasi?<br /> Google ovviamente ragiona in termini statistici. Le frasi concettualmente rilevanti appaiono nei documenti con maggiore frequenza rispetto alle combinazioni puramente casuali.</p><p>Il processo effettuato da Google è il seguente:</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-1275" title="Processo di indicizzazione delle frasi" src="http://www.fortunecat.it/wp-content/uploads/2010/05/processo-indicizzazione.png" alt="Processo di indicizzazione delle frasi" width="434" height="403" /></p><ul><li>Inizialmente vengono individuate delle possibili frasi, o frasi <strong>candidate</strong>.</li><li>Ad ogni frase candidata viene assegnato un <strong>phrase score</strong> in funzione della posizione nei documenti e del modo in cui la frase stessa viene utilizzata.</li><li>Solo se è statisticamente evidente che la frase è utilizzata in numerosi documenti (oppure anche in un singolo documento in modo diffuso), allora la frase candidata viene promossa da Google a frase &#8220;reale&#8221;.</li></ul><p>Da quanto detto sinora risultano chiare le tecniche adottate da Google per indicizzare le frasi più significative o più importanti, che dir si voglia.</p><p><strong>E le frasi lunghe e meno ricorrenti come vengono considerate?</strong></p><p>Qui c&#8217;è il nodo fondamentale. Per ogni frase processata vengono anche estratte le possibili <span style="text-decoration: underline;"><strong>sottofrasi</strong></span> in modo da ridurre il costo computazionale dell&#8217;indicizzazione.</p><p>Facciamo un esempio concreto, ecco come potrebbero essere processate le tre query:</p><ul><li>hotel rimini 3 stelle sul mare;</li><li>hotel tre stelle rimini fronte mare;</li><li>albergo rimini tre stelle vicino al mare.</li></ul><p style="text-align: center;"><img class="size-full wp-image-1279 alignnone" title="Phrase Tree" src="http://www.fortunecat.it/wp-content/uploads/2010/05/phrase-tree.png" alt="Phrase Tree" width="447" height="409" /></p><p>Le tre query/frasi vengono scomposte in sottofrasi e ricondotte ad un&#8217;unica <strong>unità concettuale</strong>. Per fare questo viene utilizzato un phrase tree, un albero che unisce logicamente fra loro le sottofrasi individuate.</p><p><strong>Qual è di fatto l&#8217;effetto di questo nuovo algoritmo?</strong></p><p>Per le frasi chiave più lunghe, per le cosiddette long tail, viene dato un minor peso al matching esatto dei termini, ed un peso maggiore al senso complessivo del documento.</p><p>Prima di Caffeine il fatto di scrivere nel vostro sito web la frase esatta &#8220;hotel rimini 3 stelle sul mare&#8221; vi dava un vantaggio significativo per quella long tail. Ora il peso della corrispondenza esatta è stato ridimensionato a favore di altri fattori, tra cui il senso del documento nel suo complesso, l&#8217;autorità del sito, ecc&#8230;</p><p><strong>Riduzione del numero di pagine indicizzate</strong></p><p>Ma siamo sicuri che il calo di visite sia solo dovuto alle long tail? Guardate questo diagramma che rapporta il numero di pagine indicizzate di <strong>FriendFeed</strong> in funzione della data di creazione delle pagine stesse.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-1284" title="Pagine indicizzate di FriendFeed" src="http://www.fortunecat.it/wp-content/uploads/2010/05/friendfeed.png" alt="Pagine indicizzate di FriendFeed" width="608" height="479" /></p><p>E guardate anche cosa è accaduto a Punto-informatico.it:</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-1285" title="Pagine indicizzate Punto-Informatico.it" src="http://www.fortunecat.it/wp-content/uploads/2010/05/punto-informatico.png" alt="Pagine indicizzate Punto-Informatico.it" width="623" height="367" /></p><p><strong>Sembra incredibile, ma persino FriendFeed.com è stato soggetto ad una pesante deindicizzazione.</strong></p><p>Fino a pochi mesi fa il numero di pagine indicizzate di FriendFeed era nettamente superiore, ve lo posso garantire in quanto uno dei miei seo tools utilizzava proprio Google per stimare il numero di link ad un dato dominio provenienti da FriendFeed.</p><p>E&#8217; evidente quindi che per alleggerire il proprio immenso indice di ricerca Google ha dovuto rimuovere moltissime pagine. E in nome della velocità ha scelto di sacrificare le pagine più &#8220;anziane&#8221;.</p><p>Interessante, eh?</p><p>Alla prossima&#8230; <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/05/google-mayday/">Google MayDay: un po&#8217; di chiarezza</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/05/google-mayday/feed/</wfw:commentRss> <slash:comments>19</slash:comments> </item> <item><title>Velocità: ecco i consigli di Google</title><link>http://www.fortunecat.it/2010/05/velocizzare-siti-web/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=velocizzare-siti-web</link> <comments>http://www.fortunecat.it/2010/05/velocizzare-siti-web/#comments</comments> <pubDate>Tue, 04 May 2010 06:31:43 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=1196</guid> <description><![CDATA[Salve a tutti, oggi continuiamo a parlare di velocità dei siti web. Vi propongo un interessante video dell&#8217;ingegnere di Google Maile Ohie. Il video affronta i seguenti argomenti: come Google affronta il tema delle performance; primi passi per rendere più veloce un sito web. Need for speed Perchè per Google la velocità ha una così [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/05/velocizzare-siti-web/">Velocità: ecco i consigli di Google</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Salve a tutti, oggi continuiamo a parlare di velocità dei siti web. Vi propongo un interessante video dell&#8217;ingegnere di Google <strong>Maile Ohie</strong>.</p><p style="text-align: center;"><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="526" height="320" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="src" value="http://www.youtube.com/v/OpMfx_Zie2g&amp;hl=it_IT&amp;fs=1&amp;rel=0&amp;showinfo=0" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="526" height="320" src="http://www.youtube.com/v/OpMfx_Zie2g&amp;hl=it_IT&amp;fs=1&amp;rel=0&amp;showinfo=0" allowscriptaccess="always" allowfullscreen="true"></embed></object></p><p>Il video affronta i seguenti argomenti:</p><ul><li>come Google affronta il tema delle performance;</li><li>primi passi per rendere più veloce un sito web.</li></ul><p><span style="color: #dd1d1c;"><strong>Need for speed</strong></span></p><p>Perchè per Google la velocità ha una così grande importanza? Perchè migliora notevolmente la <strong>user experience</strong>.</p><p>Si è osservato ad esempio che un sito veloce ha un numero maggiore di <span style="text-decoration: underline;">conversioni</span>. Sono state messe a confronto due versioni dello stesso identico sito, una ottimizzata (e quindi più veloce) e l&#8217;altra no. Dall&#8217;analisi delle landing page risulta che:</p><ul><li>su ShopZilla la maggiore velocità ha determinato dal 7% al 12% in più di conversioni;</li><li>su Firefox è stato notato un aumento del 15.4% dei downloads.</li></ul><p>Un sito più veloce inoltre ha una maggiore <span style="text-decoration: underline;">user satisfaction</span>.</p><p style="text-align: center;"><img class="size-full wp-image-1197" title="Impatto tempo di caricamento" src="http://www.fortunecat.it/wp-content/uploads/2010/05/delay.png" alt="Impatto tempo di caricamento" width="600" height="271" /></p><p style="text-align: center;"><em>Tratto da &#8220;Performance related changes and their user impact&#8221; di Eric Shurmann e Jake Brutlag</em></p><p>Google e Bing hanno eseguito un test molto interessante: hanno mostrato ad alcuni utenti i propri risultati di ricerca con un certo delay. E&#8217; emerso che maggiore era il ritardo, maggiore era la scontentezza degli utenti.</p><p>Con un delay di 2 secondi l&#8217;insoddisfazione degli utenti era aumentata del 3.8%, cosa che ha spinto Microsoft a porre fine all&#8217;esperimento in questione.</p><p>Infine: la lentezza del sito ha effetti <strong>negativi</strong> anche <strong>nel lungo periodo</strong>. Google e Microsoft hanno eseguito un altro test, ancora utilizzando i propri motori di ricerca. Hanno fornito a due gruppi di utenti dei risultati ritardati rispettivamente di 200 millisecondi e di 400 millisecondi.</p><p>Si può notare dal grafico sottostante come gli utenti serviti con un delay di 400 ms (in rosso) effettuino anche un minore volume di query.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-1211" title="Effetto delay nel lungo periodo" src="http://www.fortunecat.it/wp-content/uploads/2010/05/query-trend.png" alt="" width="600" height="414" /></p><p style="text-align: center;"><em>Tratto da &#8220;Performance related changes and their user impact&#8221; di Eric  Shurmann e Jake Brutlag</em></p><p>Ma la cosa più sorprendente è che &#8211; nonostante il delay venga <span style="text-decoration: underline;">rimosso</span> in corrispondenza della 7° settimana (wk7) &#8211; il comportamento degli utenti risulta comunque affetto dai ritardi riscontrati nel passato (la curva in rosso si posiziona più in basso della curva in nero anche nella seconda parte del grafico, nonostante entrambi i gruppi di utenti non abbiano più alcun delay).</p><p>Riassumendo:</p><ol><li>La velocità migliora le conversioni e la user satisfaction.</li><li>La lentezza determina effetti negativi anche nel lungo periodo.</li></ol><p>Velocità e user experience vanno quindi di pari passo: proprio per questo Google ha deciso di inserire la velocità tra i propri ranking factors.</p><p>Ma attenzione: la velocità è solo <strong>uno</strong> dei circa <strong>200 </strong>fattori considerati da Google, i contenuti e la rilevanza continuano ad essere prioritari.</p><p><span style="color: #dd1d1c;"><strong>Velocizzare il frontend a costo zero o con spesa minima</strong></span></p><p>Ecco la &#8220;Regola d&#8217;oro&#8221; dell&#8217;ingegnere di Google Steven Sounders: l&#8217;80-90% del tempo di risposta dipende dal frontend.</p><p>Anche noi possiamo testare questo assunto utilizzando il servizio <a href="http://www.webpagetest.org/" target="_blank">WebPageTest.org</a> su un qualunque sito web: in tutti i casi si evince chiaramente che sono le immagini ad impegnare il maggior tempo di caricamento.</p><p><span style="color: #dd1d1c;"><strong>Tool disponibili</strong></span></p><p>Veniamo agli strumenti che i webmaster possono utilizzare per monitorare le performance di propri siti.</p><ul><li><strong>Prestazioni del sito</strong>, disponibile all&#8217;interno dei Google Webmaster Tools per i siti verificati. Questo strumento fornisce una stima del tempo medio di caricamento ed una valutazione comparativa della velocità rispetto agli altri siti web.</li><li><a href="http://code.google.com/intl/it-IT/speed/page-speed/" target="_blank"><strong>PageSpeed</strong></a>, un plugin di <a href="https://addons.mozilla.org/it/firefox/addon/1843" target="_blank">Firebug</a> per FireFox che assegna un voto alle pagine web analizzate e che indica gli aspetti da correggere per migliorare la velocità.</li></ul><p><span style="color: #dd1d1c;"><strong>FAQ</strong></span></p><p><strong>E&#8217; possibile controllare il tempo di risposta del mio server da diverse aree del mondo?</strong></p><p>Certo, con WebPageTest.org puoi eseguire i test dagli Stati Uniti, dalla Gran Bretagna, dalla Cina e dalla Nuova Zelanda.</p><p><strong>Qual è un buon tempo di risposta per un server?</strong></p><p>Tieni bene a mente che sei i tuoi concorrenti sono veloci, allora stanno fornendo una migliore user experience per la tua stessa audience. Quindi è bene sapere prima di tutto cosa offrono i tuoi competitors.</p><p><span style="text-decoration: underline;"><strong>2 secondi</strong></span> è il valore limite di accettabilità per gli ecommerce. Google per le proprie pagine punta invece ad un tempo di 1.5 secondi.</p><p><strong>Il progressive rendering è utile per gli utenti?</strong></p><p>Indubbiamente si. Il progressive rendering si ha quando il browser inizia a visualizzare i contenuti (anche parziali) non appena sono a sua disposizione.</p><p>Il progressive rendering è importante perchè dà all&#8217;utente un <strong>feedback visivo</strong> e lo aiuta a sentirsi maggiormente &#8220;in controllo&#8221; della navigazione.</p><p>Microsoft ha testato questo aspetto osservando che il progressive rendering ha migliorato dell&#8217;1.7% la user satisfaction degli utenti di Bing.</p><p>Per implementare il rendering progressivo anche nei nostri siti web è sufficiente inserire i fogli di stile a monte della pagina.</p><p><span style="color: #dd1d1c;"><strong>Performance e SEO</strong></span></p><p>La velocità aumenta:</p><ul><li>le conversioni;</li><li>le pageviews;</li><li>il tempo di permanenza sul sito.</li></ul><p>E riduce:</p><ul><li>la frequenza di rimbalzo;</li><li>il carico del server.</li></ul><p>Quest&#8217;ultimo punto è fondamentale: ShopZilla ad esempio ha osservato che ottimizzando le pagine ha ridotto i propri costi di gestione del 50%.</p><p><strong><span style="color: #dd1d1c;">Concludendo</span></strong></p><p>La velocità non è importante solo per gli utenti, ma anche per i SEO perchè ci consente di aumentare <span style="text-decoration: underline;">concretamente</span> il valore delle nostre attività.</p><p>Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/05/velocizzare-siti-web/">Velocità: ecco i consigli di Google</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/05/velocizzare-siti-web/feed/</wfw:commentRss> <slash:comments>4</slash:comments> </item> <item><title>Creare una landing page per cellulari</title><link>http://www.fortunecat.it/2010/03/mobile-landing-page/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=mobile-landing-page</link> <comments>http://www.fortunecat.it/2010/03/mobile-landing-page/#comments</comments> <pubDate>Tue, 09 Mar 2010 08:55:29 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[Mobile SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=993</guid> <description><![CDATA[Un saluto a tutti i lettori di Fortunecat.it. Oggi parliamo di landing page per cellulari, argomento molto attuale dato che AdWords ha di recente introdotto le funzioni di advanced mobile targeting. In giro ho letto molti post a riguardo, ma nessuno di questi ha affrontato la questione da un punto di vista pratico. Suddividiamo l&#8217;argomento [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/03/mobile-landing-page/">Creare una landing page per cellulari</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Un saluto a tutti i lettori di Fortunecat.it. Oggi parliamo di landing page per cellulari, argomento molto attuale dato che AdWords ha di recente introdotto le funzioni di advanced mobile targeting.</p><p>In giro ho letto molti post a riguardo, ma nessuno di questi ha affrontato la questione da un punto di vista <strong>pratico</strong>. Suddividiamo l&#8217;argomento in <strong>3 semplici punti</strong>.</p><p><span style="color: #e82c2b;"><strong>Come si fa a creare una landing page per cellulari?</strong></span></p><p>Il linguaggio utilizzato è l&#8217;XHTML Mobile Profile, un derivato dell&#8217;XHTML 1.1 Basic. Le differenze tra i due linguaggi sono davvero minime e pertanto se crei una pagina semplice non vi dovrebbero essere particolari problemi nella compilazione del sorgente.</p><p>Ricordati che è fondamentale la <span style="text-decoration: underline;">validazione del codice</span>. A tale scopo puoi utilizzare:</p><ul><li><a href="http://ready.mobi/" target="_blank">Ready.mobi</a> che oltre alla validazione assegna un punteggio di mobile friendliness;</li><li><a href="http://validator.w3.org/mobile/" target="_blank">W3C MobileOK Checker</a>, il validatore &#8220;ufficiale&#8221; della W3C.</li></ul><p><span style="color: #e82c2b;"><strong>Come si fa a testare una landing page per cellulari?</strong></span></p><p>Non è necessario acquistare tutti i modelli di smartphone in commercio. E&#8217; sufficiente installare su Firefox i plugin:</p><ul><li><a href="https://addons.mozilla.org/en-US/firefox/addon/1345" target="_blank">XHTML MP</a>;</li><li><a href="https://addons.mozilla.org/en-US/firefox/addon/60" target="_blank">Web Developer</a>.</li></ul><p>Il primo plugin aggiunge a Firefox il supporto per l&#8217;XHTML Mobile Profile. Il secondo ci consente di testare la landing su diverse risoluzioni. Vediamo come.</p><p>Dopo aver installato il plugin Web Developer verrà attivata su Firefox la corrispondente toolbar. Clicchiamo su Ridimensiona / Modifica opzioni di ridimensionamento. Apparirà la seguente finestra:</p><p style="text-align: center;"><img class="size-full wp-image-995    aligncenter" title="Ridimensionamento per mobile" src="http://www.fortunecat.it/wp-content/uploads/2010/03/mobile-web-developer.png" alt="" width="570" height="486" /></p><p>Clicchiamo su Aggiungi ed inseriamo il campo &#8220;iPhone&#8221; con dimensioni dello schermo pari a 320&#215;480. E&#8217; fondamentale spuntare l&#8217;opzione &#8220;Ridimensiona la parte interna&#8221;, per emulare al meglio la risoluzione dell&#8217;iPhone. Dopo aver cliccato su OK, nel menu Ridimensiona della toolbar apparirà la voce iPhone precendentemente memorizzata. Cliccando su tale voce la finestra del browser verrà ridimensionata in modo tale che la pagina sia visualizzata proprio in un riquadro 320&#215;480.</p><p>Ovviamente con Web Developer possiamo memorizzare anche altre risoluzioni: ad esempio il Nokia n97 ha una risoluzione di 360&#215;640, un BlackBerry Bold 9700 di 480&#215;360 e così via.</p><p>E&#8217; molto importante effettuare test su vari modelli. Ricorda: lo scrolling <em>orizzontale </em>può disorientare l&#8217;utente.</p><p>Con questo plugin possiamo testare quindi tutte le risoluzioni possibili, utilizzando semplicemente il browser Firefox.</p><p><span style="color: #e82c2b;"><strong>Come creare un&#8217;interfaccia user-friendly?</strong></span></p><p>Ricordati che gli utenti degli smartphone non utilizzano il mouse ma navigano le pagine con la pressione delle dita grazie al touch screen.</p><p style="text-align: center;"><img class="aligncenter" title="Pulsanti in  una mobile landing page" src="http://www.fortunecat.it/wp-content/uploads/2010/03/mobile-landing-page-1.png" alt="" width="234" height="424" /></p><p>Proprio per questo è opportuno utilizzare dei <strong>pulsanti</strong> al posto dei semplici link testuali. Per garantire la piena usabilità dei pulsanti su touch screen è necessario seguire queste 3 regole (suggerite peraltro anche dalle linee guida per lo sviluppo di applicazioni iPhone):</p><ul><li>il pulsante deve avere altezza e larghezza minima di 1,27 cm;</li><li>tra un pulsante e l&#8217;altro ci deve essere uno spazio almeno pari a 0,32 cm;</li><li>il pulsante deve trovarsi ad almeno 8 px dal bordo dello schermo.</li></ul><p style="text-align: center;"><img class="aligncenter size-full wp-image-1003" title="Form in una mobile landing page" src="http://www.fortunecat.it/wp-content/uploads/2010/03/mobile-landing-page-2.png" alt="" width="233" height="424" /></p><p>Inoltre cerca di ridurre quanto più possibile la complessità dei form, perché gli utenti mobile potrebbero avere difficoltà nella compilazione: 3 campi sono più che sufficienti.</p><p>Questo è tutto. Se l&#8217;articolo è stato di tuo gradimento puoi condividerlo sui social network, puoi suggerire ai tuoi amici di <a href="http://www.facebook.com/pages/Fortunecatit/302632972697" target="_blank">diventare fan di questo portale</a> su Facebook oppure potresti anche scrivere una recensione di Fortunecat.it sul tuo sito.</p><p>Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/03/mobile-landing-page/">Creare una landing page per cellulari</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/03/mobile-landing-page/feed/</wfw:commentRss> <slash:comments>8</slash:comments> </item> <item><title>Il posizionamento delle keyphrase</title><link>http://www.fortunecat.it/2010/02/posizionamento-keyphrase/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=posizionamento-keyphrase</link> <comments>http://www.fortunecat.it/2010/02/posizionamento-keyphrase/#comments</comments> <pubDate>Tue, 23 Feb 2010 18:41:24 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=884</guid> <description><![CDATA[Oggi parliamo in modo più generale del funzionamento di un motore di ricerca su larga scala come Google, analizzando le informazioni contenute nel brevetto “Multiple index based information retrieval system” del 28 Luglio 2009. I sistemi di information retrieval, generalmente chiamati motori di ricerca, creano un indice che collega i documenti presenti su internet alle [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/02/posizionamento-keyphrase/">Il posizionamento delle keyphrase</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Oggi parliamo in modo più generale del funzionamento di un motore di ricerca su larga scala come Google, analizzando le informazioni contenute nel brevetto “<strong>Multiple index based information retrieval system</strong>” del 28 Luglio 2009.</p><p>I sistemi di information retrieval, generalmente chiamati <span style="text-decoration: underline;">motori di ricerca</span>, creano un indice che collega i <strong>documenti</strong> presenti su internet alle <strong>singole parole</strong> contenute nei documenti stessi.</p><p>Il motore di ricerca, in risposta ad una query contenente uno o più termini, fornisce un set di documenti contenenti proprio i termini richiesti dall&#8217;utente.</p><p>Viene quindi effettuato un ordinamento (ranking) dei documenti che tiene conto di:</p><ul><li><strong>link analysis</strong>;</li><li><strong>host domain</strong> (il fatto che il dominio venga espressamente nominato conferma l&#8217;impatto della rilevanza ed autorevolezza dell&#8217;intero dominio sul ranking);</li><li><strong>f</strong><strong>requenza di occorrenze </strong>dei termini presenti nella query, ecc&#8230;</li></ul><p>Ma un motore di ricerca evoluto non si limita al matching “booleano” dei termini: infatti per molte ricerche il <strong>matching esatto non produrrebbe i risultati desiderati</strong>.</p><p>Ad esempio &#8211; se ci limitassimo alla corrispondenza esatta &#8211; cercando Australian Shepherd (una razza canina) otterremmo come risposta anche documenti che parlano dell&#8217;Australia o degli Shepherd in generale.</p><p>Questo perché i sistemi di indicizzazione tradizionali si basano sulle parole piuttosto che sui <strong>concetti</strong>, e i concetti sono solitamente espressi utilizzando delle<strong> frasi</strong>.</p><p>Un modo per ovviare a questo inconveniente potrebbe essere quello di utilizzare i co-occurrence patterns: se le parole A, B e C sono presenti contemporaneamente in più documenti è probabile che siano in qualche modo collegate semanticamente.</p><p>Ma anche questo sistema ha delle controindicazioni. Supponiamo che le tre parole siano &#8220;Presidente&#8221;, &#8220;Casa&#8221; e &#8220;Bianca&#8221;.</p><p>Le parole &#8220;Casa&#8221; e &#8220;Bianca&#8221; generalmente compaiono in associazione al <span style="text-decoration: underline;">termine</span> &#8220;Presidente&#8221;, ma prese singolarmente hanno ben poco a che fare con il <span style="text-decoration: underline;">concetto</span> di &#8220;Presidente&#8221;. Quindi non possiamo ritenere semanticamente affini le tre parole in esame.</p><p><span style="color: #e82c2b;"><strong>Come fa Google ad estrarre i concetti da un documento?</strong></span></p><p>Se il motore provasse ad indicizzare tutte le frasi, ossia tutte le possibili combinazioni di termini, lo sforzo computazionale sarebbe enorme e i risultati sarebbero comunque inadeguati.</p><p>Quindi Google cerca di estrarre solo le <strong>keyphrase più importanti</strong>, estrapolando cioè solo le frasi utilizzate di frequente e/o in modo particolare all&#8217;interno dei documenti in esame.</p><p>L&#8217;obiettivo è quello di stabilire quali siano le frasi <strong>valide </strong>e <strong>significative</strong>, evitando così l&#8217;indicizzazione indiscriminata di tutte le combinazioni possibili di termini.</p><p><span style="color: #e82c2b;"><strong>L&#8217;analisi delle frasi correlate</strong></span></p><p>Per capire se due frasi sono correlate Google utilizza una metrica molto particolare: l&#8217;<span style="text-decoration: underline;">Informational Gain</span>, dato dal rapporto tra il tasso di co-occorrenza effettivo di due frasi ed il tasso di co-occorrenza atteso.</p><p>In termini più semplici: se l&#8217;informational gain supera un valore di soglia, ossia se due frasi vengono utilizzate insieme con un tasso superiore a quello previsto/medio, Google classifica le frasi in questione come <span style="text-decoration: underline;">correlate</span>.</p><p>Da un punto di vista semantico: le frasi correlate sono utilizzate in riferimento ad un dato argomento. Ad esempio “Presidente degli Stati Uniti” e “Casa Bianca” fanno riferimento a concetti molto vicini fra loro.</p><p>Capite bene quindi quanto questa patent sia attuale, soprattutto perché Google ha deciso di espandere i risultati di ricerca con i sinonimi. E non è un caso che nel post presente sul blog ufficiale di Google vengano fatti gli stessi esempi contenuti in questa patent.</p><p><span style="color: #e82c2b;"><strong>Le frasi correlate e il ranking</strong></span></p><p>L&#8217;utilizzo delle frasi correlate modifica persino i criteri di ranking, vediamo come.</p><p>Per ogni frase viene creata una “posting list” che identifica i documenti contenenti la frase in questione.<br /> In aggiunta per ogni frase viene creata una seconda lista che contiene le frasi correlate a quella di partenza.</p><p style="text-align: center;"><img class="size-full wp-image-898  aligncenter" title="Posting list" src="http://www.fortunecat.it/wp-content/uploads/2010/02/posting-list.png" alt="" width="443" height="280" /></p><p>Dall&#8217;intersezione delle due liste il motore di ricerca riesce ad individuare i documenti che, oltre alla frase cercata, contengono anche le frasi correlate ad essa (documenti che quindi sono <strong>più rilevanti</strong> rispetto al concetto cercato dall&#8217;utente).</p><p><span style="color: #e82c2b;"><strong>Il multiple index</strong></span></p><p>Un altro aspetto molto interessante è che il motore di ricerca utilizza un indice multiplo. Sono infatti presenti un indice primario ed un indice secondario.</p><p>L&#8217;<strong>indice primario</strong> contiene l&#8217;index relativo alle frasi, con un numero limitato di documenti per ciascuna frase. Il ranking all&#8217;interno dell&#8217;indice primario è effettuato secondo criteri di <span style="text-decoration: underline;">rilevanza</span> rispetto alla frase.</p><p>Tutti i documenti che non rientrano nell&#8217;indice primario finiscono nell&#8217;<strong>indice secondario</strong>, in cui il ranking è effettuato con criteri meno sofisticati.</p><p><span style="color: #e82c2b;"><strong>Come viene assegnata la data ai documenti?</strong></span></p><p>Come sapete tra le opzioni di ricerca di Google figura il ranking per data. Il brevetto è molto chiaro su questo punto. La data viene assegnata al momento dell&#8217;indicizzazione ma se il contenuto del documento viene aggiornato, anche la data viene aggiornata nell&#8217;istante di re-crawling. Questa informazione sicuramente vi tornerà utile per la real time search di Google, e per riciclare documenti “vecchi”.</p><p>I documenti che vengono aggiornati spesso inoltre traggono un beneficio in termini di ranking.</p><p><span style="color: #e82c2b;"><strong>Indicizzazione &#8220;semantica&#8221;</strong></span></p><p>Il sistema di indicizzazione si occupa anche di:</p><ul><li>identificare le <strong>frasi </strong>e le <strong>frasi correlate</strong>;</li><li><strong>indicizzare</strong> i documenti in relazione alle frasi;</li><li>creare e mantenere una <strong>tassonomia</strong> relativa alle frasi.</li></ul><p><span style="color: #e82c2b;"><strong>Grassetto, corsivo, sottolineato?</strong></span></p><p>Davvero degno di nota il fatto che l&#8217;algoritmo di indicizzazione, nell&#8217;individuare le possibili frasi rilevanti in un testo utilizzi anche la formattazione presente: se una porzione di testo è ad esempio in grassetto, è probabile che costituisca una frase rilevante.</p><p>Ma questo non significa che il grassetto migliori il ranking, sia chiaro. Significa unicamente che il motore potrebbe utilizzare quelle informazioni per estrarre con maggiore facilità le frasi rilevanti da un documento, e quindi per effettuare una migliore classificazione semantica dei documenti.</p><p><span style="color: #e82c2b;"><strong>L&#8217;utilizzo delle congiunzioni (e, o&#8230;)</strong></span></p><p>Le congiunzioni, utilizzate in modo opportuno, possono suggerire al motore di ricerca che alcuni concetti espressi mediante frasi sono collegati. Se scrivo ad esempio posizionamento nei motori <span style="text-decoration: underline;"><strong>e</strong></span> social media marketing, il motore è in grado di comprendere, seppure in modo limitato, che le frasi chiave sono semanticamente affini.</p><p><span style="color: #e82c2b;"><strong>A cosa serve quindi l&#8217;utilizzo opportuno della formattazione e delle congiunzioni?</strong></span></p><p>C&#8217;è un limite massimo alle frasi rilevanti memorizzate per ciascun documento. Un utilizzo opportuno di questi strumenti ci garantisce che il documento sia correttamente classificato dal motore di ricerca.</p><p><span style="color: #e82c2b;"><strong>Ranking e frasi chiave</strong></span></p><p>A ciascun documento nella posting list viene assegnato un punteggio che tiene conto:</p><ul><li> della rilevanza del documento stesso (es. pagerank);</li><li> numero di occorrenze della frase chiave;</li><li> anchor text e rilevanza dei documenti che linkano la risorsa;</li><li> utilizzo di markup per evidenziare le frasi rispetto al resto del documento.</li></ul><p>Per le risorse via via meno rilevanti vengono memorizzate sempre meno informazioni (es.: per i documenti dal basso ranking non viene neppure considerata la posizione delle frasi all&#8217;interno del documento).</p><p><span style="color: #e82c2b;"><strong>Come fa il motore a modellare i concetti?</strong></span></p><p>Il concetto è modellato grazie ad una matrice di frasi. L&#8217;unione e la compresenza di più frasi chiave identificano un&#8217;unità concettuale.</p><p>Gli utenti non apprezzano documenti lunghi che parlano di <strong>diversi topic</strong>, per il semplice motivo che l&#8217;utente visita la pagina generalmente dopo aver effettuato una query nel motore di ricerca. Se cerco &#8220;gatti&#8221; voglio leggere pagine che parlino di gatti, no? Quindi maggiore è l&#8217;attinenza con la query, migliore il posizionamento della risorsa.</p><p>Se siete ancora vivi dopo aver letto questo kilometrico post non dimenticatevi di condividerlo sui social e di abbonarvi al <a href="http://feeds.fortunecat.it/seofortunecat" target="_blank">feed</a>. Tra l&#8217;altro ho creato anche una <a href="http://www.facebook.com/pages/Fortunecatit/302632972697" target="_blank">pagina facebook</a> con cui potete darmi del &#8220;supporto morale&#8221;.</p><p>Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/02/posizionamento-keyphrase/">Il posizionamento delle keyphrase</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/02/posizionamento-keyphrase/feed/</wfw:commentRss> <slash:comments>11</slash:comments> </item> <item><title>Google Libri: novità per il posizionamento?</title><link>http://www.fortunecat.it/2010/01/google-books-seo/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=google-books-seo</link> <comments>http://www.fortunecat.it/2010/01/google-books-seo/#comments</comments> <pubDate>Sun, 31 Jan 2010 11:06:50 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=788</guid> <description><![CDATA[E&#8217; un periodo di grande fermento per il mondo degli ebook. E non mi riferisco unicamente al lancio dell&#8217;iPad ma anche alle nuove funzioni introdotte su Google Books che rendono questo servizio &#8211; sotto numerosi punti di vista &#8211; molto simile ad Anobii. Cerchiamo di approfondire la cosa: il 15 Maggio 2008 a Google è [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/01/google-books-seo/">Google Libri: novità per il posizionamento?</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>E&#8217; un periodo di grande fermento per il mondo degli ebook. E non mi riferisco unicamente al lancio dell&#8217;iPad ma anche alle nuove funzioni introdotte su Google Books che rendono questo servizio &#8211; sotto numerosi punti di vista &#8211; molto simile ad Anobii.</p><p>Cerchiamo di approfondire la cosa: il 15 Maggio 2008 a Google è stata assegnato il brevetto “Computer implemented interactive, virtual bookshelf system and method”. Questa patent è stata quasi certamente utilizzata come punto di riferimento per la ristrutturazione che Google Books sta subendo; nel brevetto infatti si fa riferimento:</p><ul><li>alle <strong>virtual bookshelf</strong>, ossia alle raccolte di libri generate dagli utenti (dai un&#8217;occhiata agli &#8220;<a href="http://books.google.it/books" target="_blank">scaffali</a>&#8221; introdotti pochi giorni fa);</li><li>alla trasformazione di Google Books in senso sociale, con la possibilità di condividere le proprie librerie con amici e colleghi;</li><li>alla possibilità di inserire annotazioni per ciascun libro;</li><li>ad un concetto più ampio di &#8220;book&#8221;, inteso più genericamente come libro,  magazine o quotidiano;</li></ul><p>La funzione &#8220;Aggiungi nota&#8221; tra l&#8217;altro è stata già implementata:</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-793" title="Annotazioni Google Libri" src="http://www.fortunecat.it/wp-content/uploads/2010/01/annotazioni-google-books.png" alt="" width="500" height="225" /></p><p>Sulla base di queste premesse azzardo 2 previsioni: <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><ol><li>Sicuramente a breve sarà possibile aggiungere degli amici su Google Libri, esattamente come accade per Anobii.</li><li>E&#8217; molto probabile che in un futuro non troppo lontano lo scaffale generato da ciascun utente possa anche essere inserito nei Google Profiles.</li></ol><p>Ma torniamo a noi. L&#8217;introduzione di queste funzioni sicuramente comporterà delle novità per la <strong>ricerca dei libri</strong>. E dato che i libri rientrano nella universal search, quello che sto per dirvi potrebbe tornarvi davvero utile.</p><p><strong>Cosa accade quando il server riceve una search query relativa ad un dato libro?</strong></p><p>Vengono filtrati tutti i libri presenti nel database in modo da restituire solo i libri con i metadati corrispondenti a quelli inseriti dall&#8217;utente. Ma per metadati non si intendono solo quelli relativi alle caratteristiche del libro&#8230;</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-796" title="Algoritmo Google Books" src="http://www.fortunecat.it/wp-content/uploads/2010/01/google-books-algoritmo.png" alt="" width="597" height="554" /></p><p style="text-align: center;"><p>Le novità introdotte ampieranno notevolmente le fonti da cui Google attinge. I metadati proverranno infatti da:</p><ul><li>Informazioni relative al libro/magazine (come autore, titolo, ISBN, lingua, editore, formato, data di pubblicazione, informazioni sul copyright, ecc.).</li><li>Annotazioni, recensioni e segnalibri degli utenti sul libro e sul suo contenuto, etichette (labels) applicate per facilitare la catalogazione o per creare gerarchie all&#8217;interno della propria raccolta di libri. In un passaggio si accenna anche al fatto che potrebbero essere usate come fonti di informazione <strong>gli scaffali di amici e colleghi</strong>, oltre che <strong>&#8220;scaffali di gruppo&#8221;</strong>.</li><li>Database online specializzati, siti di recensioni, ecc&#8230;</li><li>Query digitate dall&#8217;utente per ottenere il libro desiderato. Ad esempio se cerco &#8220;Marketing&#8221;, clicco su &#8220;Marketing Management&#8221; di Kotler e lo aggiungo al mio scaffale, la mia query viene aggiunta ai metadati del libro stesso.</li></ul><p>Ci sono ampi margini quindi per provare a migliorare anche il posizionamento dei libri su Google Books.</p><p><strong>Nota conclusiva:</strong> questo blog cerca di offrire contenuti originali e &#8211; spero &#8211; di qualità. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><p>Se vuoi sostenere Fortunecat.it puoi:</p><ul><li>inserirmi nel tuo blogroll;</li><li>andare nella <a href="http://www.fortunecat.it">home page</a>, fare lo scroll della pagina e aggiungerti ai sostenitori con Google Friend Connect o NetworkedBlogs;</li><li>abbonarti al <a href="http://feeds.fortunecat.it/seofortunecat">feed RSS</a>.</li></ul><p>Alla prossima&#8230; <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/01/google-books-seo/">Google Libri: novità per il posizionamento?</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/01/google-books-seo/feed/</wfw:commentRss> <slash:comments>4</slash:comments> </item> <item><title>Google e l&#8217;individuazione dei duplicati</title><link>http://www.fortunecat.it/2010/01/brevetto-google-duplicati/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=brevetto-google-duplicati</link> <comments>http://www.fortunecat.it/2010/01/brevetto-google-duplicati/#comments</comments> <pubDate>Thu, 07 Jan 2010 13:53:35 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=672</guid> <description><![CDATA[Salve a tutti, innanzitutto una comunicazione di servizio: su Fortunecat.it è stata attivata la nuova sezione Flash News contenente notizie &#8220;flash&#8221; dal mondo dei motori di ricerca. D&#8217;ora quindi in poi gli abbonati al feed RSS riceveranno &#8211; oltre ugli update relativi ai post di approfondimento &#8211; anche le principali notizie del giorno. Bene, oggi [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/01/brevetto-google-duplicati/">Google e l&#8217;individuazione dei duplicati</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Salve a tutti, innanzitutto una comunicazione di servizio: su Fortunecat.it è stata attivata la nuova sezione <strong><a href="http://www.fortunecat.it/argomenti/notizie/" target="_blank">Flash News</a></strong> contenente notizie &#8220;flash&#8221; dal mondo dei motori di ricerca.</p><p>D&#8217;ora quindi in poi gli abbonati al <a href="http://feeds.fortunecat.it/seofortunecat" target="_blank">feed RSS</a> riceveranno &#8211; oltre ugli update relativi ai post di approfondimento &#8211; anche le principali notizie del giorno. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p>Bene, oggi parliamo di <strong>contenuti duplicati</strong> facendo riferimento ad un brevetto piuttosto recente “<strong>Duplicate document detection in a web crawler system</strong>” del 1 Dicembre 2009.</p><p>Il motore di ricerca, in fase di scansione, individua una serie di documenti con il medesimo contenuto. In funzione di opportune metriche <em>indipendenti dal tipo di query</em> viene stabilito quali documenti devono essere inclusi nell&#8217;indice e quali devono essere filtrati.</p><p>Il motore di ricerca assegna ad una classe di documenti duplicati un <strong>fingerprint</strong>, una sorta di codice identificativo che in sostanza individua un contenuto comune a tutte le pagine in questione (ad es.: un codice a 64 bit calcolato a partire da un testo normalizzato).</p><p>Tutte le informazioni relative al set di documenti duplicati vengono memorizzate in forma di dati strutturati.</p><p>Quando il motore di ricerca individua un nuovo documento, prima di processarlo effettua un confronto con gli altri documenti già memorizzati. Nel caso vi sia una coincidenza di dati, il nuovo documento viene marcato con il fingerprint relativo ad una specifica classe di duplicati.</p><p>In termini più semplici:<strong> il motore di ricerca classifica i contenuti con un codice identificativo</strong>, pagine con lo <strong>stesso contenuto </strong>condividono lo <strong>stesso codice</strong>.</p><p><strong>Un aspetto molto interessante: i “crawling layer”</strong></p><p>Google classifica gli URL usando tre livelli di scansione:</p><ol><li><strong>livello </strong><strong>base:</strong> contiene gli url delle pagine che vengono scansionate periodicamente;</li><li><strong>livello </strong><strong>daily:</strong> contiene gli url delle pagine che richiedono una scansione giornaliera;</li><li><strong>livello </strong><strong>real-time:</strong> contiene gli url di risorse che devono essere scansionate più volte al giorno, anche ad intervalli di pochi minuti (es. tweets).</li></ol><p>Una pagina viene assegnata ad uno specifico layer in funzione della frequenza di aggiornamento e di altri indicatori (pagerank in primis).</p><p>Per ciascuna pagina inoltre viene calcolato il pagerank, e generata una mappa dei link e degli anchor text.</p><p><strong>A questo punto la domanda è: quali documenti appariranno nei risultati di ricerca?</strong></p><p>I componenti fondamentali in gioco sono due: il modulo <strong>Content Filter</strong> e il <strong>DupServer</strong> (il server che contiene le informazioni relative ai duplicati).</p><p>Quando viene individuata una nuova risorsa il Content Filter consulta il DupServer per capire se il documento è o meno un duplicato.</p><p><span style="color: #000000;"><strong>Facciamo un esempio:</strong></span></p><p>Il motore individua il documento A. Il Content Filter consulta di DupServer e deduce che non esistono duplicati di A. Ad A viene assegnato un fingerprint 001 che identifica il <em>contenuto </em>di A.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-686" title="Individuazione dei duplicati" src="http://www.fortunecat.it/wp-content/uploads/2010/01/duplicati-1.png" alt="" width="446" height="452" /></p><p>Dopo 1 mese il motore scopre il documento B. Il Content Filter consulta il DupServer e scopre che B ed A hanno lo stesso contenuto.</p><p><span style="color: #000000;"><strong>Cosa succede ora?</strong></span></p><p><span style="color: #e82c2b;"><strong>1° caso: il pagerank di B è più basso del pagerank di A.</strong></span></p><p>A “vince”. A e B rientrano nella stessa classe di duplicati il cui codice identificativo è 001, il codice di A. Questo sta a significare che l&#8217;insieme dei duplicati è rappresentato da A, e sarà proprio A ad apparire nei risultati di ricerca.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-690" title="Individuazione duplicati - caso 1" src="http://www.fortunecat.it/wp-content/uploads/2010/01/duplicati-2.png" alt="" width="446" height="491" /></p><p><span style="color: #e82c2b;"><strong>2° caso: il pagerank di B è più alto ma solo di poco.</strong></span></p><p>A resta comunque la versione più rappresentativa. Ciò per due ragioni (mia interpretazione):</p><ul><li>A così viene comunque privilegiato per il fatto di essere stato indicizzato prima;</li><li>si evita anche di modificare continuamente gli url nei risultati di ricerca.</li></ul><p><span style="color: #e82c2b;"><strong>3° caso: il pagerank di B è nettamente più alto.</strong></span></p><p>B diventa la nuova versione più rappresentativa. B riceve un fingerprint tutto suo, es.: 002. D&#8217;ora in poi la classe di duplicati sarà identificata dal nuovo codice 002, segno appunto che il documento rappresentativo ora è B e non più A.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-691" title="Individuazione dei duplicati - caso 3" src="http://www.fortunecat.it/wp-content/uploads/2010/01/duplicati-3.png" alt="" width="446" height="491" /></p><p><strong>Conclusioni</strong></p><p>Il criterio che Google utilizza per filtrare i documenti duplicati sembra essere fondamentalmente basato sul pagerank, ma le caratteristiche dell&#8217;algoritmo se non altro ci garantiscono che a parità di PR viene privilegiata di fatto la pagina indicizzata prima.</p><p>Approfondiremo ancora l&#8217;argomento quindi restate connessi. Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2010/01/brevetto-google-duplicati/">Google e l&#8217;individuazione dei duplicati</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2010/01/brevetto-google-duplicati/feed/</wfw:commentRss> <slash:comments>16</slash:comments> </item> <item><title>Tutorial: creare una versione mobile del proprio blog</title><link>http://www.fortunecat.it/2009/12/tutorial-mobile-blog/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=tutorial-mobile-blog</link> <comments>http://www.fortunecat.it/2009/12/tutorial-mobile-blog/#comments</comments> <pubDate>Wed, 30 Dec 2009 10:14:11 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[Mobile SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=655</guid> <description><![CDATA[Salve a tutti, innanzitutto vorrei augurare buon anno ai miei lettori. Quindi vorrei segnalarvi questo mio tutorial pubblicato su Blographik.it, che affronta il tema della creazione di una versione mobile del proprio blog. Tutto è nato da questa intervista gentilmente realizzata da Mirko, visto poi l&#8217;interesse mostrato verso questo tema ho pensato di creare una [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2009/12/tutorial-mobile-blog/">Tutorial: creare una versione mobile del proprio blog</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Salve a tutti, innanzitutto vorrei augurare buon anno ai miei lettori. Quindi vorrei segnalarvi questo mio <a href="http://www.blographik.it/2009/12/30/tutorial-come-dotare-il-tuo-blog-di-una-versione-mobile/" target="_blank">tutorial</a> pubblicato su Blographik.it, che affronta il tema della creazione di una versione mobile del proprio blog.</p><p>Tutto è nato da questa intervista gentilmente realizzata da Mirko, visto poi l&#8217;interesse mostrato verso questo tema ho pensato di creare una guida ad hoc.</p><p>Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /></p><p style="text-align: center;"><object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="411" height="253" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="src" value="http://www.youtube.com/v/quR6uI-xTys&amp;hl=it_IT&amp;fs=1&amp;showinfo=0" /><param name="allowfullscreen" value="true" /><embed type="application/x-shockwave-flash" width="411" height="253" src="http://www.youtube.com/v/quR6uI-xTys&amp;hl=it_IT&amp;fs=1&amp;showinfo=0" allowscriptaccess="always" allowfullscreen="true"></embed></object></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2009/12/tutorial-mobile-blog/">Tutorial: creare una versione mobile del proprio blog</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2009/12/tutorial-mobile-blog/feed/</wfw:commentRss> <slash:comments>2</slash:comments> </item> <item><title>Uno sguardo sul mobile web</title><link>http://www.fortunecat.it/2009/12/mobile-seo-slide/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=mobile-seo-slide</link> <comments>http://www.fortunecat.it/2009/12/mobile-seo-slide/#comments</comments> <pubDate>Wed, 09 Dec 2009 11:06:46 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[Mobile SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=264</guid> <description><![CDATA[Come promesso allego le slide sulla mobile seo proiettate in occasione del IV Convegno GT. Colgo anche l&#8217;occasione per ringraziare tutti i relatori e i partecipanti per l&#8217;attenzione dimostrata. A breve pubblicherò anche un resoconto dell&#8217;evento quindi restate connessi&#8230; Uno sguardo sul mobile web &#169; Fortunecat.it SEO Blog<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2009/12/mobile-seo-slide/">Uno sguardo sul mobile web</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Come promesso allego le slide sulla mobile seo proiettate in occasione del IV Convegno GT.</p><p style="text-align: center;"><object style="margin: 0px;" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="355" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><param name="src" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=mobilesearch4-091012070724-phpapp01&amp;stripped_title=uno-sguardo-sul-mobile-web" /><param name="allowfullscreen" value="true" /><embed style="margin: 0px;" type="application/x-shockwave-flash" width="425" height="355" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=mobilesearch4-091012070724-phpapp01&amp;stripped_title=uno-sguardo-sul-mobile-web" allowscriptaccess="always" allowfullscreen="true"></embed></object></p><p>Colgo anche l&#8217;occasione per ringraziare tutti i relatori e i partecipanti per l&#8217;attenzione dimostrata.<br /> A breve pubblicherò anche un resoconto dell&#8217;evento quindi restate connessi&#8230; <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2009/12/mobile-seo-slide/">Uno sguardo sul mobile web</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2009/12/mobile-seo-slide/feed/</wfw:commentRss> <slash:comments>9</slash:comments> </item> <item><title>Google Local Search: criteri generali di funzionamento</title><link>http://www.fortunecat.it/2009/11/google-local-search-algoritmo/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=google-local-search-algoritmo</link> <comments>http://www.fortunecat.it/2009/11/google-local-search-algoritmo/#comments</comments> <pubDate>Sun, 22 Nov 2009 09:53:59 +0000</pubDate> <dc:creator>Fortunecat</dc:creator> <category><![CDATA[SEO]]></category><guid isPermaLink="false">http://www.fortunecat.it/?p=533</guid> <description><![CDATA[Oggi vi parlo di Local Search, facendo riferimento al brevetto di Google &#8220;Methods and systems for improving a search ranking using location awareness&#8221;. In particolare vi spiegherò i criteri generali di funzionamento dell&#8217;algoritmo. Bene, innanzitutto qual è il problema di Google? Il web contiene un’immensa quantità di informazioni. Molti motori di ricerca effettuano il ranking [...]<p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2009/11/google-local-search-algoritmo/">Google Local Search: criteri generali di funzionamento</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></description> <content:encoded><![CDATA[<p>Oggi vi parlo di <strong>Local Search</strong>, facendo riferimento al brevetto di Google &#8220;Methods and systems for improving a search ranking using location awareness&#8221;. In particolare vi spiegherò i criteri <em>generali </em>di funzionamento dell&#8217;algoritmo.</p><p><strong>Bene, innanzitutto qual è il problema di Google?</strong></p><p>Il web contiene un’immensa quantità di informazioni. Molti motori di ricerca effettuano il ranking dei documenti basandosi sui <em>contenuti </em>dei documenti stessi.</p><p>Altri motori, tra cui Google, effettuano il ranking anche in base alla struttura dei link della pagina web.</p><p>Tuttavia alcuni documenti possono essere interessanti per utenti che risiedono o  che sono interessati ad una determinata <em>area</em>. Ad esempio: esercizi commerciali, testate giornalistiche locali, ecc.</p><p>Quindi è importante per il motore di ricerca capire se una pagina ha una sua “<span style="text-decoration: underline;">rilevanza geografica</span>”, così da restituire non solo i risultati di ricerca più rilevanti ma anche i più vicini geograficamente all&#8217;utente.</p><p>I classici sistemi di ranking geografico hanno due evidenti limitazioni: quella di dare molto peso alla vicinanza e quella di restituire risultati solo all’interno di un raggio massimo dalla location di ricerca.</p><p><strong>Il metodo adottato da Google invece è il seguente:</strong></p><ol><li> Il motore riceve la query;</li><li> Viene identificato un “topic”, un argomento o più correttamente un’area di pertinenza corrispondente alla query. Facciamo un esempio: sia che io cerchi “albergo” o che cerchi “bed &amp; breakfast” l’argomento della ricerca è grossomodo lo stesso. Entrambe le query rientrano nel medesimo topic &#8220;hotel&#8221;. Inoltre per ciascun topic viene anche definita una “<strong>location sensitivity</strong>”.</li><li> Il motore individua una serie di documenti. Determina inoltre la location corrispondente a ciascun documento.</li><li> Viene effettuato il ranking.</li></ol><p><em>Nota: gli stessi criteri sono utilizzati anche per mostrare gli ads più rilevanti in funzione dell’area geografica.</em></p><p><strong>Schema dell’algoritmo</strong></p><p style="text-align: center;"><img class="aligncenter size-full wp-image-536" title="Schema di Google Local Search" src="http://www.fortunecat.it/wp-content/uploads/2009/11/schema-local-search.png" alt="Schema di Google Local Search" width="313" height="364" /></p><p>Il motore di ricerca include:</p><ul><li>Il <strong>document locator</strong>: individua un set di documenti rispondenti alla query dell’utente.</li><li>Il <strong>ranking component</strong>: effettua il ranking dei documenti in funzione della rilevanza.</li><li>Il <strong>location component</strong>: può determinare un “quality signal” inteso come “distance signal”; tiene conto della rilevanza geografica del set dei documenti.</li><li>Il <strong>location database</strong>: memorizza i dati geografici e quelli relativi alla location.</li><li>Il <strong>topic database</strong>: il motore di ricerca determina le relazioni che intercorrono tra i topics e la sensibilità geografica e memorizza il tutto nel suddetto database.</li></ul><p><strong>Il Location Component e la &#8220;sensibilità geografica&#8221;</strong></p><p>Un’importante funzione del location component è la seguente: determinare analizzando il comportamento dell’utente (dai click e addirittura dal mouseover):</p><ul><li> fino a che punto risultati ordinati secondo criteri meramente geografici possano essere soddisfacenti per l’utente;</li><li> il range di rilevanza geografica o <em>sensibilità geografica</em> per un topic.</li></ul><p>Spieghiamo il range di rilevanza geografica con un esempio: se cerchi su Google &#8220;concessionaria auto&#8221; e &#8220;pizza&#8221;, il location component associa le query rispettivamente ai topic &#8220;automobili&#8221; e &#8220;ristoranti&#8221;.</p><p>Il location component quindi determina la sensibilità geografica dei due topic in questione. Un utente è disposto a viaggiare 50 km per comprare un auto ma non è disposto a fare 50 km per comprare una pizza, giusto?</p><p>La sensibilità geografica è proprio questa. E’ quindi evidente che nell’individuare i risultati di ricerca per la query &#8220;pizza&#8221; la vicinanza all’utente giocherà un ruolo molto più importante rispetto al caso delle automobili.</p><p>Questa sensibilità geografica &#8211; come vedremo &#8211; ha delle interessanti conseguenze sul ranking dei risultati.</p><p><strong>Il Location Database: quali informazioni contiene?</strong></p><p>Inoltre il location database può contenere al suo interno posizioni e indirizzi, una sorta di mappatura di:</p><ul><li>utenti;</li><li>query;</li><li>documenti.</li></ul><p>Il motore di ricerca al momento dell’indicizzazione cerca di associare ad ogni documento scansionato anche una precisa collocazione geografica.</p><p>Il location database inoltre può essere consultato per individuare la posizione dell’utente, del documento e eventualmente per determinare la distanza che intercorre tra essi.</p><p><strong>Il processo di indicizzazione e Ranking</strong></p><p style="text-align: center;"><img class="aligncenter size-full wp-image-539" title="Indicizzazione e Ranking" src="http://www.fortunecat.it/wp-content/uploads/2009/11/indicizzazione-ranking.png" alt="Indicizzazione e Ranking" width="340" height="425" /></p><p><strong>1° Fase</strong></p><p>Il motore di ricerca riceve una query dall’utente.</p><p><strong>2° Fase</strong></p><p>Viene associata una posizione geografica alla query. Questa associazione può avvenire in vari modi. La località può essere specificata espressamente dall&#8217;utente nella query (ad es.: &#8220;hotel roma&#8221;), oppure può essere desunta dall’indirizzo IP dell’utente, dalla sua browsing history, cache history o consultando i dati dell’utente nel location database.</p><p><strong>3° Fase</strong></p><p>Il motore di ricerca identifica i documenti rispondenti alla query.</p><p><strong>4° Fase</strong></p><p>Viene determinato un <strong>Topicl Score</strong>: è un punteggio assegnato in funzione di fattori <em>diversi </em>dalla posizione geografica, tra cui:</p><ul><li>informazioni relative al testo del documento;</li><li>struttura dei link alla pagina;</li><li>informazioni relative ai link alla pagina.</li></ul><p>All’aumentare del topical score aumenta la rilevanza della risorsa.</p><p><strong>5° Fase</strong></p><p>Viene determinato un <strong>Distance Score</strong>: è una funzione monotona decrescente della distanza. Il che tradotto in linguaggio comprensibile significa che se la distanza diminuisce, il distance score <em>aumenta</em>.</p><p>Il distance score dipende però non solo dalla distanza tra utente e documento ma anche dalla sensibilità geografica e presenta un espressione matematica del tipo:</p><blockquote><p><strong>F(d,S)=a/(b + S·d)</strong></p></blockquote><p>dove a e b sono delle costanti scelte per tarare opportunamente l&#8217;algoritmo, d è la distanza ed S è la sensibilità geografica.</p><p style="text-align: center;"><img class="aligncenter size-full wp-image-543" title="Andamento del Distance Score" src="http://www.fortunecat.it/wp-content/uploads/2009/11/distance-score.png" alt="Andamento del Distance Score" width="369" height="286" /></p><p>All’aumentare della sensibilità geografica i documenti più distanti dall’utente ricevono un distance score sempre più basso.</p><p>La sensibilità geografica S viene quantificata non solo in funzione dei diversi topics, delle query, utenti e località, ma anche in funzione del dettaglio richiesto dall’utente.</p><p>Se ad esempio scrivo esplicitamente nel motore di ricerca il CAP o l&#8217;indirizzo, il motore interpreta questa maggiore precisione come una maggiore sensibilità geografica.</p><p><strong>6° Fase</strong></p><p>Il topical score e il distance score vengono combinati in un unico punteggio: il Combined Relevance Score:</p><blockquote><p><strong>C(R,F) = k · R + l · F(d,S)</strong></p></blockquote><p>dove k e l sono delle costanti opportunamente scelte.</p><p>Alla prossima. <img src='http://www.fortunecat.it/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /></p><p><p style="text-decoration: none; color: #000; font-weigth: bold; text-align: right; font-size: 10px"><a href="http://www.fortunecat.it/2009/11/google-local-search-algoritmo/">Google Local Search: criteri generali di funzionamento</a><br /> &copy; Fortunecat.it <a style="text-decoration: none; color: #000; font-size: 10px; font-weigth: bold; text-align: center;" href="http://www.fortunecat.it">SEO Blog</a></p></p> ]]></content:encoded> <wfw:commentRss>http://www.fortunecat.it/2009/11/google-local-search-algoritmo/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> </channel> </rss>