27
OTT
Scritto da Fortunecat in SEO
Brevetto Microsoft 24 settembre 2009: Techniques to perform relative ranking for search results.
Scopo: presentare all’utente una lista di siti e risorse dando precedenza alle risorse più rilevanti.
Perché Microsoft avverte la necessità di aggiornare i propri algoritmi?
In passato la classificazione delle risorse in funzione delle proprietà desunte dai metadati si è rivelata inadeguata costringendo l’utente a visionare una serie di risorse irrilevanti. In molti casi infatti i metadati erano non corretti o fuorvianti.
Funzionamento dell’algoritmo:
La ricerca è effettuata da un sistema denominato “Enhanced Search Component”. Tale sistema è composto da:

A cosa serve il proximity generation module?
Tale modulo riceve il set di risorse, e per ogni risorsa:
Come vedremo il ranking è effettuato anche in funzione di tale valore.
Relevance ranking algorithm
Tale algoritmo valuta ciascuna risorsa in modo da poterle confrontare due alla volta fra loro per determinare quale dovrebbe avere posizionamento migliore (concetto di “weak order”’).
Le tecniche adoperate per quantificare la rilevanza sono dette “Enhanced relevance ranking techniques”.
Tale algoritmo effettua il ranking anche in funzione della posizione del termine nel documento (search term position) e del proximity feature value tra i vari termini.
I sistemi di ranking tradizionali non considerano il valore di prossimità fornendo pertanto risultati anche irrilevanti.
L’enhanced search component utilizzato per individuare le risorse segue tre step:
1° Fase: ricerca dei documenti
La ricerca comporta l’individuazione – a partire da un set di keyword richieste dall’utente – di tutti i documenti che soddisfano un adeguato matching con le keyword stesse.
La ricerca confronta le keyword richieste con varie parti del documento:
A partire da tali caratteristiche viene elaborata una lista di risorse candidate.
Per risorse Microsoft intende qualsiasi tipo di “searchable media content”. Esattamente come avviene per Google nella serp sono presentati anche video, immagini, documenti.
2° Fase: ranking dei documenti.
Il ranking viene effettuato in funzione della rilevanza della risorsa per l’utente.
Obiettivo: abbreviare la ricerca dell’utente cercando di soddisfare i suoi bisoni informativi in un piccolo “subset” di risorse presentate (10 o 20).
Funzionamento del Web Search Engine:
Le informazioni sulle pagine web sono individuate da un crawler (un browser automatizzato che segue tutti i link sulla pagina). I dati delle pagine sono conservati in un index database.
Nel motore di ricerca è anche presente un proximity database con all’interno una proximity table per ciascuna risorsa. Tale proximity table è determinata dal crawler al momento della scansione (la pagina viene processata al momento).
Ciò da un lato velocizza il tempo di elaborazione della serp, d’altro canto rende l’indicizzazione più onerosa per il motore di ricerca.
Questo generera anche un delay eccessivo tra indicizzazione e presentazione dei risultati. Per evitare questo problema viene utilizzata la cosiddetta multistage ranking technique.
Come viene calcolato il proximity feature value?
Il proximity feature value viene calcolato solo su dei chunk o data spans della risorsa che contengono tutti, o anche solo alcuni termini della query.
L’algoritmo di prossimità determina il proximity feature value utilizzando una funzione di costo ordinata oppure non ordinata.
Con la funzione di costo in sostanza viene estratto dal documento solo il chunk più “rilevante” e le analisi di prossimità vengono condotte tali estratti.
Hanno un valore maggiore:
L’utente però può essere maggiormente interessato a risorse che contengono i termini della query nello stesso ordine richiesto (es.: auto usato, e usato auto).
In alcune implementazioni pertanto viene utilizzata una versione diversa dell’algoritmo di prossimità che richiede che le query siano presenti nello stesso ordine (in questi casi viene utilizzata un funzione di costo ordinata).
Il valore di prossimità viene quindi utilizzato dal resource ranking module.
Rete neurale
Algoritmo di ranking progettato come una rete neurale, utilizzate tra le altre cose come strumenti decisionali.
Multistage ranking technique
Estrarre la posizione dei termini e determinare conseguentemente la proximity table può non risultare fattibile nel caso di serp contenenti milioni di risorse.
In tali casi vengono adottati due criteri/algoritmi di ranking.
Un primo algoritmo effettua un ranking sommario e dal basso costo computazionale. In seguito sulle prime n risorse vengono effettuati ulteriori calcoli con un secondo algoritmo più raffinato che tiene conto del proximity feature value.
Il proximity feature value è pertanto il più importante fattore on-page per Bing.
Il resource ranking module utilizza una rete neurale che effettua il ranking, oltre che in base al proximity feature value, anche ad altri fattori tra cui:
Click distance: è una caratteristica indipendente dal tipo di query. Misura il numero di click necessari per raggiungere una data risorsa. Sfrutta la struttura gerarchica dei siti web.
C’è un nodo radice, di solito la homepage, cui sono collegate le “foglie dell’albero”, le pagine.
La click distance aumenta linearmente in funzione della distanza della pagina dalla homepage. Maggiore è la distanza, minore sarà la rilevanza della risorsa.
URL Depth: conta in sostanza il numero di slash presenti nell’url.
All’aumentare della profondità presumibilmente diminuisce la rilevanza.
Sia la click distance e che la url depth sono trasformate utilizzando la formula 1/(1+kx).
I documenti più facilmente accessibili sono anche i più rilevanti.
Tipo del documento: a seconda del tipo viene assegnato un peso diverso, nel brevetto non viene specificato altro.
Algoritmo BM25/BM25F/BM25G: sono varie versioni dello stesso algoritmo. Il BM25 individua vari field all’interno di un documento e assegna un punteggio per ogni ricorrenza del termine di ricerca nei vari field.
I vari punteggi sono combinati per assegnare un unico punteggio al documento.
Field del documento:
Nota: in questi field non compare esplicitamente la metadescription.
Tutti i dati sono quindi normalizzati in modo da avere media=0 e s.q.m.=1.
Policy nei confronti di metadati
Bing non ritiene opportuno dare un peso considerevole ai metadati. Viene detto espressamente che ai metadati viene dato maggior peso solo in caso di ricerca in intranet. Questo perché in tali casi è più probable che i metadati siano accurati e utili per l’utente.
Se il post è stato di tuo gradimento lasciami un commento e abbonati al feed… ![]()
Se l'articolo ti sembra interessante puoi ritwittarlo o condividerlo su Facebook...
Ti potrebbe interessare anche:
Ti trovi in:
Puoi tenere traccia dei commenti successivi abbonandoti al feed dei commenti.
SEO
15 Commenti
Feed dei commenti
© Tutti i diritti riservati
RT: @Fortune_Cat: posizionamento su Bing, brevetto microsoft spiegato in dettaglio: http://bit.ly/3BHaft (molto interessante)
Questo è l'originale http://bit.ly/4sF6ZN, questo è il copione http://bit.ly/6ftjtn . Ecco perchè non pubblico più materiale utile online.
RT @misterjinx: Questo è l'originale http://bit.ly/4sF6ZN, questo è il copione http://bit.ly/6ftjtn . Ecco perchè non pubblico più mater …
RT @Fortune_Cat: RT@misterjinx Questo è l'originale http://bit.ly/4sF6ZN questo il copione http://bit.ly/6ftjtn Ecco perchè non pubblico …
RT @misterjinx: Questo è l'originale http://bit.ly/4sF6ZN, questo è il copione http://bit.ly/6ftjtn . Ecco perchè non pubblico più mater …
RT @misterjinx: Questo è l'originale http://bit.ly/4sF6ZN, questo è il copione http://bit.ly/6ftjtn . Ecco perchè non pubblico più mater …
RT @Fortune_Cat: RT@misterjinx Questo è l'originale http://bit.ly/4sF6ZN questo il copione http://bit.ly/6ftjtn Ecco perchè non pubblico …
Questo post è stato utilizzato da uno degli utenti del nostro portale RedominoLabs all’interno di una propria ricerca su Bing. Appena ricevuta la vostra segnalazione è stato subito aggiunto il link alla fonte originale e la corretta attribuzione all’autore.
Ci scusiamo per il disguido e vi ringraziamo per il vostro contributo a favore della libera diffusione dell’informazione in Internet.
La redazione di RedominoLabs
RT @misterjinx Questo è l'originale http://bit.ly/4sF6ZN, questo è il copione http://bit.ly/6ftjtn .
RT @misterjinx Questo è l'originale http://bit.ly/4sF6ZN questo è il copione http://bit.ly/6ftjtn << Autore originale: @Fortune_Cat
RT @misterjinx: Questo è l'originale http://bit.ly/4sF6ZN, questo è il copione http://bit.ly/6ftjtn . Ecco perchè non pubblico più mater …
RT @Seo__Guru: RT @misterjinx Questo è l'originale http://bit.ly/4sF6ZN questo è il copione http://bit.ly/6ftjtn << Autore origin …
Ottimo post, complimenti!
Ciao Elena grazie per la visita…
[...] Brevetto Microsoft: Posizionamento su Bing Brevetto Microsoft: Posizionamento su Bing (Fortunecat.it SEO Blog) Brevetto Microsoft 24 settembre 2009: Techniques to perform relative ranking for search results. Scopo: presentare all’utente una lista di siti e risorse dando precedenza alle risorse più rilevanti. blog: Fortunecat.it | leggi l'articolo [...]