Timeline
Chat
Prospettiva
Algoritmo di Smith-Waterman
algoritmo di bioinformatica Da Wikipedia, l'enciclopedia libera
Remove ads
L'algoritmo di Smith–Waterman è un algoritmo di bioinformatica pensato per l'allineamento di sequenze, cioè la determinazione del grado di similarità (detta anche omologia) di sequenze nucleotidiche o proteiche.
Descrizione
Riepilogo
Prospettiva
L'algoritmo è stato proposto nel 1981 da Temple F. Smith e Michael S. Waterman[1]. L'algoritmo si basa sulla programmazione dinamica ed è una variazione dell'algoritmo di Needleman-Wunsch (proposto qualche anno prima).
L'algoritmo calcola la distanza di edit fra due sequenze nel caso di allineamento locale. Nel caso generale le operazioni disponibili sono:
- corrispondenza (match) di due caratteri uguali
- sostituzione (substitution) di un carattere in un carattere diverso
- inserimento (insertion) di un carattere;
- cancellazione (deletion) di un carattere;
Per calcolare la distanza di edit si deve fornire un opportuno schema di costi. Uno schema di costi diffuso è la distanza di Levenshtein (in cui le operazioni di sostituzione, inserimento e cancellazione hanno costo 1). Si può usare uno schema più generale fornendo una matrice dei costi delle sostituzioni e delle penalità per i gap (che sono la diretta conseguenza di inserimenti e cancellazioni).
L'algoritmo utilizza una matrice come struttura dati ed opera in due fasi. Nella prima fase si compila la matrice ottenendo il punteggio del migliore allineamento. Nella seconda fase si opera un backtracking per recuperare la trasformazione (edit string) che permette di fare l'allineamento.
Remove ads
L'algoritmo
Riepilogo
Prospettiva
La matrice si costruisce nel seguente modo:
Dove:
- = Sono le due stringhe nell'alfabeto
- - è il massimo punteggio di similarità fra il suffisso di a[1...i] e il suffisso di b[1...j]
- , '-' è lo schema delle penalità/punteggi dei gap
Remove ads
Note
Altri progetti
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads