Informazione

Strumento di ricerca di allineamento locale di base (BLAST)

Strumento di ricerca di allineamento locale di base (BLAST)



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Perché BLASTP (Basic Local Alignment Search Tool) dovrebbe essere uno strumento scadente per la ricerca di motivi nelle sequenze proteiche?


BlastP effettua una ricerca della somiglianza di sequenza per inferire la funzione confrontando una sequenza sconosciuta con una sequenza che è già stata annotata con una funzione, ma proteine ​​strutturalmente simili con sequenze diverse possono avere la stessa funzione perché la funzione può essere imitata se l'amminoacido sostitutivo rientra in una categoria simile come l'amminoacido sostituito. Le quattro principali categorie di amminoacidi sono: carica negativa, carica positiva, polare e idrofoba.

Le proteine ​​hanno molte forme, mentre la doppia elica nel DNA è la forma in cui il DNA si trova più spesso. Pertanto, la struttura del DNA non è così importante per la funzione quanto la struttura delle proteine ​​lo è per la funzione proteica. Quindi hai bisogno di uno strumento in grado di confrontare la forma tridimensionale di una proteina con un'altra (oltre al confronto di sequenza) per fare una stima di quanto sia probabile che ci sarà una somiglianza nella funzione. Il Research Collaboratory for Structural Bioinformatics offre uno strumento in grado di confrontare le proteine ​​per sequenza e per struttura. La schermata seguente mostra le opzioni di confronto in ciascuna di queste due categorie:


Perché ha un modello statistico scadente. È fondamentalmente uno strumento di allineamento locale aiutato da un indice k-mer a lunghezza fissa. Stima l'omologia in termini di identità di sequenza e mentre questo è spesso sufficiente per trovare l'omologia in sequenze relativamente conservative, il modello di punteggio euristico non consente realmente di cercare motivi. Un motivo in termini di bioinformatica può essere visto come una serie di eventi di cambio di stato, quindi hai bisogno di un modello che stimi la somiglianza in termini di probabilità di osservare una tale sequenza di cambi di stato sotto la tua precedente matrice di cambio di stato (dedotta da un training campione). Questi modelli sono noti come modelli Markov e le persone di solito utilizzano i modelli Markov nascosti per trovare motivi. Ci sono buoni strumenti popolari, come HMMER

MODIFICARE come da commento di OP

Poiché i motivi sono regioni conservate localmente e BLAST esegue anche l'allineamento locale, perché non dovrebbe essere in grado di cercare i motivi?

  1. Un motivo non è solo una "regione conservata localmente", è un profilo di sequenza specifico. BLAST non estrae alcun profilo di sequenza, non è stato creato per quello. Data una coppia di sequenze, mostra semplicemente patch simili. Quindi BLAST semplicemente non è lo strumento giusto per il compito. Hanno creato PSI-BLAST proprio per questo.
  2. Inoltre, molti motivi comprendono amminoacidi o nucleotidi che possono essere abbastanza separati in una sequenza primaria e si avvicinano solo in una struttura ripiegata (secondaria o terziaria). Qui la tua definizione di "regione conservata localmente" fallisce così come BLAST.
  3. Come ho già detto, BLAST esegue un allineamento locale euristico, ovvero presuppone che due sequenze correlate debbano contenere almeno un k-mer (parola) comune di lunghezza specifica. Questo, dato un indice di parole precalcolato, aumenta notevolmente le prestazioni in termini di velocità e consumo di RAM. Ma motivi simili possono essere presenti in sequenze non omologhe o in sequenze altamente divergenti che difficilmente mostrano alcuna omologia e BLAST non troverà proprio nulla.