Informazione

9.3: Esercizio 1 - Il codice di 1 lettera per gli amminoacidi - Biologia


Potresti trovare Amino Acid Explorer dell'NCBI utile per questo esercizio. Puoi accedere ad Amino Acid Explorer tramite Google o direttamente su:

www.ncbi.nlm.nih.gov/Class/St...a_explorer.cgi


1. Sotto la sequenza amminica sottostante, scrivi la stessa sequenza utilizzando il codice di 1 lettera. Met-Glu-Asn-Asp-Glu-Leu-Pro-Ile-Cys-Lys-Glu-Asp-Pro-Glu-Cys-Lys-Glu-Asp

2. Qual è la carica netta di questo peptide? (Assegna -1 per ogni amminoacido acido e +1 per ogni amminoacido basico. Somma le cariche totali.)

3. Utilizzando il diagramma di Venn sopra, proporre una sostituzione conservativa per:
Trp - His - ​​​​​​​Arg - ​​​​​​​​​​​​​​Leu -

4. Scrivi il nome di un gruppo musicale che ti piace. Quindi trasponi il nome in una sequenza di amminoacidi scritta con il codice di 3 lettere. Passa la sequenza di amminoacidi a un amico e chiedigli di decodificarla. (Nota: il codice a 1 lettera utilizza tutto l'alfabeto, tranne B, J, O, U, X e Z).


Aminoacidi

Gli amminoacidi sono gli elementi costitutivi delle proteine: creano la struttura primaria delle proteine. Ci sono 20 amminoacidi naturali. Gli amminoacidi esistono nelle proteine ​​come isomeri L-ottici, tuttavia, possono esistere come isomeri D in esempi isolati, ad es. alcune pareti cellulari batteriche contengono isomeri D. Quando due amminoacidi si uniscono formano un legame peptidico. Questo legame funziona come un doppio legame parziale che fa sì che gli amminoacidi abbiano isomeri cis/trans. Sebbene si trovi più comunemente in trans. Tutti gli amminoacidi sono anfoteri, il che significa che possono agire sia come base che come acido a causa dei loro gruppi amminico e carboyxl rispettivamente [1] .

Gli amminoacidi sono i monomeri che compongono le proteine ​​unendosi in reazioni di condensazione per formare legami peptidici tra loro. Quando un amminoacido fa parte di una proteina è noto come residuo amminoacidico, ha la stessa catena laterale ma è alfa. I gruppi amminici e carbossilici fanno ora parte dei legami peptidici. Tutti gli amminoacidi hanno un gruppo acido alfa carbossilico, un gruppo alfa amminico e un atomo di idrogeno legato a un carbonio centrale insieme a un quarto gruppo variabile. Questo gruppo varia nei 20 amminoacidi essenziali e generalmente consente agli amminoacidi di esibire lo sterioisomerismo per creare isomeri ottici D e L. L'unica eccezione a questo è l'amminoacido più semplice glicina con il suo gruppo variabile che è un altro atomo di idrogeno. Questo previene lo stereoisomeria in quanto non ci sono quattro gruppi diversi poi legati al carbonio centrale - non c'è un centro chirale [2] . 

Gli amminoacidi possono anche essere caratterizzati come polari o non polari e questi determinano la funzione degli amminoacidi. Ci sono 10 amminoacidi non polari trovati nel nucleo proteico e ci sono 10 amminoacidi polari. Questi hanno ruoli enzimatici e possono essere usati per legare DNA, metalli e altri ligandi naturali. Ci sono amminoacidi essenziali e amminoacidi non essenziali. Gli amminoacidi essenziali sono quelli che il corpo non è in grado di sintetizzare da solo. Gli amminoacidi essenziali nell'uomo sono: istidina, leucina, isoleucina, lisina, metionina, valina, fenilalanina, tirosina e triptofano [3]. Questi aminoacidi devono essere forniti all'organismo tramite proteine ​​digerite che vengono poi assorbite nell'intestino e trasportate nel sangue dove sono necessarie [4] . Anche la digestione delle proteine ​​cellulari è un'importante fonte di aminoacidi. Gli amminoacidi non essenziali possono essere sintetizzati da composti già esistenti nel corpo come il modo in cui la serina viene sintetizzata dalla glicina [5] .

Gli amminoacidi sono stati abbreviati in un codice a 3 lettere e in un codice a 1 lettera. Ad esempio, la glicina ha il codice di 3 lettere "Gly" e gli viene assegnata la lettera "G" (vedi codici di amminoacidi a lettera singola).

La tabella seguente elenca i 20 aminoacidi, il loro codice a una lettera, il codice a tre lettere, le loro cariche e la polarità della catena laterale:


Codice genetico e traduzione di aminoacidi

La tabella 1 mostra il codice genetico dell'acido ribonucleico messaggero (mRNA), cioè mostra tutte le 64 possibili combinazioni di codoni composti da tre basi nucleotidiche (unità trinucleotidiche) che specificano gli amminoacidi durante l'assemblaggio delle proteine.

Ogni codone dell'acido desossiribonucleico (DNA) codifica o specifica un singolo amminoacido e ogni unità nucleotidica è costituita da un fosfato, zucchero desossiribosio e una delle 4 basi nucleotidiche azotate, adenina (A), guanina (G), citosina (C). ) e timina (T). Le basi sono appaiate e unite tra loro da legami idrogeno nella doppia elica del DNA. L'mRNA corrisponde al DNA (cioè la sequenza dei nucleotidi è la stessa in entrambe le catene) tranne che nell'RNA la timina (T) è sostituita dall'uracile (U) e il desossiribosio è sostituito dal ribosio.

Il processo di traduzione dell'informazione genetica nell'assemblaggio di una proteina richiede prima mRNA, che viene letto da 5' a 3' (esattamente come DNA), e quindi trasferimento di acido ribonucleico (tRNA), che viene letto da 3' a 5'. Il tRNA è il taxi che traduce le informazioni sul ribosoma in una catena di amminoacidi o polipeptidi.

Per l'mRNA ci sono 4 3 = 64 diverse combinazioni di nucleotidi possibili con un codone di tre nucleotidi. Tutte le 64 possibili combinazioni sono mostrate nella Tabella 1. Tuttavia, non tutti i 64 codoni del codice genetico specificano un singolo amminoacido durante la traduzione. Il motivo è che nell'uomo solo 20 amminoacidi (eccetto la selenocisteina) sono coinvolti nella traduzione. Pertanto, un amminoacido può essere codificato da più di un codone-tripletto di mRNA. Arginina e leucina sono codificate da 6 triplette, isoleucina da 3, metionina e triptofano da 1 e tutti gli altri amminoacidi da 4 o 2 codoni. I codoni ridondanti sono tipicamente diversi alla 3a base. La tabella 2 mostra l'assegnazione del codone inverso, cioè quale codone specifica quale dei 20 amminoacidi standard coinvolti nella traduzione.

Tabella 1. Codice genetico: codone mRNA -> amminoacido


Base

Base

Base
tu C UN G
tu fenilalanina Serina tirosina cisteina tu
fenilalanina Serina tirosina cisteina C
leucina Serina Fermare Fermare UN
leucina Serina Fermare Triptofano G
C leucina Proline istidina arginina tu
leucina Proline istidina arginina C
leucina Proline Glutammina arginina UN
leucina Proline Glutammina arginina G
UN isoleucina treonina Asparagina Serina tu
isoleucina treonina Asparagina Serina C
isoleucina treonina lisina arginina UN
Metionina (Inizio) 1 treonina lisina arginina G
G valina alanina aspartato glicina tu
valina alanina aspartato glicina C
valina alanina Glutammato glicina UN
valina alanina Glutammato glicina G

Tabella 2. Tabella dei codoni inversi: amminoacido -> codone mRNA

Amminoacido codoni mRNA Amminoacido codoni mRNA
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Argo/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AGO
Asp/D GAU, GAC Phe/F UUU, UUC
Cis/C UGU, UGC Puntello CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Colla GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gli/G GGU, GGC, GGA, GGG Trp/W UGG
Il suo / H CAU, CAC Tyr/Y UAU, UAC
Ile/io AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
COMINCIARE AGO FERMARE UAG, UGA, UAA

La direzione di lettura dell'mRNA va da 5' a 3'. Il tRNA (lettura da 3' a 5') ha anticodoni complementari ai codoni nell'mRNA e può essere "caricato" in modo covalente con amminoacidi al loro terminale 3'. Secondo Crick il legame delle coppie di basi tra il codone dell'mRNA e l'anticodone del tRNA avviene solo alla 1a e alla 2a base. Il legame alla terza base (cioè all'estremità 5' dell'anticodone del tRNA) è più debole e può dare luogo a coppie diverse. Affinché il legame tra codone e anticodone si realizzi, le basi devono oscillare fuori dalle loro posizioni in corrispondenza del ribosoma. Pertanto, le coppie di basi sono talvolta chiamate coppie di oscillazione.

La tabella 3 mostra le possibili coppie di oscillazioni alla 1a, 2a e 3a base. Le possibili combinazioni di coppie alla 1a e alla 2a base sono identiche. Alla terza base (cioè all'estremità 3' dell'mRNA e all'estremità 5' del tRNA) le possibili combinazioni di coppie sono meno univoche, il che porta alla ridondanza nell'mRNA. La deaminazione (rimozione del gruppo amminico NH2) di adenosina (da non confondere con l'adenina) produce il nucleotide inosina (I) sul tRNA, che genera coppie di oscillazione non standard con U, C o A (ma non con G) sull'mRNA. L'inosina può verificarsi alla 3a base del tRNA.

Tabella 3. Coppie di basi: codone mRNA -> anticodone tRNA

La tabella 3 è letta nel modo seguente: per la 1a e la 2a coppia di basi le coppie di oscillazione forniscono unicità nel modo in cui U su tRNA emerge sempre da A su mRNA, A su tRNA emerge sempre da U su mRNA, ecc. Per la terza coppia di basi il codice genetico è ridondante nel modo in cui U su tRNA può emergere da A o G su mRNA, G su tRNA può emergere da U o C su mRNA e I su tRNA può emergere da U, C o A su mRNA. Solo A e C al 3° posto sul tRNA sono assegnati inequivocabilmente a U e G al 3° posto sull'mRNA, rispettivamente.

A causa di questa struttura combinata, un tRNA può legarsi a diversi codoni di mRNA in cui i codoni di mRNA sinonimi o ridondanti differiscono alla terza base (cioè all'estremità 5' del tRNA e all'estremità 3' dell'mRNA). Con questa logica il numero minimo di anticodoni di tRNA necessari per codificare tutti gli amminoacidi si riduce a 31 (esclusi i 2 codoni di STOP AUU e ACU, vedi Tabella 5). Ciò significa che qualsiasi anticodone di tRNA può essere codificato da uno o più diversi codoni di mRNA (Tabella 4). Tuttavia, ci sono più di 31 anticodoni di tRNA possibili per la traduzione di tutti i 64 codoni di mRNA. Ad esempio, la serina ha un sito degenerato quadruplo in terza posizione (UCU, UCC, UCA, UCG), che può essere tradotto da AGI (per UCU, UCC e UCA) e AGC su tRNA (per UCG) ma anche da AGG e AGU. Ciò significa, a sua volta, che qualsiasi codone di mRNA può anche essere tradotto da uno o più anticodoni di tRNA (vedi Tabella 5).

La ragione per la presenza di diverse coppie di oscillazione che codificano lo stesso amminoacido può essere dovuta a un compromesso tra velocità e sicurezza nella sintesi proteica. La ridondanza dei codoni dell'mRNA esiste per prevenire errori di trascrizione causati da mutazioni o variazioni nella terza posizione ma anche in altre posizioni. Ad esempio, la prima posizione dei codoni della leucina (UCA, UCC, CCU, CCC, CCA, CCG) è un doppio sito degenerato, mentre la seconda posizione è univoca (non ridondante). Un altro esempio è la serina con codoni di mRNA UCA, UCG, UCC, UCU, AGU, AGC. Naturalmente, la serina è anche doppiamente degenerata nella prima posizione e quadrupla degenerata nella terza posizione, ma è inoltre doppiamente degenerata nella seconda posizione. La tabella 4 mostra l'assegnazione dei codoni dell'mRNA a qualsiasi possibile anticodone del tRNA negli eucarioti per i 20 amminoacidi standard coinvolti nella traduzione. È l'assegnazione del codone inverso.

Tabella 4. Codifica inversa degli amminoacidi: amminoacido -> anticodone tRNA -> codone mRNA

Sebbene non sia possibile prevedere uno specifico codone di DNA da un amminoacido, i codoni di DNA possono essere decodificati in modo univoco in amminoacidi. Il motivo è che ci sono 61 diversi codoni di DNA (e mRNA) che specificano solo 20 amminoacidi. Nota che ci sono 3 codoni aggiuntivi per la terminazione della catena, cioè ci sono 64 codoni di DNA (e quindi 64 diversi mRNA), ma solo 61 di essi specificano gli amminoacidi.

La tabella 5 mostra il codice genetico per la traduzione di tutti i 64 codoni del DNA, a partire dal DNA su mRNA e tRNA in amminoacido. Nell'ultima colonna, la tabella mostra i diversi anticodoni del tRNA minimamente necessari per tradurre tutti i codoni del DNA in amminoacidi e riassume il numero nell'ultima riga. Rivela che il numero minimo di anticodoni del tRNA per tradurre tutti i codoni del DNA è 31 (più 2 codoni di STOP). Il numero massimo di anticodoni del tRNA che possono emergere nella trascrizione degli amminoacidi è 70 (più 3 codoni di STOP).

Tabella 5. Codice genetico: DNA -> codone mRNA -> anticodone tRNA -> amminoacido

Nota:
1 Il codone AUG codifica per la metionina e funge da sito di inizio: il primo AUG nella regione codificante di un mRNA è il punto in cui inizia la traduzione in proteina.


Amminoacido

Aminoacidi sono composti organici che contengono aminoacidi (–NH2) e gruppi funzionali carbossilici (–COOH), insieme a una catena laterale (gruppo R) specifica per ciascun amminoacido. [1] Gli elementi chiave di un amminoacido sono carbonio (C), idrogeno (H), ossigeno (O) e azoto (N), sebbene altri elementi si trovino nelle catene laterali di alcuni amminoacidi. Dal 1983 sono noti circa 500 amminoacidi naturali (sebbene solo 20 compaiano nel codice genetico) e possono essere classificati in molti modi. [2] Possono essere classificati in base alle posizioni dei gruppi funzionali strutturali principali come amminoacidi alfa- (α-), beta- (β-), gamma- (γ-) o delta- (δ-) altre categorie si riferiscono a polarità, livello di pH e tipo di gruppo della catena laterale (alifatico, aciclico, aromatico, contenente ossidrile o zolfo, ecc.). Sotto forma di proteine, i residui di amminoacidi costituiscono il secondo componente più grande (l'acqua è il più grande) dei muscoli umani e di altri tessuti. [3] Oltre al loro ruolo come residui nelle proteine, gli amminoacidi partecipano a una serie di processi come il trasporto e la biosintesi dei neurotrasmettitori.

In biochimica, gli amminoacidi che hanno il gruppo amminico attaccato all'atomo di carbonio (alfa) vicino al gruppo carbossilico hanno particolare importanza. Sono conosciuti come 2-, alfa-, o α-amminoacidi (formula generica H2NCHRCOOH nella maggior parte dei casi, [a] dove R è un sostituente organico noto come "catena laterale") [4] spesso il termine "amminoacido" è usato per riferirsi specificamente a questi. Includono i 22 aminoacidi proteinogenici ("costruttori di proteine"), [5] [6] [7] che si combinano in catene peptidiche ("polipeptidi") per formare i mattoni di una vasta gamma di proteine. [8] Questi sono tutti l-stereoisomeri (isomeri "mancini"), anche se pochi D-aminoacidi ("destrimano") si trovano negli involucri batterici, come neuromodulatori (D-serina) e in alcuni antibiotici. [9]

Venti degli amminoacidi proteinogenici sono codificati direttamente da codoni di triplette nel codice genetico e sono noti come amminoacidi "standard". Gli altri due ("non standard" o "non canonici") sono la selenocisteina (presente in molti procarioti e nella maggior parte degli eucarioti, ma non codificata direttamente dal DNA) e la pirrolisina (presente solo in alcuni archaea e in un batterio). La pirrolisina e la selenocisteina sono codificate tramite codoni varianti, ad esempio la selenocisteina è codificata dal codone di stop e dall'elemento SECIS. [10] [11] [12] n-formilmetionina (che è spesso l'aminoacido iniziale delle proteine ​​nei batteri, nei mitocondri e nei cloroplasti) è generalmente considerata una forma di metionina piuttosto che un aminoacido proteinogenico separato. Le combinazioni codone-tRNA non presenti in natura possono essere utilizzate anche per "espandere" il codice genetico e formare nuove proteine ​​note come alloproteine ​​che incorporano amminoacidi non proteinogenici. [13] [14] [15]

Molti importanti amminoacidi proteinogenici e non proteinogenici hanno funzioni biologiche. Ad esempio, nel cervello umano, il glutammato (acido glutammico standard) e l'acido gamma-aminobutirrico ("GABA", gamma-aminoacido non standard) sono, rispettivamente, i principali neurotrasmettitori eccitatori e inibitori. [16] L'idrossiprolina, un componente importante del collagene del tessuto connettivo, è sintetizzata dalla prolina. La glicina è un precursore biosintetico delle porfirine utilizzate nei globuli rossi. La carnitina è utilizzata nel trasporto dei lipidi. Nove aminoacidi proteinogenici sono chiamati "essenziali" per l'uomo perché non possono essere prodotti da altri composti dal corpo umano e quindi devono essere assunti come cibo. Altri possono essere condizionatamente essenziali per determinate età o condizioni mediche. Gli amminoacidi essenziali possono anche variare da specie a specie. [b] A causa del loro significato biologico, gli amminoacidi sono importanti nella nutrizione e sono comunemente usati negli integratori alimentari, nei fertilizzanti, nei mangimi e nella tecnologia alimentare. Gli usi industriali includono la produzione di farmaci, plastiche biodegradabili e catalizzatori chirali.

Storia

I primi amminoacidi furono scoperti all'inizio del XIX secolo. [17] [18] Nel 1806, i chimici francesi Louis-Nicolas Vauquelin e Pierre Jean Robiquet isolarono un composto negli asparagi che fu successivamente chiamato asparagina, il primo amminoacido scoperto. [19] [20] La cistina fu scoperta nel 1810, [21] sebbene il suo monomero, la cisteina, rimase sconosciuto fino al 1884. [20] [22] La glicina e la leucina furono scoperte nel 1820. [23] L'ultimo dei 20 aminoacidi comuni acidi da scoprire fu la treonina nel 1935 da William Cumming Rose, che determinò anche gli amminoacidi essenziali e stabilì il fabbisogno giornaliero minimo di tutti gli amminoacidi per una crescita ottimale. [24] [25]

L'unità della categoria chimica fu riconosciuta da Wurtz nel 1865, ma non le diede un nome particolare. [26] Il primo uso del termine "aminoacido" in lingua inglese risale al 1898, [27] mentre il termine tedesco, Aminosäure, è stato utilizzato in precedenza. [28] È stato scoperto che le proteine ​​producono amminoacidi dopo la digestione enzimatica o l'idrolisi acida. Nel 1902, Emil Fischer e Franz Hofmeister proposero indipendentemente che le proteine ​​fossero formate da molti amminoacidi, per cui si formano legami tra il gruppo amminico di un amminoacido con il gruppo carbossilico di un altro, risultando in una struttura lineare che Fischer chiamò "peptide". [29]

Struttura generale

Nella struttura mostrata nella parte superiore della pagina, R rappresenta una catena laterale specifica per ciascun amminoacido. L'atomo di carbonio vicino al gruppo carbossilico è chiamato carbonio α. Gli amminoacidi contenenti un gruppo amminico legato direttamente al carbonio alfa sono indicati come alfa aminoacidi. [30] Questi includono amminoacidi come la prolina che contengono ammine secondarie, che venivano spesso chiamate "iminoacidi". [31] [32] [33]

Isomeria

Gli alfa-amminoacidi sono le forme naturali comuni di amminoacidi. Ad eccezione della glicina, altri amminoacidi naturali adottano il l configurazione. [34] Mentre l-aminoacidi rappresentano tutti gli amminoacidi presenti nelle proteine ​​durante la traduzione nel ribosoma.

Il l e D La convenzione per la configurazione dell'amminoacido non si riferisce all'attività ottica dell'amminoacido stesso, ma piuttosto all'attività ottica dell'isomero della gliceraldeide da cui quell'amminoacido può, in teoria, essere sintetizzato (D- la gliceraldeide è destrogira l-gliceraldeide è levogiro). In modo alternativo, il (S) e (R) i designatori sono usati per indicare il configurazione assoluta. Quasi tutti gli amminoacidi nelle proteine ​​sono (S) al carbonio α, essendo la cisteina (R) e glicina non chirale. [35] La cisteina ha la sua catena laterale nella stessa posizione geometrica degli altri amminoacidi, ma la R/S la terminologia è invertita perché lo zolfo ha un numero atomico più alto rispetto all'ossigeno carbossilico che dà alla catena laterale una priorità più alta dal Regole della sequenza Cahn-Ingold-Prelog, mentre gli atomi nella maggior parte delle altre catene laterali danno loro una priorità inferiore rispetto al gruppo carbossilico. [ citazione necessaria ]

D-residui di aminoacidi si trovano in alcune proteine, ma sono rari.

Catene laterali

Gli amminoacidi sono designati come α- quando l'atomo di azoto è attaccato all'atomo di carbonio adiacente al gruppo carbossilico: in questo caso il composto contiene la sottostruttura N–C–CO2. Aminoacidi con la sottostruttura N–C–C–CO2 sono classificati come -amminoacidi. Gli amminoacidi contengono la sottostruttura N–C–C–C–CO2, e così via. [36]

Gli amminoacidi sono generalmente classificati in base alle proprietà della loro catena laterale in quattro gruppi. La catena laterale può rendere un amminoacido un acido debole o una base debole e un idrofilo se la catena laterale è polare o un idrofobo se non è polare. [34] La frase "aminoacidi a catena ramificata" o BCAA si riferisce agli amminoacidi che hanno catene laterali alifatiche lineari: leucina, isoleucina e valina. La prolina è l'unico amminoacido proteinogenico il cui gruppo laterale si lega al gruppo α-amminico e, quindi, è anche l'unico amminoacido proteinogenico contenente un'ammina secondaria in questa posizione. [34] In termini chimici, la prolina è, quindi, un imminoacido, poiché manca di un gruppo amminico primario, [37] sebbene sia ancora classificato come amminoacido nell'attuale nomenclatura biochimica [38] e possa anche essere chiamato un amminoacido "nalfa-amminoacido alchilato". [39]

Zwitterion

In soluzione acquosa gli amminoacidi esistono in due forme (come illustrato a destra), la forma molecolare e la forma zwitterion in equilibrio tra loro. Le due forme coesistono nell'intervallo di pH pK1 − da 2 a pK2 + 2 , che per la glicina è pH 0-12. Il rapporto tra le concentrazioni dei due isomeri è indipendente dal pH. Il valore di questo rapporto non può essere determinato sperimentalmente.

Poiché tutti gli amminoacidi contengono gruppi funzionali amminici e acidi carbossilici, sono anfiprotici. [34] A pH = pK1 (circa 2,2) vi sarà uguale concentrazione della specie NH +
3 CH(R)CO
2H e NH +
3 CH(R)CO −
2 e a pH = pK2 (circa 10) ci sarà uguale concentrazione della specie NH +
3 CH(R)CO −
2 e NH
2 CH(R)CO −
2 . Ne consegue che la molecola neutra e lo zwitterione sono effettivamente le uniche specie presenti a pH biologico. [40]

Si presume generalmente che la concentrazione dello zwitterion sia molto maggiore della concentrazione della molecola neutra sulla base di confronti con il noto pK valori di ammine e acidi carbossilici.


Esercizi

Esercizio 1: Trova coppie di caratteri¶

Scrivi una funzione count_pairs(dna, coppia) che restituisce il numero di occorrenze di una coppia di caratteri ( coppia ) in una stringa di DNA ( dna ). Ad esempio, chiamando la funzione con dna come 'ACTGCTATCCATT' e coppia come 'A' restituirà 2. Nome file: count_pairs.py .

Esercizio 2: Conta le sottostringhe¶

Questa è un'estensione di Esercizio 1: Trova coppie di caratteri: conta quante volte una certa stringa appare in un'altra stringa. Ad esempio, la funzione restituisce 3 quando viene chiamata con la stringa DNA 'ACGTTACGGAACG' e la sottostringa 'ACG' .

Suggerimento. Per ogni corrispondenza del primo carattere della sottostringa nella stringa principale, controlla se il prossimo n caratteri nella stringa principale corrisponde alla sottostringa, dove n è la lunghezza della sottostringa. Usa fette come s[3:9] per scegliere una sottostringa di S .

Esercizio 3: Consenti tipi diversi per un argomento di funzione¶

Considera la famiglia di trova_consenso_v* funzioni dalla sezione Analisi della matrice di frequenza. Le diverse versioni lavorano su diverse rappresentazioni della matrice di frequenza. Fare un unificato trova_consenso funzione che accetta diverse strutture dati per il frequency_matrix . Testare il tipo di struttura dati ed eseguire le azioni necessarie. Nome del file: find_consensus.py .

Esercizio 4: Rendi una funzione più robusta¶

Considera la funzione get_base_counts(dna) dalla sezione Trovare le frequenze di base, che conta quante volte UN , C , G , e T appare nella stringa DNA :

Sfortunatamente, questa funzione si blocca se compaiono altre lettere in DNA . Scrivi una funzione avanzata get_base_counts2 che risolve questo problema. Provalo su una stringa come 'ADLSTTLLD' . Nome del file: get_base_counts2.py .

Esercizio 5: Trova la proporzione delle basi all'interno/all'esterno degli esoni¶

Considera il gene della lattasi come descritto nelle sezioni Tradurre i geni in proteine e Alcuni esseri umani possono bere latte, mentre altri no. Qual è la proporzione di base A all'interno e all'esterno degli esoni del gene della lattasi?

Suggerimento. Scrivi una funzione get_esoni , che restituisce tutte le sottostringhe delle regioni esone concatenate. Scrivi anche una funzione get_introns , che restituisce tutte le sottostringhe tra le regioni dell'esone concatenate. La funzione get_base_frequencies dalla sezione Trovare le frequenze di base può quindi essere utilizzato per analizzare le frequenze delle basi A, C, G e T nelle due stringhe.

Esercizio 6: Accelera la mutazione della catena di Markov¶

Le funzioni transizione e mutate_via_markov_chain dalla sezione Mutazioni casuali dei geni sono stati realizzati per essere di facile lettura e comprensione. A un esame più attento, ci rendiamo conto che il transizione la funzione costruisce il interval_limits ogni volta che deve essere calcolata una transizione casuale e vogliamo eseguire un numero elevato di transizioni. Unendo le due funzioni, pre-calcolando i limiti di intervallo per ciascuna from_base e aggiungendo un ciclo sopra n mutazioni, si può ridurre al minimo il calcolo dei limiti di intervallo. Eseguire un tale miglioramento dell'efficienza. Misurare il tempo della CPU di questa nuova funzione rispetto al mutate_via_markov_chain funzione per 1 milione di mutazioni. Nome del file: markov_chain_mutation2.py .

Esercizio 7: Estendi il costruttore nella classe Gene¶

Modifica il costruttore in classe Gene dalla sezione Classi per l'analisi del DNA tale che non dare argomenti al costruttore fa sì che la classe richiami il genera_stringa metodo (da funzioni_dna modulo) che genera una sequenza casuale di DNA. Nome del file: dna_classes2.py .


9.3: Esercizio 1 - Il codice di 1 lettera per gli amminoacidi - Biologia

Questo modulo fornisce un'ampia descrizione delle strutture delle macromolecole biologiche e delle loro interazioni. Ha lo scopo di mostrare come la base della loro reattività può essere compresa in termini di leggi e concetti chimici.

Al termine del modulo uno studente dovrebbe essere in grado di

a) raffigurano meccanicamente la tipica reattività di amminoacidi, nucleotidi e carboidrati semplici

b) descrivere le strutture primarie, secondarie, terziarie e quaternarie di proteine, polisaccaridi, acidi nucleici e doppi strati fosfolipidici, discuterne le dimensioni e descrivere come le loro funzioni biologiche sono correlate alla loro struttura chimica e reattività

c) spiegare i diversi tipi di interazioni non covalenti a livello molecolare ed essere in grado di tradurre i concetti di legame idrogeno, interazioni di van der Waals, interazioni idrofobiche, interazioni idrofile e ponti salini in una descrizione della struttura macromolecolare e di come piccoli ligandi interagire con gli enzimi

d) fornire una panoramica di come funzionano gli enzimi all'interno dei sistemi biologici e scrivere meccanismi per esempi specifici di enzimi idrolitici e redox

e) spiegare il modello di cinetica enzimatica di Michaelis-Menten ed essere in grado di descrivere quantitativamente le reazioni catalizzate da enzimi utilizzando l'equazione di Michaelis-Menten

f) spiegare la chimica dei processi di replicazione, mutagenesi e riparazione del DNA

g) descrivere la chimica alla base della trascrizione e della traduzione e spiegare come questa può essere utilizzata per produrre una proteina con una data sequenza di amminoacidi

h) disegnare i meccanismi per la degradazione Edman delle proteine ​​e la reazione con il bromuro di cianogeno.

Come verrà consegnato il modulo

17 x 1 h lezioni frontali, 3 x 1 h workshop, 7 h pratiche

Abilità che verranno praticate e sviluppate

Al termine del modulo lo studente sarà in grado di:

a) razionalizzare i meccanismi di reazione biologica usando il formalismo della freccia riccia della chimica organica

b) suggerire funzioni biologiche e reattività biologicamente rilevanti di molecole inedite.

Abilità specifiche della disciplina (comprese quelle pratiche):

Al termine del modulo lo studente avrà una maggiore consapevolezza di come applicare i principi della reattività chimica a sistemi biologici più complessi. Lo studente sarà in grado di utilizzare banche dati on-line per la ricerca della funzione e della struttura delle macromolecole biologiche.

Come verrà valutato il modulo

Una prova scritta (2 h) metterà alla prova le conoscenze e la comprensione dello studente così come elaborate nell'ambito dei risultati di apprendimento. I corsi (workshop e tutorial) consentiranno allo studente di dimostrare la sua capacità di giudicare e rivedere criticamente le informazioni rilevanti. Le abilità pratiche saranno valutate attraverso un'esercitazione di laboratorio.

Analisi della valutazione

Tipo % Titolo Durata (ore)
Esame online - semestre primaverile 70 Biologia chimica II: Introduzione all'enzima e all'acido nucleico 2
Valutazione scritta 15 Workshop N / A
Valutazione basata sulla pratica 15 Lavoro pratico N / A

Contenuto del programma

Biomacromolecole e loro elementi costitutivi, tra cui aminoacidi, carboidrati e nucleotidi.

Gruppi funzionali della catena laterale degli amminoacidi - classificazione in idrofobico, idrofilo, carico, aromatico.

pKun e gli stati di ionizzazione degli amminoacidi in condizioni fisiologiche.

Cisteina - capacità di ossidarsi.

Polipeptidi/proteine ​​- legami ammidici - struttura elettronica e geometria.

Struttura primaria: i codici a 3 lettere/1 lettera per gli amminoacidi e la convenzione per la scrittura delle sequenze peptidiche.

Importanza delle interazioni non covalenti nei sistemi biologici.

Angoli di torsione. Legame idrogeno in alfa elica e foglio beta, grafici di Ramachandran.

Struttura terziaria - interazioni idrofobiche, ponti salini, cistina, legami H - combinazioni di eliche e foglietti.

Struttura quaternaria - interazioni proteina-proteina.

Introduzione ai database di sequenze e strutture proteiche.

Profili energetici liberi di reazione, tipi di catalisi - acido/base generale, catalisi nucleofila.

Esempi: esterasi, serina e cisteina proteasi.

Introduzione a cofattori/coenzimi/gruppi protesici.

Zuccheri - monosaccaridi - struttura e proiezioni di Fischer/Haworth.

Chimica degli emiacetali, equilibri anello/catena. Forme piranosiche e furanosiche. anomeri.

Glicosidi, disaccaridi - maltosio, cellobiosio.

Polisaccaridi - lineari e ramificati, cellulosa, amido e glicogeno.

Carboidrati complessi e amminozuccheri, proteoglicani, glicosaminoglicani e peptidoglicani.

Acidi nucleici - basi eterocicliche, legame H, appaiamento di basi (classico e non classico).

Zuccheri - ribosio, desossiribosio, in un contesto biologico.

Esteri fosfatici e reazioni cinetiche e termodinamiche.

Nucleosidi, nucleotidi e doppia elica (conformazione DNA vs RNA).

Polimerasi - Replicazione del DNA, trascrizione e trascrizione inversa.

Reazioni chimiche dei processi di mutazione e riparazione del DNA.

Trascrizione e traduzione.

Introduzione alla tecnologia del DNA ricombinante e alla biologia molecolare.

Letture essenziali e elenco delle risorse

Fondamenti di biologia molecolare, C. M. Dobson, J. A. Garrard, A. J. Pratt, Oxford Chemistry Primers.

Principi di biochimica di Lehninger, 4a edizione o successiva, David L. Nelson e Michael M. Cox, W. H. Freeman.

Fondamenti di chimica generale, organica e biologica, 5a edizione, John McMurry, Mary E. Castellion, David S. Ballantine, Pearson Prentice Hall 2007.


Biologia Capitoli 8 - 10

Questo capitolo pone le basi per i capitoli sulla respirazione e la fotosintesi. I concetti chiave sono i seguenti: le leggi della termodinamica governano le trasformazioni energetiche degli organismi viventi, le reazioni metaboliche accoppiano le reazioni di raccolta dell'energia alle reazioni che realizzano il lavoro cellulare e gli enzimi aumentano la velocità di reazione. Comprendere le proprietà degli enzimi, come funzionano e come sono regolate le loro attività è necessario per comprendere le vie metaboliche.

Velocità di una reazione catalizzata da un enzima in funzione della variazione del reagente
concentrazione, con la concentrazione di enzima costante.

Attività di vari enzimi a varie temperature (a) ea vari pH (b).

Le seguenti domande si basano sulla reazione A + B ↔ C + D mostrata nella Figura 8.1.

La succinato deidrogenasi catalizza la conversione del succinato in fumarato. La reazione è inibita dall'acido malonico, che assomiglia al succinato ma non può essere influenzato dalla succinato deidrogenasi. L'aumento del rapporto tra succinato e acido malonico riduce l'effetto inibitorio dell'acido malonico.

Una serie di enzimi catalizza la reazione X → Y → Z → A. Il prodotto A si lega all'enzima che converte X in Y in una posizione lontana dal suo sito attivo. Questo legame riduce l'attività dell'enzima.

Le seguenti domande provengono dalla sezione di fine capitolo "Verifica la tua comprensione" del capitolo 8 del libro di testo.

Biologia di Campbell, 9e (Reece et al.)
Capitolo 9 Respirazione cellulare e fermentazione

Questo è uno dei capitoli più difficili da padroneggiare per gli studenti. Molti studenti sono sopraffatti e confusi dalla complessità dei percorsi, con la moltitudine di composti intermedi, enzimi e processi. La stragrande maggioranza delle domande in questo capitolo riguarda concetti centrali piuttosto che i dettagli di questi percorsi. Altre domande hanno figure di accompagnamento che forniscono dettagli di riferimento e chiedono agli studenti di interpretare o utilizzare questi modelli. Nel complesso, l'accento è posto sugli input e sugli output di ciascun percorso, le relazioni tra questi percorsi, le posizioni cellulari, l'ossidoriduzione come principio centrale nella respirazione e la chemiosmosi.

Figura 9.2 Il ciclo dell'acido citrico.

In the presence of oxygen, the three-carbon compound pyruvate can be catabolized in the citric acid cycle. First, however, the pyruvate (1) loses a carbon, which is given off as a molecule of CO2, (2) is oxidized to form a two-carbon compound called acetate, and (3) is bonded to coenzyme A.

Exposing inner mitochondrial membranes to ultrasonic vibrations will disrupt the membranes. However, the fragments will reseal "inside out." These little vesicles that result can still transfer electrons from NADH to oxygen and synthesize ATP. If the membranes are agitated further, however, the ability to synthesize ATP is lost.

The following questions are from the end-of-chapter "Test Your Understanding" section in Chapter 9 of the textbook.

Campbell's Biology, 9e (Reece et al.)
Chapter 10 Photosynthesis

Students find this chapter quite challenging. Fortunately, some of the key concepts, such as chemiosmosis and redox, were discussed previously in the chapter on respiration and fermentation. The new key concepts are light as energy, light absorption and energy conversion by pigments, and linear and cyclic electron flow. Students are challenged to identify the relationships between the light reactions and the Calvin cycle, as well as the adaptive significance of C4 and CAM pathways. Comparison and contrast between photosynthesis and respiration, the significance of photosynthesis to Earth history and evolution of life, and the role of photosynthesis in global carbon cycles and environmental change are important topics to engage students.


1. Mnemonics

One of the best and oldest trips on learning how to memorize amino acids are using mnemonics devices. Mnemonic devices help speed up the process of memorization because it helps you brain to better encode and recall important details.

Essential Amino Acids Mnemonics:

The ten essential amino acids can be remembered as: PTV HIM TALL:

Hydrophobic Amino Acids Mneumonics:

Pro GAV PIL

Amino Acids with OH-Containing Side Groups

S-Containing Amino Acids

( tu ) m ethionine

Basic Amino Acids

h istidine
UN rginine

Amino Acids with Aromatic Side Groups

Nonpolar, Nonaromatic Amino Acids: AVGLIMP

Polar Amino Acids: STQNC

Aromatic Amino Acids: WYF

Positive Amino Acids: RKH

Negative Amino Acids: ED

Hydrophobic Amino Acids: FLAVI (like the virus)

Hydrophilic Amino Acids: REKHN (pronounced reckon)

2. Draw Them

Drawing (or coloring) the amino acids is actually going to help actually ingrain the knowledge versus a mnemonic device that will really only help you do well on the next test. There are 20 amino acids, so choose to draw one amino acid a day and you will have them all memorized within 3 weeks.

Because amino acids have the same basic structure, you really just need to remember their function group. After you know their function group, you just need to categorize them as polar, nonpolar, acid, or base.

Each time you write out the full name of the amino acid and draw the amino acid’s function group, write down the 3-letter code and 1-letter code. Try to think of ways that will help you remember these codes.

Here are some ways to remember some of the less obvious amino acid codes:

  1. Phenylalanine (pronounced like an f) = F
  2. Glutamine (pronounced like Q) = Q
  3. Aspartic Acid (pronounced AsparDic Acid) = D
  4. Arginine (sounds like arr -ganine) = R

The key in drawing these out is to learn how to memorize the amino acids through repetition and will help you to remember these acids well beyond the MCAT.

3. Use Amino Acid Flashcards

Using flashcards when studying for the MCAT can be a game changer, especially when it comes to memorizing the amino acids. Magoosh has free MCAT flashcards that include subjects: Organic Chemistry, Biology, and Physics. They even provide helpful mnemonics for learning new structures.

You can also check out these 24 free Amino Acids Flashcards from Varsity Tutors!


Physicochemical properties of amino acids

The 20 amino acids encoded directly by the genetic code can be divided into several groups based on their properties. Important factors are charge, hydrophilicity or hydrophobicity, size, and functional groups. [38] These properties are important for protein structure and protein–protein interactions. The water-soluble proteins tend to have their hydrophobic residues (Leu, Ile, Val, Phe, and Trp) buried in the middle of the protein, whereas hydrophilic side chains are exposed to the aqueous solvent. (Note that in biochemistry, a residue refers to a specific monomer within the polymeric chain of a polysaccharide, protein or nucleic acid.) The integral membrane proteins tend to have outer rings of exposed hydrophobic amino acids that anchor them into the lipid bilayer. In the case part-way between these two extremes, some peripheral membrane proteins have a patch of hydrophobic amino acids on their surface that locks onto the membrane. In similar fashion, proteins that have to bind to positively charged molecules have surfaces rich with negatively charged amino acids like glutamate and aspartate, while proteins binding to negatively charged molecules have surfaces rich with positively charged chains like lysine and arginine. There are different hydrophobicity scales of amino acid residues. [132]

Some amino acids have special properties such as cysteine, that can form covalent disulfide bonds to other cysteine residues, proline that forms a cycle to the polypeptide backbone, and glycine that is more flexible than other amino acids.

Many proteins undergo a range of posttranslational modifications, when additional chemical groups are attached to the amino acids in proteins. Some modifications can produce hydrophobic lipoproteins, [133] or hydrophilic glycoproteins. [134] These type of modification allow the reversible targeting of a protein to a membrane. For example, the addition and removal of the fatty acid palmitic acid to cysteine residues in some signaling proteins causes the proteins to attach and then detach from cell membranes. [135]

Table of standard amino acid abbreviations and properties

Two additional amino acids are in some species coded for by codons that are usually interpreted as stop codons:





















21st and 22nd amino acids
3-letter
1-letter

MW (weight)

Selenocysteine
Sec
tu
168.064

Pyrrolysine
Pyl
oh
255.313

In addition to the specific amino acid codes, placeholders are used in cases where chemical or crystallographic analysis of a peptide or protein cannot conclusively determine the identity of a residue. They are also used to summarise conserved protein sequence motifs. The use of single letters to indicate sets of similar residues is similar to the use of abbreviation codes for degenerate bases. [140] [141]























































































Ambiguous amino acids
3-letter
1-letter
Amino Acids Included
Codons Included
Any / unknown
Xaa
X
Tutto
NNN

Asparagine or aspartic acid
Asx
B
D, N
RAY

Glutamine or glutamic acid
Glx
Z
E, Q
SAR

Leucine or Isoleucine
Xle
J
I, L
YTR, ATH, CTY (coding codons can also be expressed by: CTN, ATH, TTR MTY, YTR, ATA MTY, HTA, YTG)

Hydrophobic

?
V, I, L, F, W, Y, M
NTN, TAY, TGG

Aromatic

?
F, W, Y, H
YWY, TTY, TGG (coding codons can also be expressed by: TWY, CAY, TGG)

Aliphatic (non-aromatic)

Ψ
V, I, L, M
VTN, TTR (coding codons can also be expressed by: NTR, VTY)
Piccolo

?
P, G, A, S
BCN, RGY, GGR

Hydrophilic

ζ
S, T, H, N, Q, E, D, K, R
VAN, WCN, CGN, AGY (coding codons can also be expressed by: VAN, WCN, MGY, CGP)

Positively charged

+
K, R, H
ARR, CRY, CGR

Negatively charged


D, E
GAN

Unk is sometimes used instead of Xaa, but is less standard.

In addition, many non-standard amino acids have a specific code. For example, several peptide drugs, such as Bortezomib and MG132, are artificially synthesized and retain their protecting groups, which have specific codes. Bortezomib is Pyz-Phe-boroLeu, and MG132 is Z-Leu-Leu-Leu-al. To aid in the analysis of protein structure, photo-reactive amino acid analogs are available. These include photoleucine (pLeu) and photomethionine (pMet). [142]


9.3: Exercise 1 - The 1-letter code for amino acids - Biology

Translation Theory : DNA ⇒ RNA ⇒ Protein

Life depends on the ability of cells to store, retrieve, and translate genetic instructions.These instructions are needed to make and maintain living organisms. For a long time, it was not clear what molecules were able to copy and transmit genetic information. We now know that this information is carried by the dioxyribonucleic acid or DNA in all living things.
DNA: DNA is a discrete code physically present in almost every cell of an organism. We can think of DNA as a one dimensional string of characters with four characters to choose from. These characters are A, C, G, and T. They stand for the first letters with the four nucleotides used to construct DNA. The full names of these nucleotides are Adenine, Cytosine, Guanine, and Thymine. Each unique three character sequence of nucleotides, sometimes called a nucleotide triplet, corresponds to one amino acid. The sequence of amino acids is unique for each type of protein and all proteins are built from the same set of just 20 amino acids for all living things.

Instructions in the DNA are first transcribed into RNA and the RNA is then translated into proteins. We can think of DNA, when read as sequences of three letters, as a dictionary of life.
Aim: Convert a given sequence of DNA into its Protein equivalent.
Fonte: Download a DNA strand as a text file from a public web-based repository of DNA sequences from NCBI.The Nucleotide sample is ( NM_207618.2 ), which can be found here.To download the file :


Passaggi: Required steps to convert DNA sequence to a sequence of Amino acids are :

Coding Translation

The very first step is to put the original unaltered DNA sequence text file into the working path directory.Check your working path directory in the Python shell,

Next, we need to open the file in Python and read it. By default, the text file contains some unformatted hidden characters. These hidden characters such as “/n” or “/r” needs to be formatted and removed. So we use replace() function and get the altered DNA sequence txt file from the Original txt file.


Guarda il video: Sintesi proteica (Dicembre 2021).