Vypracované státnicové otázky z okruhu Bioinformatika
Popis:
1. Číselná, komplexní a vektorová reprezentace genomických a protetických dat
- genomické sekvence jsou uloženy v databázích v symbolické formě
- konverzí na genomický signál vzniká možnost využití nástroje zpracování signálů pro analýzu sekvencí
- signálová reprezentace nukleotidů vychází z chemické (ne)podobnosti nukleotidů
- báze jsou odlišeny podle:
- molekulární struktury (puriny R = A a G; pyrimodiny Y = C a T)
- síly vazby (slabé W = A a T, dva vodíkové můstky; silné S = C a G, tři vodíkové můstky)
- obsahu radikálů (obsahující amino skupinu NH3 M = A a C; nebo keto skupinu C-O K= T a G)
- tento klasifikační systém lze graficky vyjádřit
nukleotidovým tetrahedronem (nukleotidy jsou mapovány do 4 vektorů symetricky rozložených ve 3D prostoru, vektory jsou orientovány k vrcholům čtyřstěnu)
- každá z šesti hran odpovídá jedné ze tříd zahrnující pár nukleotidů, výsledná reprezentace je třírozměrná, osy souřadného systému jsou:
• x = W - S
• y = M - K
• z = R - Y
Klíčová slova:
genetická variabilita
bioinformatika
ordinační metody
blokové kódy
rozhodovací procesy
Obsah:
- 1. Číselné, komplexní a vektorové reprezentace genomických a proteomických dat
2. Genetická variabilita a mutace
3. Modelování evoluce sekvencí DNA, proteinů a genomů
4. Fylogenetické stromy a jejich konstrukce
5. Základy algoritmizace úloh - rekurzivní a iterační algoritmy, náročnost algoritmů, různé typy algoritmů a jejich využití v boinformatice
6. Vyhledávací algoritmy pro restrikční mapování a vyhledávání transkripčních motivů; třídící algoritmus metodou Breakpoints; suffixové stromy
7. Dynamické programování - obecný popis metody, globální zarovnávání, lokální zarovnávání, optimální cesta, aplikace
8. Grafové metody pro de novo genome assembly a využití skrytých Markovových modelů v analýze genomických dat - základní princip, aplikace
9. Asociační matice a shluková analýza - metriky podobností a vzdáleností, asociační matice, typy shlukové analýzy, hiearchické aglomerativní shlukování, K-means clustering
10. Ordinační metody - obecné principy, analýza hlavních komponent a faktorová analýza, biplot - typy, interpretace, korespondenční analýza, multidimensional scaling, diskriminační analýza
11. Stochastické modelování - principy stochastického modelování biologických dat, ANOVA, lineární regrese, stochastické modelování s binárním endpointem, ROC analýza
12. Lineární modely časových řad a predikce, dekompozice časových řad, modely AR, MA, ARMA, ARIMA, metoda nejstrmějšího sestupu, LMS algoritmus
13. Enzymatické reakce, základní popis, komponenty reakce, řád reakce, rovnice Michaelis-Mentenové
14. Transkripční sítě a jejich komponenty. Interpretace uzlů a hran, orientace hran, transkripční faktory, aktivátory a represory
15. Motivy síťových grafů. Příklady, náhodné sítě, hledání motivů sítí, Z-skóre
16. Principy molekulárního zobrazování. Kontrastní látky, zobrazování pomocí MRI, ultrasonografie a optických systémů
17. Huffmanova konstrukce nejkratšího binárního kódu
18. Blokové kódy, Hammingova vzdálenost, opravování chyb, perfektní kódy
19. Lineární kódy, generující a kontrolní matice, dekódování pomocí syndromů
20. Hammingovy kódy a Reed-Mullerovy kódy
21. Regulární Markovovy řetězce, hledání limitního vektoru, fundamentální matice regulárního Markovovy řetězce, střední doba prvého přechodu, aplikace.
22. Absorpční Markovovy řetězce, střední doba průchodů tranzientními stavy, pravděpodobnost přechodu do absorpčních stavů, pravděpodobnost setrvání v tranzientním stavu, aplikace
23. Analýza Markovových řetězců v diskrétním i spojitém stavu, použití Z-transformace a Laplaceovy transformace, asymptotické vlastnosti Markovských řetězců, aplikace
24. Rozhodovací procesy s alternativami, měnící se ocenění přechodů, rekurentní a iterační metoda řešení rozhodovacího procesu s alternativami, aplikace
O souborech cookie na této stránce
Soubory cookie používáme pro funkční účely, pro shromažďování a analýzu informací o výkonu a používání stránky.