Sequenzanalyse, Sommersemester 2022


392105/06,06,06 Stoye, Dias Vieira Braga Sommer 2021 Di 10-12 und Do 10-12, U10-146

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.

In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Literatur

  • Das Skript zur Vorlesung: Sequenzanalyse-Skript
  • Gusfield, D.: Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, New York, 1997.
  • Setubal, J. and Meidanis, J.: Introduction to Computational Biology. PWS Publishing, Boston, M.A., 1997.

Organisatorisches

  • Die Modulbeschreibung enthält einige Rahmenbedingungen der Veranstaltung.
  • Zur Teilnahme an der Vorlesung und Klausur sind diejenigen berechtigt, welche die A&D-Klausur bestanden haben oder im WS2021/22 zur A&D-Klausur zugelassen waren.
  • Erfolgreiches Lösen der Übungsaufgaben (Bestehensgrenze 50% der Punkte) und aktive Teilnahme in den Tutorien (mindestens zweimal Vorrechnen) ist Voraussetzung für die Teilnahme an der Abschlussklausur oder der abschließenden mündlichen Prüfung.
  • Die Übungszettel werden wöchentlich Donnerstag mittags auf dieser Seite online geschaltet. Gleichzeit endet dann auch die Abgabefrist der Übungszettel der vorangegangenen Woche. Die Lösungen müssen per E-mail an die jeweilige Tutorin geschickt werden.

Übungen

Abgabeschluss der wöchentlichen Übungsaufgaben ist jeweils Donnerstag 12:00 Uhr. Gleichzeitig wird ein neuer Übungszettel auf dieser Seite veröffentlicht werden. Abgaben müssen direkt per E-mail an die jeweilige Tutorin geschickt werden.

Termin Tutorin eKVV
Mo 10-12, U10-146 Marília Dias Vieira Braga Übungen A
Di 16-18, U10-146 Rebecca Pfeil Übungen B
Di 16-18, E01-108 (bis auf weiteres ebenfalls in U10-146) Lisa Hils Übungen C

Prüfungstermine

  1. Klausur: 14.07.2022 (Präsenzklausur)
  2. Nachklausur: 01.09.2022 (Präsenzklausur)

Übungszettel

Woche Datum Thema Abschnitt im Skript Übungszettel Präsenzübungszettel
14 05./07.04.2022 Di: Einleitung, Logistik
Do: Grundlagen
1
2

Blatt 01

Präsenzblatt 01
15 12./14.04.2022 Di: Metriken auf Sequenzen
Do: Berechnung der Edit-Distanz
3.1-3.5
3.6

Blatt 02

Präsenzblatt 02
16 19./21.04.2022 Di: q-Gramm-Distanz
Do: Maximal-Matches-Distanz
3.7
3.8-3.9

Blatt 03

Präsenzblatt 03
17 26.04.2022 Di: Paarweises Sequenzalignment
Do: –
4.1-4.4

Blatt 04

Präsenzblatt 04
18 03./05.05.2022 Di: Alignment-Varianten, Gapkosten
Do: Suboptimale Lokale Alignments
4.5-4.6
5.1

Blatt 05

Präsenzblatt 05
19 10./12.05.2022 Di: Approximative Textsuche, Hirschberg-Algorithmus
Do: Paarweises Alignment in der Praxis
5.2-5.4
6

Blatt 06

Präsenzblatt 06
20 17./19.05.2022 Di: Suffixbäume: Definition, WOTD-Algorithmus
Do: Anordnungen von Suffixbäumen I
7.1-7.6
7.7.1-7.7.2
21 24.05.2022 Di: Anwendungen von Suffixbäumen II
Do: –
7.7.3-7.7.4
22 31.05.2022 Di: Suffix-Arrays
Do: –
8
23 07./09.06.2022 Di: Burrows-Wheeler-Transformation
Do: Multiples Sequenzanlignment: Definitionen
9
10
24 14.06.2022 Di: Algorithmen für Multiples Alignment I
Do: –
11.1-11.3
25 21.06.2022 Di: Algorithmen für Multiples Alignment II
Do: –
11.4-11.5
26 28.06.2022 Di: Baumalignment, Genomalignment
Do: –
12-13
27 Di: –
Do: –

28 12./14.07.2022 Di: Wiederholung
Do: Klausur