Весна 2013 года
Курс Биоинформатика для студентов 4 курса кафедры биофизики физического факультета МГУ
Пн 13:30 ауд. 5-68

book
.djvu скачать
Book Durbin
.pdf скачать




Лекции
Дополнительные материалы
Лекция 1 

    Введение. Основные задачи молекулярной эволюции. Основные базы данных молекулярной биологии – NCBI, EMBL, ExPASy, PDB и другие. Базы данных геномов отдельных видов – SGD, FlyBase, Wormbase, MGI, MIPS, UCSC.       
   

 
Лекция 2

   Молекулярная эволюция и популяционная генетика. Дарвин и Кропоткин. Типы мутаций. Изменчивость последовательностей внутри и между видами.
  Теория коалесценции. Распространение новых мутаций. Фиксация нейтральных мутаций. Случайный дрейф и селекционное давление. Теория нейтральной эволюции и адаптации. 
Шредингер "Что такое жизнь с точки зрения физика"
Определения жизни Карла Сагана
Кропоткин "Взаимопомощь как фактор эволюции"
Дарвин "Происхождение видов"

Дарвин "Путешествие на "Бигле""

Аминокислотные последовательности гена BRCA1 в формате Fasta, скачанные в классе с сайта  NCBI - BRCA1.fasta
Выравненные последовательности из файла BRCA1.fasta - BRCA1.aln
Открыть файл BRCA1.aln можно программой JalView

Оригинальная публикация в Nature (2000) об исследовании митохондриальной ДНК "Mitohondrial Genome Variataion and the Origin of Modern Human"
Оригинальная публикация в  (2001) об исследовании хромосомы Y "The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations "
О гене AMY1, способствующем переваривариванию крахмала: "Слюни сделали обезьяну человеком"
Оригинальная публикация в Nature Genetics (2007) о вариации числа копий гена AMY1 и их связь с диетой и эволюцией человека: "Diet and the evolution of human amylase gene copy number variation"

Лекция 3

    Модели эволюции нуклеотидных последовательностей. Модель Джукса-Кантора. Двупараметрическая модель Кимуры. Модель Хасегава-Кишино-Яно.
    Модели эволюции аминокислотных последовательностей. Частоты аминокислотных замен. LOG-ODDs матрицы счета. Матрицы PAM, связь с физико-химическими свойствами аминокислот. Матрицы BLOSUM.


Оригинальная публикация группы Маргарет Дэйхофф о матрице PAM1 (1978) : "A Model of Evolutionary Change in Proteins"
Оригинальная публикация о матрице BLOSUM (1992): "Amino acid substitution matrices from protein blocks."
Физико-химические свойства аминокислот
Буквенное обозначение аминокислот
Лекция 4
   Гомологи, ортологи, паралоги. Поиск гомологичных последовательностей.
    Алгоритм и программа BLAST.
    Элементы теории локального выравнивания. Оценка статистической значимости локальных выравниваний. Элементы теории информации. Энтропия Шэннона. Энтропия матриц счета. Статистика Карлина-Альтшуля.
Шон Эдди о матрице счета Blossum62
Элементы теории информации и статистика локального выравнивания - Глава 4 книги Ian Korf, Mark Yandell, Joseph Bedell "BLAST" (An Essential Guide ot the Basic Local Alignment Search Tool)
Лекция 5
    Выравнивание двух последовательностей. Метод динамического программирования. Глобальное выравнивание. Алгоритм Нидлмана-Вунша. Локальное выравнивание. Алгоритм Смита-Уотермана. Перекрывающиеся выравнивания.
  Динамическое программирование с более сложными формами. Выравнивание с использованием афинной штрафной функции. Конечный автомат.
Шон Эдди о динамическом программировании
Лекция 6
   Вероятности и вероятностные модели. Условные, совместные и полные вероятности. Вероятность и правдоподобие. Теорема Байеса. Цепи Маркова. Предсказание погоды и рыночного потребления.
   Скрытые Марковские модели. Нечестное казино. Определение CpG островков. Наиболее вероятный путь и алгоритм Витерби. Полная вероятность и алгоритм просмотра вперед. Апостериорная вероятность и алгоритм промотра вперед-назад.
 
Лекция 7
   Приложения скрытых Марковских моделей в биоинформатике. Проблема распознавания генов. Цепи Маркова высокого порядка. Программы Genscan, GeneMark. Интерполяционные скрытые Марковские модели. Программа Glimmer.  Профильные HMM и определение принадлежности последовательности к профилю.

Промежуточная аттестация (1 час) - Контрольная с ответами

Лекция 8
(1 час)
   Филогенетические деревья. Деревья как средство визуализации эволюции. Горизонтальный обмен генов и генеалогия организмов. Основные свойства филогенетических деревьев. Корневые и некорневые деревья. Число возможных деревьев для n видов. Дерево гена, дерево видов.
   Методы построения филогенетических деревьев. Метод расстояний. Матрицы расстояний. Деревоподобные расстояния и времяподобные расстояния. Алгоритм UPGMA.



Лекция 9
   Филогенетические деревья. Метод расстояний - метод объединения соседей (NJ). Метод максимальной бережливости . Эвристический метод поиска оптимального дерева.
   Вероятностные подходы к филогении.  Метод максимального правдоподобия. Статистическая оценка полученного филогенетического дерева: бутстрэп. Методология построения филогенетических деревьев.


 
Лекция 10
   Современное состояние геномики и биоинформатики бактерий - краткий обзор направлений исследований.
    BacMap genome atlas. Размер геномов. %GC-содержания. Эволюционный отбор, синонимичные и несинонимичные замены (dN/dS). Гены, находящиеся под действием положительного отбора. Молекулярные часы. Неоднородность скоростей замен. Сигнатура генома. Chaos Game Representation.
   Репликация ДНК в бактериях.  GC skews - Асимметрия по стрендам. Правила Чаргаффа. ДНК-блуждание.
   Сравнительная геномика на уровне всего генома, генов и РНК-структур. Гипотеза РНК-мира. Пунктуация ДНК - роль коротких палиндромов как терминаторов, аттенюаторов и в промотерных участках.



Лекция 11
   Биоинформатика генома человека. Проект геном человека. Секвенирования методом Сангера. Браузер генома человека UCSC, скачивание полного генома, визуализация профилей для участка генома.
   Сравнительный анализ генома человека и неандертальца. Сравнительный анализ генома человека и шимпанзе. Повторы в геноме человека. Транспозоны, активные и неактивные. Технология Microarray. Анализ экспресси генов.
   Вариация генома человека. Single Nucleotide Polymorphisms. Проект HapMap. Проект 1000 геномов человека. Технологии секвенирования второго поколения. Рак как болезнь генома.
Дополнительно (в конце Лекции 11 в разделе Extra) -
   Лекция Трифонова о существовании множества генетических кодов.
   РНК-интерференция
   Эпигенетика
   Protein-DNA Interactions
   How DNA is package
  
Лекция 12 - Практическое занятие.
   Нахождение гомологов, выравнивание последовательностей,
построение и статистическая оценка филогенетического дерева