Факультет биологии и биотехнологии ВШЭ / Факультет компьютерных наук ВШЭ / Осень 2023
Моя часть курса состоит из 6 занятий. Все материалы будут выкладываться на этом сайте по ходу прохождения материала.
Дата | Тема | Слайды | Код | Видео |
---|---|---|---|---|
18.09 | Экспериментальная процедура RNA-Seq и подсчёт экспрессий | Ссылка | Ссылка | |
25.09 | Распределения в омиксных данных и дифференциальная экспрессия | Ссылка | Ссылка | |
02.10 | Функциональный анализ RNA-Seq. Практикум | Ссылка | Ссылка | Ссылка |
09.10 | Экспериментальная процедура и анализ scRNA-Seq | Ссылка | Ссылка | |
16.10 | Практикум по анализу scRNA-Seq | Ссылка | Ссылка | Ссылка |
23.10 | Ribo-seq / Бисульфитное секвенирование РНК / CLIP-Seq | Ссылка | Ссылка |
Зачёт по курсу ставится как среднее арифметическое домашних заданий. По моему блоку будут три домашних задания, каждое из которых оценивается максимально в 10 баллов.
При сдаче домашнего задания до 1 декабря есть возможность получить фидбэк и повысить собственную оценку при условия исправления. Жёсткий дедлайн по домашним заданиям — 15 декабря.
Разбалловка для студентов магистратуры ФКН ВШЭ и бакалавров ФББ ВШЭ разная! В скобках первая оценка указана для бакалавров, а вторая — для магистров.
Суммарный балл за задание — это min(10, ваш_балл)
.
Любое обнаружение плагиата в работе — это 0 за домашнее задание (без права переделывания даже если задание было сдано до мягкого дедлайна) и тому, кто списал, и тому, кто дал списать. Форма отчёта — это заполненная форма со ссылкой на Google Drive с вашей домашкой. Одно задание — одна заполненная форма.
kallisto
(с геномом человека) и проведите подсчёт экспрессии на уровень транскриптов.
Откуда вы взяли референсный транскриптом? Не забудьте, что для следующих шагов вам потребуется таблица с соответствием генов транскриптам, также вам пригодится понимание того,
какие конкретно гены являются белок-кодирующими (дифференциальную экспрессию будем выполнять именно на них).tximport
загрузите в DESeq2
результат обсчёта экспрессий из пункта (2) и проведите дифференциальную экспрессию между образцами из групп A и B на уровне генов.tximport
для библиотеки PyDESeq2
. Покажите, что результаты сходятся с аналогичными в R.tximport
просто просуммировать каунты kallisto
на ген и округлить значения?Образец | Группа | Прямые прочтения | Обратные прочтения |
---|---|---|---|
B1 | B | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/003/SRR6410613/SRR6410613_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/003/SRR6410613/SRR6410613_2.fastq.gz |
B2 | B | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/004/SRR6410614/SRR6410614_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/004/SRR6410614/SRR6410614_2.fastq.gz |
B3 | B | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/001/SRR6410611/SRR6410611_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/001/SRR6410611/SRR6410611_2.fastq.gz |
B4 | B | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/002/SRR6410612/SRR6410612_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/002/SRR6410612/SRR6410612_2.fastq.gz |
B5 | B | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/005/SRR6410615/SRR6410615_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/005/SRR6410615/SRR6410615_2.fastq.gz |
A1 | A | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/005/SRR6410605/SRR6410605_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/005/SRR6410605/SRR6410605_2.fastq.gz |
A2 | A | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/006/SRR6410606/SRR6410606_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/006/SRR6410606/SRR6410606_2.fastq.gz |
A3 | A | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/003/SRR6410603/SRR6410603_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/003/SRR6410603/SRR6410603_2.fastq.gz |
A4 | A | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/004/SRR6410604/SRR6410604_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/004/SRR6410604/SRR6410604_2.fastq.gz |
A5 | A | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/009/SRR6410609/SRR6410609_1.fastq.gz | ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR641/009/SRR6410609/SRR6410609_2.fastq.gz |
scvi-tools
) / LDA или иные «нетривиальные» способы снижения размерности. Сравните кластеризацию, которая у вас получилась, с той, что была получена при помощи графа, построенного на PCA. Какая разница? Как можно её количественно оценить?sc.tl.score_genes()
.Загрузите файл (Google Drive ID: 1iqYLFVKySREVm5Kn5NagMeHaDi-dVLcj
, файл 01. RiboSeq_RNASeq_HCC_counts.tsv
), в котором содержится матрица каунтов результатов Ribo-Seq и RNA-Seq экспериментов больных гепатоцеллюлярной карциномой. Матрица каунтов была получена стандартным воркфлоу STAR. На каждого пациента приходится 4 столбца в таблице (RNA-Seq нормы и опухоли, Ribo-Seq нормы и опухоли), записанные в виде sample_number-tissue_type-experiment
.
~ method + condition + method:condition
). Что вы скажете о наборе генов, который вы получили этим методом? Выводы подкрепите графиками.