بیوانفورماتیک پیشرفته
|
|
---|---|
کد درس: | |
نام درس: بیوانفورماتیک پیشرفته | |
رشته: بیوتکنولوژی کشاورزی | |
گروه: زراعت و اصلاح نباتات | |
مقطع، تعداد واحد: دکترای تخصصی | |
استاد درس: دکتر قادر میرزاقادری (تلفن 09183718615، ایمیل: gh.mirzaghaderi@uok.ac.ir) | |
پیش نیاز درس: آشنایی با ژنتیک و آمار تک و چند متغیره و بیوشیمی | |
مقدمه: بیوانفورماتیک علمی بین رشته ای است که به تحلیل داده های مولکولی زیستی می پردازد. در چند دهه اخیر، پیشرفت در زمینه توالی یابی ماکرومولکول ها در موجودات مختلف حجم بسیار زیادی از داده های توالی و ساختار DNA، RNA، پروتئین و اطلاعات اپی ژنتیکی و غیره را به دست داده و در پایگاه های داده ذخیره شده است. بیوانفورماتیک دانشی نوظهور و بین رشتهای مرکب از علوم ژنتیک، کامپیوتر، آمار، ریاضی، بیوشیمی و بیوفیزیک است که به پردازش و تفسیر توالی، رفتار و عملکرد ماکرومولکول های زیستی از جمله مواردی چون ایجاد و جستجوی بانک های داده های زیستی، ژنومیک مقایسه ای، تحلیل چند شکلیهای ژنتیکی، تحلیل بیان ژن ها و ساختار و عملکرد و تکامل پروتئین ها و روابط تکاملی آنها و بازسازی مسیرهای متابولیکی و غیره می پردازد. | |
اهداف درس: توانایی کار با سیستم عامل لینوکس (Linux) برنامه R برای اهداف ببوانفورماتیکی، آشنایی با توالی ملکولهای اسیدنوکلئیک یا پروتئین مورد نیاز و توانایی استخراج آنها از پایگاه های داده مختلف. توانایی مشخص کردن محل یک ژن یا توالی خاص در ژنوم با استفاده از پایگاههای مرتبط و توانایی تعیین ویژگی های توالی ها. مشخص کردن دومینهای پروتئینی در پروتئینهای همولوگ، توانایی استخراج فایل pdb حاوی اطلاعات ساختار سه بعدی یک پروتئین و نشان دادن ساختارهای مربوطه، شناسایی پروموتورها، اینترون ها، اگزون ها و غیره. توانایی استفاده از Primer3 برای طراحی پرایمر مناسب برای مقاصد مختلف مانند بررسی بیان ژن. آشنایی با تحلیل دادههای میکرواری و توانایی استخراج داده های میکرواری برای یک مطالعه بیولوژیکی مشخص، از پایگاههای داده مربوطه و توانایی تحلیل و استنتاج آن. توانایی بررسی مسیرهای انتقال پیام در سلول، مفهوم Gene Ontology و دستهبندیهای آن، استفاده از دادهپایگاههای مرتبط، روشهای غنیسازی دستههای ژنی (Gene set Enrichment)، شناسایی و ترسیم شبکه میانکنش پروتئین-پروتئین مرتبط با یک دسته ژنی، آشنایی با اصول اولیه، انواع پلتفرم ها و نحوه انجام Next Generation Sequencing (NGS)، توانایی تحلیل داده های NGS و توانایی بررسی میزان بیان ژنهای مختلف و ایزوفرم های آنها، توانایی مشاهده الگوی بیان ژنهای مربوط به داده های NGS در ابزار IGV. توانایی بررسی ارتباط بین چند شکلی نوکلئوتید (SNP) و بیان ژن. آشنایی با Perl، Python و Biopython و انجام آنالیزهای مقدماتی بر روی توالی با استفاده از Biopython. | |
منابع: 1. لینک های معرفی شده در صفحه درس بیوانفورماتیک پیشرفته از جمله جزوات مربوط به R 1. David Edwards (ed.), Plant Bioinformatics: Methods and Protocols, Methods in Molecular Biology, vol. 1374, Springer Science+Business Media New York 2016 |
|
ارزیابی بخش عملی: (10 نمره): حضور منظم (1 نمره)، پروژه (5 نمره)، امتحان پايانترم (4 نمره) |
|
مقررات: 1. دانشجو باید حضور منظم در کلاس داشته باشد. 2. غیبت بیش از دو جلسه باعث حذف درس می گردد. 3. پروژه ها و تكالیف فقط در تاریخ تعیین شده تحویل گرفته میشود و بعد از آن نمره ای تعلق نمی گیرد. 4. عدم ارائه هر پروژه به منزله نمره صفر برای آن پروژه میباشد. |
|
برنامه کلاس عملی در طول ترم (برخی عناوین دو یا چند جلسه زمان خواهند برد.) |
|
1 | نصب لینوکس (Linux) و مرور دستورات پایه |
2 | کار با لینوکس |
3 | همتایابی و همردیفی چندگانه (Local and multiple alignment)، فایل نیوویک، درخت فیلوژنی، بوت استرپینگ |
4 | نصب R و دستورات پایه، بردارها، جداول و لیست ها، رسم گراف های پایه در R |
5 | کار با بسته های مرتبط با بیوانفورماتیک مثل pheatmap، ggtree، ggplot2 و … |
6 | جستجوی ژن، توالی اسید نوکلئیک و پروتئین در GeneBank و EnsemblPlant |
7 | کار با دیتابیس ژنومی EnsemblePlan، آشنایی با سایت FTP و فایل های موجود مثل gtf و توالی های ژنومی مختلف |
8 | استخراج توالی ژنهای خاص، فایل gtf و پروتئین آنها (UniGene, Gene, EST, EnsemblPlants) به صورت آفلاین |
9 | بررسی توالی و ساختار پروتئین و شناسایی موتیف های کانسرو (NCBI, UniProt, InterPro, MeMe, Pfam, PDB) |
10 | بررسی توالی سیگنال (Signal Peptide) |
11 | رسم ساختار ژنها و دومین های پروتئینی با استفاده TBtools و افزودن درخت فیلوژنی به آنها |
12 | طراحی پرایمر با Primer 3 |
13 | آشنایی با داده های NGS و کار با آنها در لینوکس |
14 | تحلیل داده های RNASeq: استخراج، کنترل کیفیت و تریم کردن، نمونه گیری … |
15 | تحلیل داده های RNASeq و بررسی بیان ژنها (الاینمنت و اسمبلینگ)، مشاهده الگوی بیان ژنها در ابزار IGV |
16 | تحلیل داده های RNASeq و بررسی بیان ایزوفرم ها و رسم نمودارهای مربوطه در R |
17 | آشنایی و کار با فایل های VCF، واریانت کالینگ و شناسایی SNPها از خوانش های ایلومینا |
18 | استخراج دادههای میکرواری مرتبط با یک آزمایش و تحلیل داده ها با R |
19 | تحلیل داده های میکرواری با R و آنتولوژی ژنها |
20 | نصب Perl، Python و Biopython و انجام آنالیزهای مقدماتی بر روی توالی با استفاده از Biopython |
21 | مطالعه ارتباطی سراسرژنومی (GWAS ,Genome wide association study ) |
فایل ها |
|
1 | آشنایی با زبان محاسباتی R (فرمت: PDF، حجم: 1.28MB) |
2 | مباحث ویژه در R (فرمت: PDF، حجم: 620KB) |
3 | برنامه نویسی در R (فرمت: PDF، حجم: 7MB) |
4 | کتاب R (بخش دستورزی داده ها) ( فرمت: PDF، حجم: 18.5MB) |
5 | کتاب مقدمه ای بر آمار و احتمال (فارسی، فرمت PDF، حجم: 4MB) |
6 | راهنمای نصب ترمینال لینوکس در ویندوز (فرمت: ورد، حجم: 90KB) |
7 | صفحه آموزش دستورات پایه cmd |
8 | سایت آموزش دستورات ترمینال لینوکس |
9 | تصحیح p-value |
10 | نحوه محاسبه مقدار احتمال تصحیح شده (adjusted p-value) با استفاده از صفحه اکسل یا R |
11 | همردیفی توالی ها (sequence alignment) |
12 | فیلم همردیفی توالی ها – اصول و نحوه انجام |
13 | فیلم بررسی توالیها |
14 | مثال از همردیفی موضعی (local) |
15 | چگونه همردیفی را در Rانجام دهیم؟ |
16 | در رابطه با E-value |
17 | کتابچه آموزش لبنوکس |
18 | كتاب آموزش R (آنلاين) |
آموزش R (قسمت اول)
آموزش R (قسمت دوم)
آموزش R (قسمت سوم)