قادر میرزاقادری

 دانشیار بهنژادی و بیوتکنولوژی گیاهی

دانشکده کشاورزی، دانشگاه کردستان

 

 

بیوانفورماتیک پیشرفته 

 

کد درس: 
نام درس: بیوانفورماتیک پیشرفته
رشته: بیوتکنولوژی کشاورزی
گروه: زراعت و اصلاح نباتات
مقطع، تعداد واحد: دکترای تخصصی
استاد درس: دکتر قادر میرزاقادری (تلفن 09183718615، ایمیل: gh.mirzaghaderi@uok.ac.ir)
پیش نیاز درس: آشنایی با ژنتیک و آمار تک و چند متغیره و بیوشیمی
مقدمه: بیوانفورماتیک علمی بین رشته ای است که به تحلیل داده های مولکولی زیستی می پردازد. در چند دهه اخیر، پیشرفت در زمینه توالی یابی ماکرومولکول ها در موجودات مختلف حجم بسیار زیادی از داده های توالی و ساختار DNA، RNA، پروتئین و اطلاعات اپی ژنتیکی و غیره را به دست داده و در پایگاه های داده ذخیره شده است. بیوانفورماتیک دانشی نوظهور و بین رشته‌ای مرکب از علوم ژنتیک، کامپیوتر، آمار، ریاضی، بیوشیمی و بیوفیزیک است که به پردازش و تفسیر توالی، رفتار و عملکرد ماکرومولکول های زیستی از جمله مواردی چون ایجاد و جستجوی بانک های داده های زیستی، ژنومیک مقایسه ای، تحلیل چند شکلی‌های ژنتیکی، تحلیل بیان ژن ها و ساختار و عملکرد و تکامل پروتئین ها و روابط تکاملی آنها و بازسازی مسیرهای متابولیکی و غیره می پردازد.
اهداف درس: توانایی کار با سیستم عامل لینوکس (Linux) برنامه R برای اهداف ببوانفورماتیکی، آشنایی با توالی ملکولهای اسیدنوکلئیک یا پروتئین مورد نیاز و توانایی استخراج آنها از پایگاه های داده مختلف. توانایی مشخص کردن محل یک ژن یا توالی خاص در ژنوم با استفاده از ­پایگاه­های مرتبط و توانایی تعیین ویژگی های توالی ها.  مشخص کردن دومین­های پروتئینی در پروتئین­های همولوگ، توانایی استخراج فایل pdb حاوی اطلاعات ساختار سه بعدی یک پروتئین و نشان دادن ساختارهای مربوطه، شناسایی پروموتورها، اینترون ها، اگزون ها و غیره. توانایی استفاده از Primer3 برای طراحی پرایمر مناسب برای مقاصد مختلف مانند بررسی بیان ژن. آشنایی با تحلیل داده­های میکرواری و توانایی استخراج داده های میکرواری برای یک مطالعه بیولوژیکی مشخص، از پایگاه­های داده مربوطه  و توانایی تحلیل و استنتاج آن. توانایی بررسی مسیرهای انتقال پیام در سلول، مفهوم Gene Ontology و دسته­بندی­های آن، استفاده از داده­پایگاه­های مرتبط، روش­های غنی­سازی دسته­های ژنی (Gene set Enrichment)، شناسایی و ترسیم شبکه میانکنش پروتئین-پروتئین مرتبط با یک دسته ژنی، آشنایی با اصول اولیه، انواع پلتفرم ها و نحوه انجام Next Generation Sequencing (NGS)، توانایی تحلیل داده های NGS و توانایی بررسی میزان بیان ژنهای مختلف و ایزوفرم های آنها، توانایی مشاهده الگوی بیان ژنهای مربوط به داده های NGS در ابزار IGV. توانایی بررسی ارتباط بین چند شکلی نوکلئوتید (SNP) و بیان ژن. آشنایی با Perl، Python و Biopython و انجام آنالیزهای مقدماتی بر روی توالی با استفاده از Biopython.

منابع:

1.  لینک های معرفی شده در صفحه درس بیوانفورماتیک پیشرفته از جمله جزوات مربوط به R

1. David Edwards (ed.), Plant Bioinformatics: Methods and Protocols, Methods in Molecular Biology, vol. 1374, Springer Science+Business Media New York 2016

ارزیابی بخش عملی: (10 نمره): حضور منظم (1 نمره)، پروژه (5 نمره)، امتحان پايان‌ترم (4 نمره)
مقررات: 1. دانشجو باید حضور منظم در کلاس داشته باشد. 2. غیبت بیش از دو جلسه باعث حذف درس می گردد. 3. پروژه ها و تكالیف فقط در تاریخ تعیین شده تحویل گرفته می‌شود و بعد از آن نمره ای تعلق نمی گیرد. 4. عدم ارائه هر پروژه به منزله نمره صفر برای آن پروژه می‌باشد.
 

برنامه کلاس عملی در طول ترم (برخی عناوین دو یا چند جلسه زمان خواهند برد.)

1 نصب لینوکس (Linux) و مرور دستورات پایه
2 کار با لینوکس
3 همتایابی و همردیفی چندگانه (Local and multiple alignment)، فایل نیوویک، درخت فیلوژنی، بوت استرپینگ
4 نصب R و دستورات پایه، بردارها، جداول و لیست ها، رسم گراف های پایه در R
5 کار با بسته های مرتبط با بیوانفورماتیک مثل pheatmap، ggtree، ggplot2 و …
6 جستجوی ژن، توالی اسید نوکلئیک و پروتئین در GeneBank و EnsemblPlant
7 کار با دیتابیس ژنومی EnsemblePlan، آشنایی با سایت FTP و فایل های موجود مثل gtf و توالی های ژنومی مختلف
8 استخراج توالی ژنهای خاص، فایل gtf و پروتئین آنها  (UniGene, Gene, EST, EnsemblPlants) به صورت آفلاین
9 بررسی توالی و ساختار پروتئین و شناسایی موتیف های کانسرو  (NCBI, UniProt, InterPro, MeMe, Pfam, PDB)
10 بررسی توالی سیگنال (Signal Peptide)
11 رسم ساختار ژنها و دومین های پروتئینی با استفاده TBtools و افزودن درخت فیلوژنی به آنها
12 طراحی پرایمر با Primer 3
13 آشنایی با داده های NGS و کار با آنها در لینوکس
14 تحلیل داده های RNASeq: استخراج، کنترل کیفیت و تریم کردن، نمونه گیری …
15 تحلیل داده های RNASeq و بررسی بیان ژنها (الاینمنت و اسمبلینگ)، مشاهده الگوی بیان ژنها در ابزار IGV
16 تحلیل داده های RNASeq و بررسی بیان ایزوفرم ها و رسم نمودارهای مربوطه در R
17 آشنایی  و کار با فایل های VCF، واریانت کالینگ و شناسایی SNPها از خوانش های ایلومینا
18 استخراج داده­های میکرواری مرتبط با یک آزمایش و تحلیل داده ها با R
19 تحلیل داده های میکرواری با R و آنتولوژی ژنها
20 نصب Perl، Python و Biopython و انجام آنالیزهای مقدماتی بر روی توالی با استفاده از Biopython
21 مطالعه ارتباطی سراسرژنومی (GWAS ,Genome wide association study )
 

فایل ها

1 آشنایی با زبان محاسباتی R (فرمت: PDF، حجم: 1.28MB)
2 مباحث ویژه در R (فرمت: PDF، حجم: 620KB)
3 برنامه نویسی در R (فرمت: PDF، حجم: 7MB)
4 کتاب R (بخش دستورزی داده ها)   ( فرمت: PDF، حجم: 18.5MB)
5 کتاب مقدمه ای بر آمار و احتمال (فارسی،  فرمت PDF، حجم: 4MB)
6 راهنمای نصب ترمینال لینوکس در ویندوز (فرمت: ورد، حجم: 90KB)
7 صفحه آموزش دستورات پایه cmd
8 سایت آموزش دستورات ترمینال لینوکس
9 تصحیح p-value
10 نحوه محاسبه مقدار احتمال تصحیح شده (adjusted p-value) با استفاده از صفحه اکسل یا R
11 همردیفی توالی ها (sequence alignment)
12 فیلم همردیفی توالی ها – اصول و نحوه انجام
13 فیلم بررسی توالیها
14 مثال از همردیفی موضعی  (local)
15 چگونه همردیفی را در Rانجام دهیم؟
16 در رابطه با E-value
17 کتابچه آموزش لبنوکس
18 كتاب آموزش R (آنلاين)

 

 

آموزش R (قسمت اول)

آموزش R (قسمت دوم)

آموزش R (قسمت سوم)