MicroRNA analysis pipeline development for the next generation sequencing data
Author | Affiliation |
---|---|
Date |
---|
2016-05-04 |
Bibliogr.: p. 51
MikroRNR yra trumpos baltymo nekoduojančios RNR molekulės, dalyvaujančios su onkogeneze susijusių signalinių kelių reguliacijoje. Pasaulyje atlikti tyrimai parodė, kad mikroRNR raiškos profilis būna pakitęs įvairių vėžinių susirgimų atveju ir jos gali būti vertingais įrankiais šių susirgimų diagnostikai ir patogenezei. Vienas patikimiausiu mikroRNR raiškos profilio tyrimo metodų yra naujos kartos sekoskaita. Tačiau bioinformatinė sekoskaitos duomenų analizė, reikalaujanti didelių kompiuterinių resursų ir patikimų bei lanksčių analitinių įrankių, vis dar išlieka iššūkiu. Šiame darbe pristatoma automatizuota algoritmų seka mikroRNR sekoskaitos duomenų analizei, kurioje yra integruotos pirminių nuskaitymą apdorojimo, seku palyginimo, subrendusių ir naujų mikroRNR bei jų prekursorių aptikimo ir kiekybinio įvertitnimo funkcijos. Naudodami gerai charakterizuotus duomenis, pademonstravome sklandų dukurtos automatizuotos algoritmų sekos veikimą, lankstumą ir praktinį pritaikymą biožymenų paieškos tyrimams.
MicroRNAs (MiRNAs) are a class of small non-coding RNAs involved in major carcinogenesis pathways. MiRNAs have been shown to exhibit potential diagnostic and prognostic properties in all major types of cancer. Next generation sequencing has become the main platform for MiRNA profing. However, bioinformatic analysis of the sequencing data is challenging, as it requires significant amount of computational resources and currently available web based analytical tools lack flexibility and reliability. We developed an in-house sequencing pipeline for miRNA sequencing data analysis that integrates read pre-processing, alignment, mature/precursor/novel miRNA detection and quantification. Using well characterized data, we demonstrated the pipeline's superior performances, flexibility, and practical use in research and biomarker discovery.