Kandydat będzie odpowiedzialny za realizację wybranych zagadnień z poniższego opisu.

Podobne dokumenty
Co to jest transkryptom? A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Dr. habil. Anna Salek International Bio-Consulting 1 Germany

BIOLOGICZNE BAZY DANYCH (2) GENOMY I ICH ADNOTACJE. Podstawy Bioinformatyki wykład 4

BIOLOGICZNE BAZY DANYCH (1) GENOMY I ICH ADNOTACJE

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

BIOINFORMATYKA. edycja 2016 / wykład 11 RNA. dr Jacek Śmietański

Faculty of Biology Institute of Anthropology

Nowoczesne systemy ekspresji genów

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

WYKŁAD: Klasyczny przepływ informacji ( Dogmat) Klasyczny przepływ informacji. Ekspresja genów realizacja informacji zawartej w genach

Spis treści. Przedmowa... XI. Wprowadzenie i biologiczne bazy danych. 1 Wprowadzenie Wprowadzenie do biologicznych baz danych...

października 2013: Elementarz biologii molekularnej. Wykład nr 2 BIOINFORMATYKA rok II

Całogenomowa analiza niskocząsteczkowych RNA, pochodzących z trna w Arabidopsis thaliana

Wybrane techniki badania białek -proteomika funkcjonalna

Jest to dziedzina biologiczna wywodząca się z biotechnologii. Bioinformatyka

BUDOWA I FUNKCJA GENOMU LUDZKIEGO

Zgodnie z tzw. modelem interpunkcji trna, cząsteczki mt-trna wyznaczają miejsca

Wybrane techniki badania białek -proteomika funkcjonalna

Analizy wielkoskalowe w badaniach chromatyny

PODSTAWY BIOINFORMATYKI 12 MIKROMACIERZE

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

Możliwości współczesnej inżynierii genetycznej w obszarze biotechnologii

Proteomika: umożliwia badanie zestawu wszystkich lub prawie wszystkich białek komórkowych

Wykład 1. Od atomów do komórek

TATA box. Enhancery. CGCG ekson intron ekson intron ekson CZĘŚĆ KODUJĄCA GENU TERMINATOR. Elementy regulatorowe

BIOLOGICZNE BAZY DANYCH GENOMY I ICH ADNOTACJE. Pracownia Informatyczna 2

Sekwencjonowanie Nowej Generacji ang. Next Generation Sequencing. Wykład 6 Część 1 NGS - wstęp Dr Wioleta Drobik-Czwarno

"Zapisane w genach, czyli Python a tajemnice naszego genomu."

Instytut Biologii Molekularnej i Biotechnologii

Jak działają geny. Podstawy biologii molekularnej genu

Jajko czy kura? czyli gdzie dwóch się bije, tam trzeci korzysta

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Kamila Muraszkowska Znaczenie wąskich gardeł w sieciach białkowych. źródło: (3)

Regulacja transkrypcji genów eukariotycznych

Public gene expression data repositoris

TRANSKRYPCJA - I etap ekspresji genów

Ekspresja genów. A. Świercz ANALIZA DANYCH WYSOKOPRZEPUSTOWYCH 2

Epigenome - 'above the genome'

Biotechnologia i inżynieria genetyczna

The Role of Maf1 Protein in trna Processing and Stabilization / Rola białka Maf1 w dojrzewaniu i kontroli stabilności trna

Bioinformatyczne bazy danych

wykład dla studentów II roku biotechnologii Andrzej Wierzbicki

Różnorodność osobników gatunku

Gdański Uniwersytet Medyczny Wydział Lekarski. Udział mikrorna w procesie starzenia się ludzkich limfocytów T. Joanna Frąckowiak

CHARAKTERYSTYKA PRZEDMIOTU Pracownia Informatyczna 1 PRACOWNIA INFORMATYCZNA 2018/2019 MAGDA MIELCZAREK 1

Database resources of the National Center for Biotechnology Information. Magdalena Malczyk

Pytania i odpowiedzi

1. KEGG 2. GO. 3. Klastry

Politechnika Śląska w Gliwicach Wydział Automatyki, Elektroniki i Informatyki

Diagnostyka neurofibromatozy typu I,

Tematyka zajęć z biologii

Przybliżone algorytmy analizy ekspresji genów.

Statystyczna analiza danych

Drożdże piekarskie jako organizm modelowy w genetyce

SYLABUS DOTYCZY CYKLU KSZTAŁCENIA

THE UNFOLDED PROTEIN RESPONSE

PLAN STUDIÓW. Rodzaj zajęć. e-nauczanie,

Informatyka w medycynie Punkt widzenia kardiologa

Możliwości i potencjalne zastosowania Zintegrowanego Systemu Analitycznego do innowacyjnych i kompleksowych badań molekularnych

Porównywanie i dopasowywanie sekwencji

WARUNKI ZALICZENIA PRZEDMIOTU- 5 ECTS

Plan wykładu: Budowa chromatyny - nukleosomy. Wpływ nukleosomów na replikację i transkrypcję

DNA musi współdziałać z białkami!

1

Bioinformatyczne bazy danych

Analizy DNA in silico - czyli czego można szukać i co można znaleźć w sekwencjach nukleotydowych???

Motywacja. Do tej pory: Dzisiaj:

Potencjał naukowo-badawczy Działu Genomiki i Biologii Molekularnej Zwierząt IZ PIB

Sekwencjonowanie, przewidywanie genów

Ekologia molekularna. wykład 10

Geny i działania na nich

Podstawy genetyki molekularnej

Wprowadzenie do biologii molekularnej.

Instytut Biologii Molekularnej i Biotechnologii

Bioinformatyka. Bazy danych. Wykład 3. E. Banachowicz. Wykład monograficzny Bioinformatyka. Wykład 3, Zakład Biofizyki Molekularnej IF UAM

Analiza sekwencji promotorów

Bioinformatyka Laboratorium, 30h. Michał Bereta

Sekwencjonowanie nowej generacji i rozwój programów selekcyjnych w akwakulturze ryb łososiowatych

DNA superhelikalny eukariota DNA kolisty bakterie plazmidy mitochondria DNA liniowy wirusy otrzymywany in vitro

Biologia medyczna, materiały dla studentów

Sylabus Biologia molekularna

Zaoczne Liceum Ogólnokształcące Pegaz

Przeglądanie bibliotek

Regulacja Ekspresji Genów

Choroba syropu klonowego

WYDZIAŁ BIOCHEMII, BIOFIZYKI I BIOTECHNOLOGII PRACOWNIA GENETYKI MOLEKULARNEJ I WIRUSOLOGII

Badanie funkcji genu

Bioinformatyka. Michał Bereta

PLAN STUDIÓW PODYPLOMOWYCH: DIAGNOSTYKA MOLEKULARNA W ROKU 2019/2020. Nazwa modułu ECTS Semestr I Semestr II. Liczba godzin z.

Przetarg nieograniczony na zakup specjalistycznej aparatury laboratoryjnej Znak sprawy: DZ-2501/6/17

Konspekt do zajęć z przedmiotu Genetyka dla kierunku Położnictwo dr Anna Skorczyk-Werner Katedra i Zakład Genetyki Medycznej

Badanie funkcji genu

Nutrigenomika i nutrigenetyka koncepcje i obszary badawcze. Maria Koziołkiewicz. Instytut Biochemii Technicznej Politechnika Łódzka

Składniki diety a stabilność struktury DNA

Dopasowanie sekwencji (sequence alignment)

Wojciech Rosikiewicz Identyfikacja i analiza ekspresji nakładających się genów u człowieka i myszy

Ruch zwiększa recykling komórkowy Natura i wychowanie

Transkrypt:

Kandydat będzie odpowiedzialny za realizację wybranych zagadnień z poniższego opisu. Funkcje regulatorowe długich niekodujących RNA w kontekście oddziaływań RNA:RNA 1. Cel naukowy projektu Długie niekodujące RNA (lncrna, ang. long non-coding RNA) stanowią u roślin i zwierząt niezwykle liczną klasę transkryptów, których wspólną cechą jest brak zdolności do kodowania białka oraz długość przekraczająca arbitralnie przyjętą granicę 200 nukleotydów. U człowieka odkryto 145331 tych cząsteczek (NONCODE v4, Xie et al., 2014), wobec 21995 transkryptów kodujących białka (ENSEMBL 77, Cunningham et al., 2014). Dotychczas udało się funkcjonalnie scharakteryzować zaledwie 1% tych cząsteczek, a zatem istnieje pilna potrzeba poszerzenie naszej wiedzy na temat pełnionych przez nie funkcji komórkowych. Ponieważ szczególnie słabo poznanym aspektem biologii lncrna są ich funkcje związane z tworzeniem bezpośrednich oddziaływań z innymi cząsteczkami RNA, stanowi to obiecujący kierunek badań, tym bardziej że możliwych jest tysiące interakcji w cis (lncrna nakładające się z innymi genami w genomie) oraz dziesiątki tysięcy interakcji w trans. Dlatego głównym celem projektu jest zbadanie funkcji lncrna pełnionych w sparowaniu z innymi cząsteczkami RNA. Po raz pierwszy to zagadnienie będzie przedmiotem wszechstronnych, wielkoskalowych analiz bioinformatycznych, które zostaną dodatkowo wsparte analizą funkcjonalną in vivo wybranych kandydatów. 2. Znaczenie projektu Długie niekodujące RNA są niezwykle zróżnicowane pod względem sekwencji, struktury drugorzędowej, tkankowej specyficzności, lokalizacji komórkowej czy biogenezy - a co za tym idzie, pełnią różnorodne funkcje i ich badanie jest trudnym zadaniem. Wśród funkcji, z którymi powiązano lncrna, należy wymienić modulowanie procesu transkrypcji (Kugel and Goodrich, 2012), działanie jako tzw. gąbki mikrorna (Tay et al., 2014), bezpośrednie oddziaływanie z białkami i modyfikowanie ich funkcji (Yin et al., 2012), tworzenie kompleksów makromolekularnych poprzez interakcje z innymi cząsteczkami (Kugel and Goodrich, 2012) czy pełnienie funkcji cząsteczek sygnałowych (Huang et al., 2013). Jako że uczestniczą w licznych procesach molekularnych, jak również wykazano ich związek z chorobami u człowieka, stanowią interesujący obiekt badań o potencjalnie dużym znaczeniu dla biologii molekularnej, biotechnologii czy medycyny. Szczególnie słabo poznanym aspektem biologii lncrna jest ich udział w dojrzewaniu transkryptów i regulacji ekspresji genów poprzez wchodzenie w oddziaływania z komplementarną cząsteczką RNA. W tym układzie lncrna mogłyby uczestniczyć w takich procesach, jak (i) regulacja splicingu poprzez maskowanie sygnałów splicingowych (Beltran et al., 2008), (ii) edytowanie RNA (Kawahara et al., 2007), (iii) Staufen-mediated decay (SMD), będący szlakiem degradacji RNA u ssaków (Gong and Maquat, 2011), (iv) regulacja translacji w sposób zależny od elementu powtarzalnego SINEB2 (Carrieri et al., 2012), (v) maskowanie miejsc wiązania mikrorna (Faghihi et al., 2008). Zostały one schematycznie przedstawione na Rys. 1. Badanie funkcji lncrna w kontekście tych mechanizmów, jak zakłada projekt, będzie szansą na funkcjonalnie scharakteryzowanie wielu z nich. Przyczyni się to do lepszego poznania mechanizmów regulatorowych ekspresji genów i dywersyfikacji transkryptomów i proteomów u Eukaryota, tym bardziej, że nacisk położony będzie na role tych cząsteczek w modulowaniu splicingu i mirna-zależnej regulacji genów. Jako że podobne analizy nie były jeszcze przeprowadzone, ich wykonanie z zastosowanie najnowszych technologii i algorytmów, w dużej skali (setki bibliotek RNA-Seq, kilkanaście gatunków) powinno zagwarantować uzyskanie

wyników o dużym znaczeniu naukowym. Dodatkowo, w ramach projektu opracowane zostaną nowe metody i narzędzia, a także internetowe bazy danych, udostępniające w przystępny sposób wyniki wielkoskalowych analiz. Rys. 1 Schematyczna reprezentacja procesów molekularnych z udziałem lncrna tworzących sparowania z komplementarną cząsteczką RNA. Niewątpliwą zaletą niniejszego projektu jest uwzględnienie ulegających ekspresji i niekodujących białka retrokopii. Dotychczasowe analizy i repozytoria lncrna pomijają te cząsteczki, uznając je za tzw. pseudogeny, niefunkcjonalne elementy genomu, podczas gdy spełniają one kryteria klasyfikacji jako lncrna, a w dodatku niejednokrotnie pełnią ważne funkcje molekularne (np. Johnsson et al., 2013). Nie bez znaczenie jest też fakt, że retrokopie są istotnym źródłem nowych genów i w znacznym stopniu kształtują plastyczność genomów. Co więcej, retrokopie są liczebną klasą genów i w bazie RetrogeneDB (Kabza et al., 2014), zbudowanej w grupie kandydata, znajduje się 84808 retrokopii wykrytych u 62 gatunków zwierząt, w tym niemal tysiąc takich retrokopii u człowieka, które ulegają ekspresji i nie kodują białka. 3. Koncepcja i plan badań Cztery najważniejsze zadania, które zostaną wykonane w ramach projektu, rysują się następująco: 1. Identyfikacja sparowań RNA:RNA Każde takie oddziaływanie musi zostać zbadane dwuetapowo. W pierwszej kolejności przewidywane będą struktury drugorzędowe oraz prawdopodobieństwa dla poszczególnych regionów cząsteczek, że pozostają one jednoniciowe, a więc mogą parować się z innymi RNA. Następnie obliczana będzie energia i prawdopodobieństwo oddziaływania z badaną cząsteczką

RNA. Zadanie to jest stosunkowo kosztowne obliczeniowo, gdyż możliwych jest wiele miliardów oddziaływań RNA:RNA w transkryptomie pojedynczego gatunku, zaś rozmiar niektórych cząsteczek sięga tysięcy nukleotydów, co dodatkowo zwiększa kosztowność obliczeniową. Dlatego kandydat opracował algorytm, oparty na przeszukiwaniu odpowiednio zmodyfikowanych cząsteczek programem BLAST, pozwalający zmniejszyć przestrzeń poszukiwań 240 razy, czyniąc obliczenia wykonalne w ciągu kilku dni na pojedynczym procesorze. Oprócz wyżej wspomnianych oddziaływań w trans, identyfikowane będą sparowania w cis, występujące między transkryptami pochodzącymi z loci nakładających sie w genomie; ich identyfikacja będzie łatwym zadaniem, polegającym na analizie porównawczej zestawów koordynat genomowych. 2. Analiza zidentyfikowanych oddziaływań i badanie funkcji lncrna Oddziaływanie między dwoma cząsteczkami jest możliwe tylko, jeśli obie ulegają ekspresji w tym samym przedziale komórkowym. Ważna jest również stechiometria oddziaływania, tzn. zasadniczo lncrna powinno wykazywać poziom ekspresji tego samego rzędu co druga cząsteczka RNA lub wyższy, aby mógł być zaobserwowany efekt regulatorowy. Dlatego kluczowe znaczenie będzie miała tutaj analiza kilkuset bibliotek RNA-Seq dostępnych w publicznych bazach danych. Dodatkowe analizy, w tym analiza struktur drugorzędowych, elementów powtarzalnych, sygnałów splicingowych, miejsc wiązania mirna czy konserwacji pozwolą lepiej scharakteryzować lncrna oraz pomogą wyselekcjonować najciekawsze z biologicznego punktu widzenia lncrna do testów laboratoryjnych. 3. Testy laboratoryjne Badanie in vivo funkcji wybranych lncrna odbywać sie będzie z wykorzystaniem wektorów ekspresyjnych, wywołujących w transfekowanej linii komórkowej nadekspresję lncrna. Taki układ eksperymentalny będzie wykorzystany w dwóch wersjach, do zbadania odpowiednio lncrna biorących udział w regulacji splicingu oraz lncrna maskujących miejsca wiązania mirna i przez to znoszących ich funkcje. 4. Internetowe bazy danych W ramach projektu zbudowane zostaną dwie internetowe bazy danych. Pierwsza baza danych będzie skoncentrowana na potencjalnych funkcjach komórkowych lncrna, pełnionych w kontekście sparowań z innymi cząsteczkami RNA. Druga zaś będzie kolekcjonowała wyniki analiz RNA-Seq przeprowadzonych w ramach projektu i będzie obejmować informacje o poziomie ekspresji w poszczególnych tkankach, liniach komórkowych i stanach, informację o ekspresji różnicowej oraz dane na temat alternatywnych zdarzeń splicingowych. 4. Metodyka badań Poznanie potencjalnych funkcji lncrna w kontekście pięciu wyżej wspomnianych mechanizmów będzie wymagało wielkoskalowych analiz z użyciem szybkich, nowoczesnych algorytmów oraz wszechstronnego wykorzystania wyników sekwencjonowania nowej generacji, w szczególności RNA-Seq. Pierwszym etapem będzie tutaj identyfikacja możliwych oddziaływań lncrna z innymi cząsteczkami RNA, zarówno w cis, jak również w trans. Analiza ta będzie wykonana z wykorzystaniem dostępnego oprogramowania (głównie RNAup, Lorenz et al., 2011) oraz metody opracowanej przez kandydata, pozwalającej na zmniejszenie przestrzeni poszukiwań, a przez to znacząco skracającej czas analizy. Następnie etapy projektu dotyczą zbadania, z którymi mechanizmami (Rys. 1) można powiązać znalezione oddziaływania. W tym celu przeprowadzony zostanie szereg analiz bioinformatycznych, wliczając (wybrane pozycje):

i. analizę ekspresji i zdarzeń splicingowych Przeprowadzona zostanie analiza danych RNA-Seq, dostępnych m.in. ze strony internetowej projektu ENCODE (ENCODE Project Consortium, 2004), gdzie gromadzone są wyniki sekwencjonowania transkryptomów z różnych przedziałów komórkowych, z szeregu tkanek i linii komórkowych. Analiza splicingu, również z wykorzystaniem danych RNA-Seq, pozwoli stwierdzić czy zidentyfikowane oddziaływanie RNA:RNA jest znoszone poprzez alternatywne zdarzenia splicingowe, dotyczące np. wycięcia alternatywnego egzonu, pełniącego kluczową rolę w interakcji. ii. identyfikację sygnałów splicingowych Znalezienie lncrna mogących regulować zdarzenia splicingowe będzie wymagało identyfikacji sygnałów splicingowych w cząsteczce pre-mrna. Ponieważ nie istnieją obecnie wysokiej jakości bazy danych sygnałów splicingowych ani nowoczesne i efektywne narzędzia pozwalające na ich identyfikację, kandydat stworzył odpowiednie narzędzia, których algorytm uwzglednia najnowszą wiedzę i wnioski z danych eksperymentalnych. Dodatkowo, z bazy danych StarBase 2.0 (Li et al., 2014) pobrane zostaną informacje o miejscach oddziaływania czternastu czynników splicingowych z pre-mrna, odkryte dzięki eksperymentom CLIP; miejsca te stanowią cenną wskazówkę na temat regionów ważnych w procesie splicingu, niemniej jednak tego typu dane dostępne są tylko dla człowieka i myszy. iii. identyfikację elementów powtarzalnych. Dwa mechanizmy, SMD oraz regulacja translacji z udziałem elementu SINEB2 wymagają występowania elementów powtarzalnych w odpowiedniej orientacji względem regionu kodującego w cząsteczce mrna. Identyfikacja elementów powtarzalnych wykonana bedzie programem RepeatMasker (Tempel, 2012) iv. Identyfikacja miejsc edytowania RNA Istniejące bazy danych zjawisk edytowania, np. RADAR (Ramaswami i Li, 2014), kolekcjonują dane dla wąskiej grupy organizmów modelowych, wliczając dwa gatunki ssaków - człowieka i mysz. Dlatego konieczne będzie przeprowadzenie analiz de novo dla innych gatunków de novo z wykorzystaniem danych RNA-Seq i DNA-Seq, dostępnych w bazach danych Sequence Read Archive (Kodama et al., 2012) oraz European Nucleotide Database (Silvester et al., 2014). Analiza ta, ze względu na dostępność danych, ograniczona będzie do kilku organizmów modelowych. Te i inne analizy pozwolą na znalezienie licznych lncrna pełniących potencjalne funkcje regulatorowe w układzie z komplementarną cząsteczką RNA. Najciekawsze z biologicznego punktu widzenia oddziaływania zostaną zbadane eksperymentalnie. Wybór będzie poprzedzony analizą ekspresji, konserwacji oraz energii oddziaływania między cząsteczkami RNA, w szczególności pod uwagę wzięte będą te lncrna, które ulegają ekspresji różnicowej w różnych tkankach i stanach chorobowych. Nacisk będzie tutaj położony na te lncrna, których funkcje wiążą się z maskowaniem miejsc splicingowych bądź miejsc wiązania mikrorna. W tym celu zbudowane zostaną odpowiednie wektory ekspresyjne, którymi będzie transferowana badana linia komórkowa. W pierwszym przypadku obserwowany będzie wpływ nadekspresji lncrna na splicing regulowanego pre-mrna. W drugim, oprócz wektora pozwalającego uzyskać nadekspresję lncrna, będzie użyty wektor zawierający otwartą ramkę odczytu lucyferazy oraz położone poniżej miejsce wiązania dla mikrorna. Jeśli lncrna maskuje miejsce wiązania mikrorna, zniesiona zostanie regulacja przez to małe RNA i obserwowana będzie aktywność białka lucyferazy.

5. Literatura Beltran M, Puig I, Peña C et al. (2008) A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition. Genes Dev., 22(6):756-69. Carrieri C, Cimatti L, Biagioli M et al. (2012) Long non-coding antisense RNA controls Uchl1 translation through an embedded SINEB2 repeat. Nature, 491(7424):454-7. Cunningham F, Amode MR, Barrell D et al. (2014) Ensembl 2015. Nucleic Acids Res., 2014 Oct 28. pii: gku1010. ENCODE Project Consortium (2004)The ENCODE (ENCyclopedia Of DNA Elements) Project. Science, 306(5696):636-40. Faghihi MA, Modarresi F, Khalil AM et al. (2008) Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of beta-secretase. Nat Med., 14(7):723-30. Gong C, Maquat LE (2011) lncrnas transactivate STAU1-mediated mrna decay by duplexing with 3' UTRs via Alu elements. Nature, 470(7333):284-8. Huang X, Yuan T, Tschannen M et al. (2013) Characterization of human plasma-derived exosomal RNAs by deep sequencing. BMC Genomics, 14:319. Johnsson P, Ackley A, Vidarsdottir L (2013) A pseudogene long-noncoding-rna network regulates PTEN transcription and translation in human cells. Nat Struct Mol Biol., 20(4):440-6. Kabza M, Ciomborowska J, Makałowska I (2014) RetrogeneDB--a database of animal retrogenes. Mol Biol Evol., 31(7):1646-8. Kawahara Y, Zinshteyn B, Sethupathy P et al. (2007) Redirection of silencing targets by adenosine-toinosine editing of mirnas. Science, 315(5815):1137-40. Kodama Y, Shumway M, Leinonen R et al. (2012)The Sequence Read Archive: explosive growth of sequencing data. Nucleic Acids Res., 40:D54-6. Kugel JF, Goodrich JA (2012) Non-coding RNAs: key regulators of mammalian transcription. Trends Biochem Sci., 37(4):144-51. Li JH, Liu S, Zhou H (2014) starbase v2.0: decoding mirna-cerna, mirna-ncrna and protein-rna interaction networks from large-scale CLIP-Seq data. Nucleic Acids Res., 42:D92-7. Lorenz R, Bernhart SH, Hoener zu Siederdissen C et al. (2011) ViennaRNA Package 2.0. Algorithms for Molecular Biology: 6:26. Ramaswami G, Li JB (2014) RADAR: a rigorously annotated database of A-to-I RNA editing. Nucleic Acids Res., 42:D109-13. Silvester N, Alako B, Amid C et al. (2014) Content discovery and retrieval services at the European Nucleotide Archive. Nucleic Acids Res., 2014 Nov 17. pii: gku1129. Tay Y, Rinn J, Pandolfi PP (2014) The multilayered complexity of cerna crosstalk and competition. Nature, 505(7483):344-52. Tempel S (2012) Using and understanding RepeatMasker. Methods Mol Biol., 859:29-51. Xie C, Yuan J, Li H et al. (2014) NONCODEv4: exploring the world of long non-coding RNA genes. Nucleic Acids Res., 42:D98-103. Yin QF, Yang L, Zhang Y et al. (2012) Long noncoding RNAs with snorna ends. Mol Cell, 48(2):219-30.