در سال ۲۰۰۷، یک مطالعه نشان داد که تنها یک پنجم ژنوم انسان به رونوشتهای کد کننده پروتئین رونویسی میشود،[4] که نشان دهنده این بود که توالیهای غیرکد کننده حداقل چهار برابر توالیهای آرانایهای کد کننده میباشد. پروژههای توالییابی دیانای مکمل (cDNA) در مقیاس بزرگ مانند FANTOM پیچیدگیهای رونویسی را نشان دادند. پروژه FANTOM3 حدود ۳۵۰۰۰ رونوشت غیرکد کننده را از ۱۰۰۰۰ لکوس جداگانه مشخص کرد که بسیاری از مشخصات mRNAها، از جمله کلاهکگذاری '۵، پیرایش، و پلیآدنیلاسیون هستند، اما چارچوب خوانش باز (ORF) کمی دارند یا ندارند.[5] در حالی که فراوانی ncRNAهای طولانی پیشبینی نشده بود، این تعداد یک برآورد پایینتر محافظه کارانه را نشان میدهد، زیرا بسیاری از رونوشتهای تکی و رونوشتهای غیر پلی آدنیله را حذف کردهاست (بیش از ۴۰٪ از رونوشتها غیرآدنیله هستند).[6] با این حال، بدون تردید شناسایی ncRNAهای موجود در این کتابخانههای cDNA چالشبرانگیز است، زیرا تشخیص رونوشتهای کدکنندهٔ پروتئینها از رونوشتهای غیرکد کننده دشوار است. مطالعات زیادی نشان دادهاند که بیضهها،[7] و بافتهای عصبی بیشترین مقدار آرانایهای غیر رمزگذار را از هر نوع بافت دیگری بیان میکنند.[8] با استفاده از پروژهٔ FANTOM5 حدود ۲۷۹۱۹ RNAهای بلند غیرکد کننده در بافتها و نمونههای مختلف انسانی شناسایی شدهاست.[9]
بهطور کمی، lncRNAها حدود ۱۰ برابر فراوانی کمتری از mRNA در یک جمعیت از سلولی نشان میدهد،[10][11] و تغییرات بیانی lncRNA از یک سلول به سلول دیگر نسبت به ژنهای کد کننده پروتئین زیاد میباشد.[12] بهطور کلی، اکثریت (حدوداً ۷۸ درصد) lncRNAها به صورت مختص بافتی بیان میشوند که این مقدار در mRNAها تنها ۱۹ درصد میباشد. علاوه بر ویژگی مختص بافتی بالای آنها، lncRNAها در مراحل مختلف تکوین نیز به صورت کاملاً اختصاصی بیان میشوند.[13]
چندین lncRNA شناسایی شدهاند که در واقع پپتیدهایی با عملکرد بیولوژیکی مهم رمزگذاری میکنند.[14][15][16] مطالعات پروفایلینگ ریبوزوم نشان میدهد که از ۴۰٪ تا ۹۰٪ از annotated lncRNAها در واقع ترجمه میشوند،[17][18] اگرچه در مورد روش صحیح برای تجزیه و تحلیل دادههای پروفایل ریبوزومی اختلاف نظر وجود دارد.[19] علاوه بر این، تصور میشود که بسیاری از پپتیدهای تولید شده توسط lncRNAها ممکن است بسیار ناپایدار و بدون عملکرد بیولوژیکی باشند.
Perkel JM (June 2013). "Visiting "noncodarnia"". BioTechniques (paper). 54 (6): 301, 303–4. doi:10.2144/000114037. PMID23750541. "We're calling long noncoding RNAs a class, when actually the only definition is that they are longer than 200 bp," says Ana Marques, a Research Fellow at the University of Oxford who uses evolutionary approaches to understand lncRNA function.
Necsulea A, Soumillon M, Warnefors M, Liechti A, Daish T, Zeller U, Baker JC, Grützner F, Kaessmann H (January 2014). "The evolution of lncRNA repertoires and expression patterns in tetrapods". Nature. 505 (7485): 635–640. Bibcode:2014Natur.505..635N. doi:10.1038/nature12943. PMID24463510.
Hon CC, Ramilowski JA, Harshbarger J, Bertin N, Rackham OJ, Gough J, Denisenko E, Schmeier S, Poulsen TM, Severin J, Lizio M, Kawaji H, Kasukawa T, Itoh M, Burroughs AM, Noma S, Djebali S, Alam T, Medvedeva YA, Testa AC, Lipovich L, Yip CW, Abugessaisa I, Mendez M, Hasegawa A, Tang D, Lassmann T, Heutink P, Babina M, Wells CA, Kojima S, Nakamura Y, Suzuki H, Daub CO, de Hoon MJ, Arner E, Hayashizaki Y, Carninci P, Forrest AR (March 2017). "An atlas of human long non-coding RNAs with accurate 5′ ends". Nature. 543 (7644): 199–204. Bibcode:2017Natur.543..199H. doi:10.1038/nature21374. PMC6857182. PMID28241135.
Yan L, Yang M, Guo H, Yang L, Wu J, Li R, Liu P, Lian Y, Zheng X, Yan J, Huang J, Li M, Wu X, Wen L, Lao K, Li R, Qiao J, Tang F (September 2013). "Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells". Nature Structural & Molecular Biology. 20 (9): 1131–1139. doi:10.1038/nsmb.2660. PMID23934149.
Matsumoto A, Pasut A, Matsumoto M, Yamashita R, Fung J, Monteleone E, Saghatelian A, Nakayama KI, Clohessy JG, Pandolfi PP (January 2017). "mTORC1 and muscle regeneration are regulated by the LINC00961-encoded SPAR polypeptide". Nature. 541 (7636): 228–232. Bibcode:2017Natur.541..228M. doi:10.1038/nature21034. PMID28024296.