Êðèòå𳿠îö³íêè ðåçóëüòàò³â ì³êðîìàñèâ-åêñïåðèìåíòó ç äîñë³äaeåííÿ òðàíñêðèïòîìó ãåïàòîöèò³â ùóðà ï³ä âïëèâîì ³íòåðôåðîíó àëüôà À. Â. Êóêë³í, Á. Ò. Òîêîâåíêî, Ì. Þ. Îáîëåíñüêà ²íñòèòóò ìîëåêóëÿðíî¿ á³îëî㳿 ³ ãåíåòèêè ÍÀÍ Óêðà¿íè Âóë. Àêàäåì³êà Çàáîëîòíîãî, 150, Êè¿â, Óêðà¿íà,03680 Av.kuklin@gmail.com Òðàíñêðèïòîì ïåðâèííèõ ãåïàòîöèò³â ùóðà, êóëüòèâîâàíèõ ç ³íòåðôåðîíîì àëüôà (²ÔÍa) âïðîäîâae òðüîõ ³ øåñòè ãîäèí, äîñë³äaeóâàëè ³ç çàëó÷åííÿì îë³ãîíóêëåîòèäíèõ ì³êðîìàñèâ³â. Ìåòà. Ïðîâåäåííÿ ïîåòàïíîãî àíàë³çó ðåçóëüòàò³â ì³êðîìàñèâ-åêñïåðèìåíòó ³ âèçíà÷åííÿ â³äïîâ³äíîñò³ àáî íåâ³äïîâ³äíîñò³ êðèòåð³¿â îö³íêè ðåçóëüòàò³â çàãàëüíîïðèéíÿòèì çíà÷åííÿì. Ìåòîäè. Àíàë³ç çä³éñíþâàëè íà ôàéëàõ, îòðèìàíèõ ï³ñëÿ ñêàíóâàííÿ ì³êðîìàñèâ³â Affymetrix, ³ç âèêîðèñòàííÿì ñòàòèñòè÷íîãî ñåðåäîâèùà R, ïàêåò³â ôóíêö³é Bioconductor «affy», «simpleaffy», «affyPLM» ³ ïðîãðàìè BRB Array Tools ³ç çàñòîñóâàííÿì ïàðíîãî Ò-òåñòó. Ðåçóëüòàòè. Óñ³ ì³êðîìàñèâè ïðîéøëè êîíòðîëü ÿêîñò³, íîðìàë³çîâàí³ ³ ïîð³â-íÿíí³ ì³ae ñîáîþ. Çà ðåçóëüòàòîì Ò-òåñòó çíàéäåíî 28 ³ 124 äèôåðåíö³éíî åêñïðåñîâàíèõ ãåíè â³äïî-â³äíî ï³ñëÿ òðüîõ ³ øåñòè ãîäèí êóëüòèâóâàííÿ êë³òèí ç ²ÔÍ. Âèñíîâêè. Îäåðaeàí³ äàí³ â³äïîâ³äàþòü óçâè÷àºíèì êðèòåð³ÿì ÿêîñò³ ³ ïðèäàòí³ äëÿ ïîäàëüøîãî âñòàíîâëåííÿ ¿õíüîãî á³îëîã³÷íîãî çíà÷åííÿ. Âèêîðèñòàí³ â ðîáîò³ R-êîäè ìîaeíà çàñòîñîâóâàòè ïðè îáðîáö³ ðåçóëüòàò³â ì³êðîìàñèâ-åêñïåðè-ìåíò³â. Êëþ÷îâ³ ñëîâà: ì³êðîìàñèâè ÄÍÊ, ³íòåðôåðîí àëüôà, ñòàòèñòè÷íå ñåðåäîâèùå R, Bioconductor, íîð-ìàë³çàö³ÿ.
Background: According to major public repositories statistics an overwhelming majority of the existing and newly uploaded data originates from microarray experiments. Unfortunately, the potential of this data to bring new insights is limited by the effects of individual study-specific biases due to small number of biological samples. Increasing sample size by direct microarray data integration increases the statistical power to obtain a more precise estimate of gene expression in a population of individuals resulting in lower false discovery rates. However, despite numerous recommendations for gene expression data integration, there is a lack of a systematic comparison of different processing approaches aimed to asses microarray platforms diversity and ambiguous probesets to genes correspondence, leading to low number of studies applying integration.Results: Here, we investigated five different approaches of the microarrays data processing in comparison with RNA-seq data on breast cancer samples. We aimed to evaluate different probesets annotations as well as different procedures of choosing between probesets mapped to the same gene. We show that pipelines rankings are mostly preserved across Affymetrix and Illumina platforms. BrainArray approach based on updated annotation and redesigned probesets definition and choosing probeset with the maximum average signal across the samples have best correlation with RNA-seq, while averaging probesets signals as well as scoring the quality of probes sequences mapping to the transcripts of the targeted gene have worse correlation. Finally, randomly selecting probeset among probesets mapped to the same gene significantly decreases the correlation with RNA-seq. Conclusion:We show that methods, which rely on actual probesets signal intensities, are advantageous to methods considering biological characteristics of the probes sequences only and that cross-platform integration of datasets improves correlation with the RNA-seq data. We consider the results obtained in this paper contributive to the integrative analysis as a worthwhile alternative to the classical meta-analysis of the multiple gene expression datasets.
Інститут молекулярної біології і генетики НАН України 1 Київський національний університет імені Тараса ШевченкаУ різних галузях біології та медицини накопичилася значна кількість даних широкомасштабних досліджень генної експресії за використання мікромасив-технологій. Тому виникає нагальна потреба в порівнянні, об'єднанні й аналізі цих даних з метою підвищення інформативності та статистичної достовірності результатів аналізу. Однак, процес об'єднання результатів мікромасив-експериментів на базі крос-платформного аналізу ускладнений існуванням ба-гатьох мікроарей-платформ, різних за технологією виготовлення, методикою нанесення проб на чип і різновидністю дизайну проб. Ці особливості кожного з досліджень повинні бути враховані при обробленні та аналізі результатів мікромасив-експериментів, отриманих як на однакових, так і на різних платформах.Мета роботи: дослідити як різні способи оброблення та об'єднання даних мікромасив-експериментів за викорис-тання різних платформ впливають на значення генної експресії.Зміни в процесі оброблення мікромасив-експериментів впливають на результати даних експресії. Реанотація проб на сучасні версії баз даних геномних/транскриптомних послідовностей дає більш точний результат. Також вибір проб-сетів на основі відповідності проб до послідовності конкретного гена (його транскриптів), а саме підходи, показані проектом BrainArray та використаними нами оцінками специфічності та чутливості проб, дають більш зважені та по-дібні результати, що відображено в аналізі кореляції експресії генів між різними варіантами обробки та кластерному аналізі профілей генної експресії.Об'єднання даних із різних досліджень допомагає отримати більш прогнозовану похибку при класифікації зразків ракових пухлин молочної залози людини за молекулярними підтипами даних, ніж при використанні даних із окремих досліджень. Цей результат слугує підґрунтям для використання саме такого підходу при дослідженні проблем, що пов'язані з класифікацією будь-яких біологічних даних, особливо якщо заздалегідь інформація про зразки невідома, а також спонукає до подальшого дослідження впливу злиття даних на значення генної експресії.Ключові слова: генна експресія, мікромасів-технології, ракові пухлини молочної залози людини. КРОСС-ПЛАТФОРМЕННОЕ ОБЪЕДИНЕНИЕ Институт молекулярной биологии и генетики НАН Украины 1 Киевский национальный университет имени Тараса ШевченкоВ различных областях биологии и медицины накопилось значительное количество данных широкомасштабных исследований генной экспрессии с использованием микромасив-технологий. Поэтому возникает насущная необхо-димость в сравнении, объединении и анализе этих данных с целью повышения информативности и статистической достоверности результатов анализа.Цель работы: исследовать как различные способы обработки и объединения данных микромасив-экспериментов с использованием различных платформ влияют на значение генной экспрессии.Объединение данных из разных исследований помогает получить более прогнозируемую погрешность при клас-сификации образцов раковых опухолей молочной железы ч...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.