किडनीनेटवर्क: किडनी रोग में शामिल नवीन जीनों की भविष्यवाणी और प्राथमिकता देने के लिए किडनी-व्युत्पन्न जीन अभिव्यक्ति डेटा का उपयोग करना Ⅰ
Aug 07, 2023
संदिग्ध वंशानुगत रोगियों में आनुवंशिक परीक्षणगुर्दा रोगविकार के आनुवंशिक कारण को प्रकट नहीं किया जा सकता है क्योंकि संभावित रूप से रोगजनक वेरिएंट उन जीनों में रह सकते हैं जिनके शामिल होने के बारे में अभी तक ज्ञात नहीं हैगुर्दा रोग. हमने किडनी नेटवर्क विकसित किया है, जो विशेष रूप से किडनी रोगों के लिए उम्मीदवार जीन प्राथमिकता को सूचित करने के लिए ऊतक-विशिष्ट अभिव्यक्ति का उपयोग करता है। किडनीनेटवर्क एक नवीन विधि है जिसका निर्माण 878 नमूनों के किडनी आरएनए-अनुक्रमण सह-अभिव्यक्ति नेटवर्क को 31,499 नमूनों के बहु-ऊतक नेटवर्क के साथ एकीकृत करके किया गया है। यह निष्पक्ष तरीके से यह अनुमान लगाने के लिए अभिव्यक्ति पैटर्न और स्थापित जीन-फेनोटाइप संघों का उपयोग करता है कि कौन से जीन किस (बीमारी) फेनोटाइप से संबंधित हो सकते हैं। हमने उम्मीदवार जीन को प्राथमिकता देने के लिए आनुवंशिक निदान के बिना 13 किडनी रोग रोगियों के एक्सोम अनुक्रमण डेटा में दुर्लभ वेरिएंट पर किडनीनेटवर्क लागू किया। किडनीनेटवर्क किडनी-विशिष्ट जीन कार्यों और रोग से जुड़े जीनों के लिए (किडनी रोग) फेनोटाइप की सटीक भविष्यवाणी कर सकता है। किडनी और लीवर सिस्ट वाले रोगी में दुर्लभ वेरिएंट वाले जीन के साथ प्राथमिकता वाले जीन के प्रतिच्छेदन ने ALG6 को एक प्रशंसनीय उम्मीदवार जीन के रूप में पहचाना। हम वैकल्पिक आनुवंशिक स्पष्टीकरण के बिना कई सिस्टिक किडनी और लीवर रोग के मामलों में ALG6 वेरिएंट की पहचान करके इस संभाव्यता को मजबूत करते हैं। हम किडनी नेटवर्क प्रस्तुत करते हैं, जो किडनी रोग फेनोटाइप के लिए अनुकूलित जीन-फेनोटाइप भविष्यवाणियों के साथ एक सार्वजनिक रूप से उपलब्ध किडनी-विशिष्ट सह-अभिव्यक्ति नेटवर्क है।

हमने उपयोग में आसान ऑनलाइन इंटरफ़ेस डिज़ाइन किया है जो चिकित्सकों और शोधकर्ताओं को जीन अभिव्यक्ति और सह-विनियमन डेटा का उपयोग करने की अनुमति देता हैवंशानुगत किडनी रोग निदान और अनुसंधान में प्रगति में तेजी लाने के लिए जीन-फेनोटाइप कनेक्शन।
अनुवादकीय कथन:संदिग्ध वंशानुगत रोगियों में आनुवंशिक परीक्षणगुर्दा रोगरोगी के विकार का आनुवंशिक कारण प्रकट नहीं हो सकता है। संभावित रूप से रोगजनक वेरिएंट उन जीनों में रह सकते हैं जो अभी तक गुर्दे की बीमारी में शामिल नहीं हैं, जिससे इन वेरिएंट की प्रासंगिकता की व्याख्या करना मुश्किल हो जाता है। इससे निष्पक्ष तरीके से आनुवंशिक भिन्नता के फेनोटाइपिक परिणामों की भविष्यवाणी करने के तरीकों की स्पष्ट आवश्यकता का पता चलता है। यहां हम किडनीनेटवर्क का वर्णन करते हैं, एक उपकरण जो किडनी-विशिष्ट जीन कार्यों की भविष्यवाणी करने के लिए ऊतक-विशिष्ट अभिव्यक्ति का उपयोग करता है। किडनीनेटवर्क को अज्ञात मामलों के एक समूह में लागू करने से सिस्टिक किडनी में एक उम्मीदवार जीन के रूप में ALG6 की पहचान की गई औरयकृत रोग. संक्षेप में, किडनीनेटवर्क आनुवंशिक वेरिएंट की व्याख्या में सहायता कर सकता है और इसलिए ट्रांसलेशनल नेफ्रोजेनेसिस में महत्वपूर्ण हो सकता है और किडनी रोग के रोगियों में नैदानिक उपज को बेहतर बनाने में मदद कर सकता है।

किडनी के लिए सिस्टान्चे प्राप्त करने के लिए यहां क्लिक करेंबीमारी
परिचय
संदिग्ध वंशानुगत किडनी रोग वाले रोगियों में आनुवंशिक परीक्षण से प्रेरक रोगजनक वेरिएंट का पता चल सकता हैगुर्दे से संबंधित जीन. हालाँकि, कई मामलों में, आनुवंशिक कारण का अभी तक पता नहीं लगाया जा सका है। किसी भी कारण से क्रोनिक किडनी रोग वाले आनुवंशिक रूप से परीक्षण किए गए लगभग 10-30 प्रतिशत रोगियों में ज्ञात किडनी से संबंधित जीन में रोगजनक वेरिएंट का पता लगाया जाता है [1-3]। हालाँकि, ये प्रतिशत संभवतः मोनोजेनिक कारण वाले रोगियों की संख्या को कम करके आंका गया है क्योंकि गुर्दे की बीमारी में अभी तक शामिल नहीं किए गए जीन के वेरिएंट पर किसी का ध्यान नहीं जाएगा। संभावित रूप से हानिकारक वेरिएंट इन जीनों में रह सकते हैं, जिससे इन वेरिएंट की प्रासंगिकता को प्राथमिकता देना और व्याख्या करना मुश्किल हो जाता है। इसलिए, जीनोमिक चिकित्सा के वर्तमान युग में, ज्ञात जीन में नकारात्मक निदान परिणाम के बाद मुख्य चुनौतियों में से एक संभावित रोगजनक वेरिएंट वाले नए उम्मीदवार जीन का पता लगाना और प्राथमिकता देना है जो रोगी की बीमारी की व्याख्या कर सकते हैं [4]।
उम्मीदवार की भविष्यवाणी करने के लिए आरएनए-अनुक्रमण डेटा का उपयोग किया जा सकता हैरोग जीन[5]. हमने हाल ही में आरएनए अनुक्रमण डेटा [6] के आधार पर नए उम्मीदवार रोग जीन को प्राथमिकता देने के लिए जीननेटवर्क और जीननेटवर्क-असिस्टेड डायग्नोस्टिक ऑप्टिमाइज़ेशन (जीएडीओ) विधि विकसित की है। इस पद्धति के पीछे विचार यह है कि कुछ दुर्लभ विकार कई जीनों में भिन्नता के कारण हो सकते हैं। हालाँकि ये जीन अलग-अलग हैं, लेकिन आमतौर पर इनके जैविक कार्य समान होते हैं। बड़ी संख्या में नमूनों से जीन अभिव्यक्ति डेटा का अध्ययन करते समय, ये रोग जीन आमतौर पर मजबूत सह-अभिव्यक्ति दिखाते हैं [6]। इस प्रकार, यदि ऐसे अन्य जीन हैं जो ज्ञात दुर्लभ रोग जीन के साथ दृढ़ता से सह-अभिव्यक्त होते हैं, तो यह संभव है कि इन अन्य जीनों में भिन्नताएं भी उसी बीमारी का कारण बन सकती हैं।
इस प्रकार के उपकरण के सर्वोत्तम ढंग से काम करने के लिए, सह-अभिव्यक्ति जानकारी यथासंभव सटीक होनी चाहिए। जीएडीओ के लिए, हमने कई अलग-अलग ऊतकों से सार्वजनिक रूप से उपलब्ध आरएनए अनुक्रमण डेटासेट के आधार पर एक जीन सह-अभिव्यक्ति नेटवर्क बनाया और इस नेटवर्क का उपयोग यह अनुमान लगाने के लिए किया कि कौन से जीन दुर्लभ बीमारियों का कारण बन सकते हैं। इन भविष्यवाणियों को मानव फेनोटाइप ऑन्टोलॉजी (एचपीओ) डेटाबेस [7] का उपयोग करके प्रशिक्षित किया गया था। एचपीओ डेटाबेस में, जीन को फेनोटाइप्स को सौंपा जाता है - जिसे एचपीओ-टर्म कहा जाता है - जो ओएमआईएम [8] और ऑर्फ़नेट [9] डेटाबेस में मौजूद जीन-रोग एनोटेशन और रोग लक्षणों पर आधारित होते हैं। एचपीओ डेटाबेस से जानकारी को जीन सह-अभिव्यक्ति नेटवर्क के साथ एकीकृत करके, हम प्रति एचपीओ शब्द प्रत्येक जीन के लिए भविष्यवाणी स्कोर की गणना कर सकते हैं। ये स्कोर मिलकर GeneNetwork बनाते हैं। जीएडीओ फिर एचपीओ शब्दों की एक इनपुट सूची को जोड़कर जीन को प्राथमिकता देता है जो रोगी के फेनोटाइप का वर्णन उस रोगी के संभावित हानिकारक वेरिएंट वाले जीन की सूची के साथ करता है। जीन सूची की प्राथमिकता इनपुट एचपीओ शर्तों [6] के लिए संयुक्त जीन भविष्यवाणी स्कोर पर आधारित है।
क्योंकि हमने देखा कि किडनी से संबंधित एचपीओ फेनोटाइप के लिए जीननेटवर्क का पूर्वानुमान प्रदर्शन सीमित था, हमने किडनी-विशिष्ट नेटवर्क विकसित करके भविष्यवाणी में सुधार करने की कोशिश की। हमने 878 किडनी आरएनए-अनुक्रमण नमूनों का उपयोग करके ऐसा किया, जिन्हें हमने अन्य ऊतकों से 31,499 नमूनों के मौजूदा डेटासेट के साथ समृद्ध किया [6]। एक नया भविष्यवाणी एल्गोरिदम विकसित करके जो दोनों डेटासेट में मौजूद जानकारी का वजन कर सकता है, हमने किडनी से संबंधित मार्गों के लिए प्रदर्शन में सुधार किया है। इस पेपर में, हम परिणामी किडनी नेटवर्क प्रस्तुत करते हैं, एक सह-अभिव्यक्ति नेटवर्क जिसका उपयोग किडनी से संबंधित एचपीओ शर्तों के लिए अज्ञात जीन के जीन-फेनोटाइप संघों की सटीक भविष्यवाणी करने के लिए किया जा सकता है। सिद्धांत के प्रमाण के रूप में, हमने पहले से अनसुलझे किडनी रोगों वाले रोगियों के एक समूह से एक्सोम अनुक्रमण डेटा के लिए किडनीनेटवर्क लागू किया।
विधि
किडनी से संबंधित फेनोटाइप की भविष्यवाणी में सुधार करने के लिए, हमने किडनी-व्युत्पन्न आरएनए-अनुक्रमण डेटा एकत्र किया, जीननेटवर्क को नवीनतम संदर्भ डेटाबेस के साथ अद्यतन किया और सांख्यिकीय विश्लेषण में सुधार किया, इसके बाद ऊतक-विशिष्ट जानकारी का एकीकरण किया।
किडनीनेटवर्क में डेटासेट
प्राथमिक, ट्यूमर और भ्रूण ऊतक सहित कई मूल के चयनित किडनी नमूनों से आरएनए-अनुक्रमण डेटा को हमारे पहले वर्णित जीननेटवर्क की नींव के रूप में उपयोग किए जाने वाले बहु-ऊतक आरएनए-अनुक्रमण के मौजूदा डेटासेट के साथ जोड़ा गया था [6] (तालिका एस1, एस2) . हमने दो कारणों से बहु-ऊतक डेटासेट को शामिल करना चुना। सबसे पहले, हमें बेसलाइन नेटवर्क बनाने के लिए पर्याप्त संख्या में नमूनों की आवश्यकता थी। दूसरा, हम उस अभिव्यक्ति को संरक्षित करना चाहते थे जो कई या सभी किडनी कोशिका प्रकारों के लिए विशिष्ट है, लेकिन अन्य ऊतकों के लिए नहीं। हमने ऐसा इसलिए किया क्योंकि जीन-फेनोटाइप स्कोर नमूनों के बीच अभिव्यक्ति में अंतर पर आधारित होते हैं; यदि विश्लेषण में शामिल सभी नमूनों में सभी जीनों की अभिव्यक्ति उच्च (या निम्न) है, तो वे भविष्यवाणी एल्गोरिदम में पर्याप्त जानकारी नहीं जोड़ेंगे। जीननेटवर्क को विकसित करने के लिए उपयोग किए गए मानव आरएनए-अनुक्रमण नमूनों के बहु-ऊतक डेटासेट का पुन: उपयोग किया गया और संसाधित किया गया जैसा कि पहले बताया गया है [6]। प्री-प्रोसेसिंग के बाद, इस डेटासेट में 31,499 नमूने और 56,435 जीन थे।
3,194 किडनी-व्युत्पन्न आरएनए-अनुक्रमित नमूने यूरोपीय न्यूक्लियोटाइड आर्काइव (ईएनए) और जीनोटाइप-टिशू एक्सप्रेशन (जीटीईएक्स) प्रोजेक्ट (नोट एस1) से डाउनलोड किए गए थे। किडनी डेटासेट की प्रीप्रोसेसिंग मल्टी-टिशू डेटासेट [6] (नोट एस2, नोट एस3) के समान ही की गई थी। नमूना और जीन चयन के बाद, 58,283 जीन और 878 किडनी के नमूने बचे थे। हमने यूएमएपी क्लस्टरिंग एल्गोरिदम (नोट एस4) का उपयोग करके शेष 878 आरएनए-अनुक्रमण नमूनों की जांच की।
एचपीओ फ़िल्टरिंग। किडनीनेटवर्क के निर्माण के लिए, हमने एचपीओ डेटाबेस [7] संस्करण 1268 से जीन-फेनोटाइप एसोसिएशन का उपयोग किया। एचपीओ डेटाबेस में, एचपीओ-परिभाषित फेनोटाइप के लिए जीन का एनोटेशन ओएमआईएम [8] रुग्णता में जीन-रोग एनोटेशन पर आधारित है। मानचित्र (26 मार्च, 2018 को डाउनलोड किया गया) और ऑर्फ़नेट [9] "en{9}}product6.xml" फ़ाइल संस्करण 1.3.1। इन डेटाबेस में जीन-रोग एनोटेशन कई कारकों पर आधारित हो सकते हैं, जिनमें सांख्यिकीय संघ और बड़े पैमाने पर प्रतिलिपि संख्या भिन्नताएं शामिल हैं। हम किडनीनेटवर्क को केवल जीन का उपयोग करके प्रशिक्षित करना चाहते थे जिसके लिए जीन और दुर्लभ बीमारी के बीच संबंध अच्छी तरह से स्थापित है। इसलिए, हमने मल्टीजेनिक सिंड्रोम को बाहर कर दिया, क्योंकि यह अक्सर स्पष्ट नहीं होता है कि कॉपी नंबर वेरिएंट में कौन से जीन किस फेनोटाइप में योगदान करते हैं। हमने मात्र संवेदनशीलता जीन (नोट S5) को भी बाहर रखा।
अभिव्यक्ति सामान्यीकरण. नमूना और जीन गुणवत्ता नियंत्रण (क्यूसी) के बाद, शेष नमूनों और जीनों की अभिव्यक्ति मैट्रिक्स को लॉग 2- रूपांतरित किया गया और अनुपात विधि के माध्य का पालन करते हुए DESeq का उपयोग करके जीन गणना को सामान्य किया गया। फिर हमने सहसंयोजकों के लिए जीन अभिव्यक्ति डेटा को सही किया (नोट S6)।

सड़न
संपूर्ण डेटासेट को फ़िल्टर करने और QC के बाद, अगला चरण डेटासेट के eigenvectors की गणना करने के लिए एक अपघटन करना था (नोट S7)। किडनी-व्युत्पन्न डेटा के आधार पर जीननेटवर्क और जीन नियामक नेटवर्क दोनों के लिए, हमने घटकों की इष्टतम संख्या को परिभाषित किया (नोट S8)। GeneNetwork के लिए पहले 165 eigenvectors और किडनी-व्युत्पन्न डेटा के लिए पहले 170 eigenvectors की पहचान की गई और सभी 335 eigenvectors वाले एक बड़े मैट्रिक्स में विलय कर दिया गया।
जीन-एचपीओ-टर्म स्कोर गणना जीन-फेनोटाइप स्कोर गणना कई चरणों में की गई थी (चित्र S5)। सबसे पहले, हमने इनपुट के रूप में संयुक्त आइजेनवेक्टर और जीन-फेनोटाइप एनोटेशन फ़ाइल का उपयोग करके एक लॉजिस्टिक रिग्रेशन किया। हमने प्रत्येक आइजनवेक्टर (नोट S9) में प्रत्येक जीन के लिए जीन लॉग-ऑड्स स्कोर की गणना करने के लिए परिणामी मूल्यों और आइजेनवेक्टर स्कोर का उपयोग किया।

पहले से एनोटेटेड जीन के जीन लॉग-ऑड्स-स्कोर की ओवरफिटिंग से बचने के लिए, हमने लीव-वन-आउट क्रॉस-वैलिडेशन दृष्टिकोण (नोट S10) लागू किया। लॉग ऑड्स को बाद में प्रत्येक फेनोटाइप (नोट S11) के लिए एक क्रमपरिवर्तित शून्य वितरण का उपयोग करके जीन जेड-स्कोर में अनुवादित किया गया था।
भविष्यवाणी की सटीकता निर्धारित करने के लिए, हमने आरओसी वक्र (एयूसी) के तहत क्षेत्र की गणना की। एयूसी की गणना अनुमानित जीन जेड-स्कोर और ज्ञात एनोटेशन का उपयोग करके प्रति एचपीओ शब्द की गई थी। भविष्यवाणियों के महत्व की गणना दो-तरफा मान-व्हिटनी रैंक परीक्षण का उपयोग करके की गई थी। बोनफेरोनी सुधार के बाद, एक भविष्यवाणी को p <{3}}.05 पर महत्वपूर्ण माना गया।
पूर्वानुमान प्रदर्शन की तुलना
हमने चार अलग-अलग नेटवर्कों के पूर्वानुमान प्रदर्शन की तुलना की: (1) मूल जीननेटवर्क, (2) अद्यतन जीननेटवर्क, (3) किडनी विशिष्ट जीन नियामक नेटवर्क जो पूरी तरह से किडनी से प्राप्त नमूनों पर आधारित है, और अंत में (4) किडनीनेटवर्क, जो संयुक्त है बाद वाले दो. इन नेटवर्कों द्वारा की गई एचपीओ भविष्यवाणियों की गुणवत्ता का मूल्यांकन प्रत्येक किडनी से संबंधित फेनोटाइप (तालिका एस 3) के लिए एयूसी के आधार पर किया गया था। एक नेटवर्क की बेहतर गुणवत्ता को किडनी से संबंधित शब्दों के लिए बेहतर भविष्यवाणी सटीकता के रूप में परिभाषित किया गया था, जिसका दो नेटवर्कों की प्रत्येक तुलना में महत्वपूर्ण रूप से अनुमान लगाया गया था और किडनी से संबंधित महत्वपूर्ण रूप से अनुमानित शब्दों की संख्या में वृद्धि हुई थी। एक नेटवर्क बनाम दूसरे नेटवर्क की भविष्यवाणी सटीकता में सुधार के महत्व का आकलन पीआरओसी आर पैकेज [11] में एकीकृत डीलॉन्ग परीक्षण [10] का उपयोग करके किया गया था।
संदिग्ध वंशानुगत किडनी रोग वाले 13 रोगियों के लिए किडनीनेटवर्क का अनुप्रयोग किडनीनेटवर्क के अनुप्रयोगों में से एक अनसुलझा किडनी रोग वाले रोगियों में उम्मीदवार जीन को प्राथमिकता देना है। इस नैदानिक अनुप्रयोग का मूल्यांकन करने के लिए, हमने GADO विधि [6] का उपयोग करके विभिन्न किडनी रोगों वाले रोगियों के लिए उम्मीदवार जीन को प्राथमिकता देने के लिए किडनीनेटवर्क का उपयोग किया। GADO HPO शर्तों के दिए गए सेट के लिए किडनीनेटवर्क के माध्यम से प्रदान किए गए जीन पूर्वानुमान z-स्कोर को जोड़ता है। प्रत्येक मरीज से जुड़े एचपीओ शब्दों के अनूठे सेट के लिए 5 से अधिक या उसके बराबर संयुक्त जेड-स्कोर वाले जीन को उस मरीज के लिए संभावित उम्मीदवार जीन माना जाता था।

चित्र 1 किडनी-व्युत्पन्न अभिव्यक्ति डेटा का यूएमएपी विज़ुअलाइज़ेशन। 878 नमूनों को तीन मुख्य समूहों में बांटा गया: स्वस्थ प्राथमिक ऊतक (मध्य और निचला), विकासात्मक नमूने (बाएं) और वृक्क कोशिका कार्सिनोमा (आरसीसी) नमूने (दाएं)। चित्र के बाईं ओर, प्राथमिक भ्रूण के नमूनों और नेफ्रॉन पूर्वज कोशिकाओं के साथ प्लुरिपोटेंट स्टेम सेल (पीएससी)-व्युत्पन्न पोडोसाइट्स और पीएससी-व्युत्पन्न ऑर्गेनोइड का समूह देखा जा सकता है। दाईं ओर, आरसीसी नमूने समीपस्थ नलिका नमूनों के करीब क्लस्टर करते हैं, और स्वस्थ प्राथमिक ऊतक नमूनों के निकटतम आरसीसी क्लस्टर में गैर-स्पष्ट सेल आरसीसी (एनसीसीआरसीसी) नमूने होते हैं। बीच में और नीचे, स्वस्थ प्राथमिक किडनी के नमूने उनके मूल ऊतक के आधार पर एकत्रित होते हैं।
अध्ययन में शामिल 13 रोगियों में मोनोजेनिक किडनी रोग होने का संदेह था, लेकिन उनका कोई आनुवंशिक निदान नहीं था (नोट S12)। इन मामलों को उनके फेनोटाइप के आधार पर एचपीओ शब्द सौंपे गए थे। प्रत्येक रोगी के लिए, संभावित रोगजनक वेरिएंट की पहचान करने के लिए CAPICE [12] का उपयोग करके संपूर्ण एक्सोम अनुक्रमण डेटा का विश्लेषण किया गया था। ग्नोमएडी पॉपमैक्स फ़िल्टरिंग एएफ वाले वेरिएंट वाले जीन [13]<0.005 and a recall ≥99%, corresponding with a mild CAPICE cut-off of ≥0.0027, were considered interesting candidates.
GADO में किडनीनेटवर्क एकीकरण द्वारा पहचाने गए जीनों को CAPICE द्वारा पहचाने गए जीनों के साथ ओवरलैप करने के परिणामस्वरूप प्रत्येक रोगी के लिए जीनों की एक सूची तैयार हुई। जनसंख्या मेट्रिक्स, भविष्यवाणी उपकरण, उपलब्ध साहित्य और अलगाव (नोट S13) के आधार पर उनकी रोगजनक क्षमता के लिए नेफ्रोजेनेसिस विशेषज्ञ पैनल (एएमवीई, एलआरसी, एनवीएएमके) द्वारा इन जीनों और वेरिएंट की मैन्युअल रूप से समीक्षा की गई थी। परिणामी उम्मीदवार जीन के लिए, एक ही जीन में वेरिएंट वाले अतिरिक्त रोगियों की पहचान सहयोगियों और 100, {2}} जीनोम प्रोजेक्ट [14] के माध्यम से की गई थी। इसके अलावा, GeneMatcher टूल [15] का उपयोग किया गया और 15 फरवरी, 2023 तक कोई अतिरिक्त मरीज नहीं मिला।
अतिरिक्त रोगियों की पहचान पहले वर्णित अनसुलझे पॉलीसिस्टिक किडनी और लीवर रोग समूह [16] का उपयोग दुर्लभ वेरिएंट (नोट एस14) का आकलन करने के लिए किया गया था। हमने gnomAD डेटाबेस [17] में गैर-फिनिश यूरोपीय लोगों के यूरोपीय उपसमूह के साथ पहचाने गए वेरिएंट की आवृत्ति की तुलना करने के लिए फिशर के सटीक परीक्षण का उपयोग किया। इसके अलावा, हमने पहचाने गए वेरिएंट (नोट S15) के आधार पर अतिरिक्त रोगियों की पहचान के लिए 100, {5}} जीनोम प्रोजेक्ट [14] का उपयोग किया।

परिणाम
डेटा पुनर्प्राप्ति और नमूना क्लस्टरिंग हमने 878 किडनी नमूने (छवि एस 2) का चयन किया, जिन्हें हमने यूएमएपी एल्गोरिदम (छवि 1) का उपयोग करके क्लस्टर और प्लॉट किया। आम तौर पर, डेटा तीन मुख्य समूहों में क्लस्टर होता है: प्राथमिक गैर-ट्यूमर किडनी डेटा, किडनी विकासात्मक नमूने, और समीपस्थ नलिका, ग्लोमेरुलस और रीनल सेल कार्सिनोमा (आरसीसी) नमूने।
किडनीनेटवर्क जीन-फेनोटाइप भविष्यवाणियों में सुधार करता है सबसे पहले, हमने जीननेटवर्क को अद्यतन एचपीओ डेटाबेस (छवि एस 6) के साथ अद्यतन किया और जीन नेटवर्क बिल्डिंग पाइपलाइन (छवि एस 7) को अनुकूलित किया। इन परिवर्तनों से पिछले संस्करण (चित्र S8) की तुलना में सामान्य जीननेटवर्क में सुधार हुआ। फिर हमने किडनी-विशिष्ट जीन नियामक नेटवर्क बनाने के लिए बेहतर पाइपलाइन का उपयोग किया। जैसा कि अपेक्षित था, छोटे नमूने के आकार को देखते हुए, किडनी-विशिष्ट नेटवर्क के इस संस्करण ने जीननेटवर्क (छवि S9) की तुलना में कम अच्छा प्रदर्शन किया। इसके बाद, किडनीनेटवर्क में जीननेटवर्क और किडनी विशिष्ट जीन सह-अभिव्यक्ति नेटवर्क के संयोजन से किडनी से संबंधित एचपीओ शब्दों के लिए हमारे सर्वोत्तम परिणाम प्राप्त हुए (चित्र 2ए; तालिका एस5)। प्रत्येक पूर्वानुमानित मार्ग के लिए पूर्वानुमान AUC, परिशुद्धता, संवेदनशीलता और f1-स्कोर प्रदान किए गए हैं (तालिका S6)
किडनी से संबंधित बेहतर एचपीओ-शब्दों के दो उदाहरण हाइपोमैग्नेसीमिया और ट्यूबलोइंटरस्टीशियल असामान्यता (चित्र 2बी) हैं। घनत्व भूखंडों में इन फेनोटाइप का विज़ुअलाइज़ेशन गैर-एनोटेटेड जीन की तुलना में ज्ञात रोग-संबंधी जीन के लिए उच्च प्राथमिकता वाले जेड-स्कोर को दर्शाता है। अज्ञात जीन के लिए, भविष्यवाणी z-स्कोर जितना अधिक होगा, उनके उम्मीदवार रोग जीन होने की संभावना उतनी ही अधिक होगी। पूर्वानुमान स्कोर के आधार पर ज्ञात रोग जीनों के जीन इंटरेक्शन नेटवर्क की कल्पना करने से जीननेटवर्क की तुलना में किडनीनेटवर्क का उपयोग करके प्राप्त इंटरैक्शन की संख्या और ताकत में वृद्धि दिखाई देती है।

चित्र 2 किडनीनेटवर्क अद्यतन जीननेटवर्क की तुलना में किडनी से संबंधित एचपीओ शर्तों के लिए बेहतर प्रदर्शन करता है। GeneNetwork की तुलना में किडनी से संबंधित 27 प्रतिशत फेनोटाइप का किडनी नेटवर्क का उपयोग करके काफी बेहतर अनुमान लगाया गया है। सबसे बेहतर फेनोटाइप्स, हाइपोमैग्नेसीमिया और ट्यूबलोइंटरस्टीशियल असामान्यता में से दो के भीतर जीन भविष्यवाणी स्कोर के बी घनत्व प्लॉट, फेनोटाइप के लिए एनोटेट किए गए जीन के लिए उच्च भविष्यवाणी मूल्य दिखाते हैं और संभावित अज्ञात उम्मीदवार जीन की भी भविष्यवाणी करते हैं। किडनीनेटवर्क का उपयोग करके पूर्वानुमानित नेटवर्क, जीननेटवर्क का उपयोग करके पूर्वानुमानित नेटवर्क की तुलना में एनोटेटेड जीन के बीच अधिक और मजबूत सहसंबंध दिखाते हैं।
हमने जीननेटवर्क (एन=63) की तुलना में किडनीनेटवर्क (एन=71) के लिए महत्वपूर्ण अनुमानित किडनी से संबंधित एचपीओ-शब्दों की संख्या में भी वृद्धि देखी है। इसने हमें यह अनुमान लगाने के लिए प्रेरित किया कि किडनीनेटवर्क समग्र रूप से उच्च सटीकता के साथ किडनी से संबंधित शब्दों की भविष्यवाणी करता है और इसलिए उच्च महत्व के साथ किडनी से संबंधित अधिक फेनोटाइप की भविष्यवाणी करने में सक्षम है। एक युग्मित टी-टेस्ट से पता चलता है कि कुल मिलाकर, एचपीओ एयूसी स्कोर किडनीनेटवर्क बनाम जीननेटवर्क के लिए काफी बेहतर था (मतलब एयूसी: 0.76 बनाम 0.74; टी-टेस्ट पी-वैल्यू: 4.5 × 10 −8 ). इस परिणाम से पता चलता है कि किडनीनेटवर्क, जीननेटवर्क की तुलना में अधिक भविष्यवाणी सटीकता के साथ अधिक किडनी विशिष्ट एचपीओ-शब्दों की भविष्यवाणी करता है।
किडनीनेटवर्क किडनी सिस्ट और लीवर सिस्ट वाले रोगियों में एक उम्मीदवार रोग जीन के रूप में ALG6 को प्राथमिकता देता है। किडनीनेटवर्क की नैदानिक उपयोगिता की जांच करने के लिए, हमने संदिग्ध वंशानुगत किडनी रोग वाले 13 रोगियों के लिए जीन को प्राथमिकता दी, लेकिन कोई आनुवंशिक निदान नहीं किया और इन्हें संभावित रोगजनक वेरिएंट वाले जीन के साथ जोड़ दिया। परिणामी जीन सूची में 13 रोगियों में से 9 के लिए 1‒4 उम्मीदवार जीन शामिल थे (तालिका S7)। एक रोगी (SAMPLE6) में, इस सूची के मैनुअल क्यूरेशन ने रोगी के गुर्दे और यकृत सिस्ट (छवि 3) को समझाने के लिए संभावित उम्मीदवार जीन के रूप में ALG6 (ALG6 अल्फा -1, 3- ग्लूकोसाइलट्रांसफेरेज़) की पहचान की। एकाधिक परीक्षण सुधार (z=5.43) के बाद किडनीनेटवर्क में आरोपित एचपीओ शर्तों के लिए एएलजी6 के लिए संयुक्त जेड-स्कोर महत्वपूर्ण था। यदि हमने GeneNetwork का उपयोग किया होता तो यह जीन छूट जाता: वहां ALG6 5 से अधिक या उसके बराबर z-स्कोर की महत्व सीमा तक नहीं पहुंच पाया।

किडनी और लीवर सिस्ट के रोगियों के लिए एक उम्मीदवार जीन के रूप में ALG6, SAMPLE6 द्वारा लाया गया ALG6 वैरिएंट c.680 प्लस 2 T > G विषमयुग्मजी है। यह एक ज्ञात रोगजनक स्प्लिस साइट वेरिएंट है जिसके परिणामस्वरूप ग्लाइकोसिलेशन (सीडीजी) प्रकार आईसी का जन्मजात विकार होता है जब रोगजनक वेरिएंट दोनों एलील्स [18, 19] पर मौजूद होते हैं। ALG6 दृढ़ता से ALG8 से मिलता जुलता है जिसे किडनी और लीवर सिस्ट फेनोटाइप्स [20] में शामिल किया गया है, और किडनीनेटवर्क के अनुसार, ALG6 और ALG8 अत्यधिक सह-विनियमित हैं (z-स्कोर=8.59)।
इस जैविक संभाव्यता को देखते हुए, हमने ALG6 में दुर्लभ वेरिएंट, MAF <{27}}.001 के लिए पॉलीसिस्टिक किडनी और लीवर रोग के 12 0 असंबंधित मामलों के एक समूह से पूछताछ की। इस समूह को मामूली रूप से अद्यतन किया गया है क्योंकि इसे पहले वर्णित किया गया था और इसे PKD1, PKD2, PRKCSH, SEC63, GANAB, ALG8, ALG9, SEC61B, PKHD1, या में फ़ंक्शन उत्परिवर्तन या रिपोर्ट किए गए रोगजनक गैर-ट्रंकिंग वेरिएंट के नुकसान के लिए एक्सोम अनुक्रमण विश्लेषण द्वारा बाहर रखा गया है। डीएनएजेबी11 [16]। तीन असंबंधित मामलों (YU372, YU378, YU481) में दुर्लभ ALG6 वैरिएंट थे; प्रत्येक में समान ALG6 c.257 प्लस 5 G > एक गैर-कैनोनिकल स्प्लिस संस्करण है जिसे ALG 6-CDG और इन विट्रो में स्प्लिस-परिवर्तन के लिए रोगजनक माना जाता है [19, 21]। एक साझा उत्परिवर्तन के बावजूद, इन तीन मामलों में प्रत्येक रिपोर्ट में संयुक्त राज्य भर के विभिन्न राज्यों से किसी भी ज्ञात प्रभावित परिवार के सदस्य को नामांकित नहीं किया गया था, और संबंधितता _पीएचआई <0.005 के साथ वीसीएफटूल्स रिलेटेडनेस2 एल्गोरिदम का उपयोग करके पता लगाने की सर्वोत्तम सीमा से असंबंधित है।
इस फेनोटाइपिक रूप से परिभाषित समूह में यूरोपीय वंश के तीन मामलों में इस प्रकार के प्रतिनिधित्व को देखते हुए, हमने मामलों के यूरोपीय उपसमुच्चय (n=105) में इसकी आवृत्ति की तुलना gnomAD [17] में कवरेज के साथ गैर-फिनिश यूरोपीय लोगों से की है। यह स्थिति (एन=64,466) [17]। रोगी समूह में 210 एलील में से 3 में यह प्रकार पाया गया, जबकि gnomAD में, किडनी या लीवर सिस्ट बोझ के संबंध में अचयनित समूह में, यह 128,932 एलील में से 121 में पाया गया था। फिशर के सटीक परीक्षण, पृष्ठ=0.0011 के अनुसार यह लगभग 10-गुना संवर्धन सांख्यिकीय रूप से महत्वपूर्ण है। यह उत्परिवर्तन एएलजी6-सीडीजी [19] के मामलों में भी बार-बार होता था।
हमने 100, 000 जीनोम प्रोजेक्ट डेटासेट [14] की भी जांच की और सहयोगियों से संपर्क किया जिन्होंने किडनी रोगों के लिए आवेदन के लिए तीन अतिरिक्त डेटा की पहचान की। संदिग्ध आनुवंशिक किडनी रोग वाले रोगियों का एक बड़ा हिस्सा आनुवंशिक निदान के बिना रह जाता है, क्योंकि कई स्थितियों के लिए रोग जीन की सूची अधूरी है। गुर्दे की बीमारी में कौन से जीन शामिल हैं, इसकी पहचान करना गुर्दे की बीमारी के रोगियों में नैदानिक उपज में सुधार करने और उपचार के तरीकों तक पहुंचने के लिए रोग रोगजनन का अध्ययन करने के लिए आवश्यक है। नवीन रोग जीन की स्थापना के लिए सावधानीपूर्वक जैविक सत्यापन की आवश्यकता होती है। ऐसी जांच के योग्य जीन को शामिल करना महत्वपूर्ण है। नेफ्रोलॉजिस्ट, क्लिनिकल आनुवंशिकीविद् या शोधकर्ताओं द्वारा WES या GWAS डेटा के संयोजन में किडनीनेटवर्क के अनुप्रयोग से इनमें से प्रत्येक समूह को जीन निहितार्थ में भाग लेने में मदद मिलेगी। किडनीनेटवर्क किडनी सैंपल डेटासेट पर आधारित एक सह-अभिव्यक्ति नेटवर्क को पहले प्रकाशित मल्टी-टिशू डेटासेट के साथ जोड़ता है जिसका उपयोग जीननेट कार्य के निर्माण के लिए किया जाता है। डेटासेट को किडनीनेटवर्क में संयोजित करने से दो अलग-अलग डेटासेट पर आधारित नेटवर्क की तुलना में किडनी रोग से संबंधित फेनोटाइप भविष्यवाणियों में सुधार हुआ। सिद्धांत के प्रमाण के रूप में, हम दिखाते हैं कि किडनीनेटवर्क द्वारा उत्पन्न किडनी और लीवर सिस्ट के संयुक्त फेनोटाइप के लिए उम्मीदवार जीन सूची ने इस फेनोटाइप वाले हमारे रोगी में दुर्लभ वेरिएंट वाले जीन की लंबी सूची से उम्मीदवार जीन की एक प्रबंधनीय सूची को प्राथमिकता दी है।
हमने 100, 000 जीनोम प्रोजेक्ट डेटासेट [14] की भी जांच की और सहयोगियों से संपर्क किया, जिन्होंने वैकल्पिक आनुवंशिक स्पष्टीकरण के बिना, एएलजी 6 में एक विषमयुग्मजी संभावित हानिकारक संस्करण ले जाने वाले गुर्दे और/या यकृत सिस्ट वाले तीन अतिरिक्त रोगियों की पहचान की।

चित्र 3 SAMPLE6 में GADO विधि में शामिल किडनी नेटवर्क, गुर्दे और यकृत सिस्ट वाला एक रोगी। एचपीओ-शब्दों "रीनल सिस्ट" (एचपी:0000107) और "हेपेटिक सिस्ट" (एचपी:0001407) के आधार पर, जीएडीओ का उपयोग करके किडनीनेटवर्क द्वारा सभी जीनों में से 89 उम्मीदवार जीन को प्राथमिकता दी गई थी। एक्सोम-सीक्वेंसिंग डेटा व्याख्या विधि CAPICE से रोगी के एक्सोम सीक्वेंसिंग डेटा में संभावित रोगजनक वेरिएंट वाले 322 जीन प्राप्त हुए। इन जीन सूचियों को ओवरलैप करते समय तीन जीनों की पहचान की गई जो चयन मानदंडों को पूरा करते थे, उनमें से एक ALG6 था।
कुल मिलाकर, हमने ज्ञात स्प्लिस साइट वेरिएंट वाले सात रोगियों की पहचान की, जो होमोज़ायोगोसिटी या कंपाउंड हेटेरोज़ायोसिटी पर गंभीर रूप से प्रभावित सीडीजी रोगियों में रोग पैदा करने वाले बताए गए थे और संभावित रोगजनक स्प्लिस साइट वेरिएंट (तालिका 1) वाले एक रोगी की पहचान की गई थी। गंभीर रूप से प्रभावित एएलजी 6- सीडीजी रोगियों (विकासात्मक देरी और कई न्यूरोलॉजिकल लक्षणों सहित बहु-अंग भागीदारी के साथ) के विपरीत, हमारे रोगियों ने कई किडनी सिस्ट और/या लिवर सिस्ट (चित्र 4) के फेनोटाइप प्रस्तुत किए। . जबकि पीसीएलडी व्यापक हो सकता है, किडनी फेनोटाइप हल्का प्रतीत होता है और अधिक उम्र के बावजूद ईजीएफआर में कोई गिरावट दर्ज नहीं की गई है (यानी एक मरीज की उम्र तीस के आसपास है, अन्य की उम्र 45 से 80 साल के बीच है)। इसके अलावा, हमने पाया कि ALG6 वैरिएंट कुछ परिवार के सदस्यों में अलग हो गया जो भी प्रभावित थे (तालिका 1; चित्र 4)।
सहायक सेवा:
ईमेल:wallence.suen@wecistanche.com
व्हाट्सएप/टेलीफोन: प्लस 86 15292862950
दुकान:
https://www.xjcistanche.com/cistanche-shop






