Genomic Data Commons (GDC), платформа нового поколения, которая обеспечивает беспрецедентный доступ к данным, их анализ и совместное использование для исследований рака, публично запущенная в Чикагском университете 6 июня, открывая двери для открытий для этого сложного набора заболеваний.
GDC был запущен примерно с 4.1 петабайт данных из исследовательских программ, поддерживаемых Национальным институтом рака, включая одни из крупнейших и наиболее полных наборов данных по геноме рака в мире, такие как Атлас генома рака и терапевтически применимые исследования для создания эффективных методов лечения, и более 14 000 анонимных случаев пациентов. Один петабайт равен 1 миллиону гигабайт.
Вице-президент Джо Байден посетил операционный центр GDC в Чикагском университете перед своим выступлением, чтобы объявить о проекте на ежегодном собрании Американского общества клинической онкологии 6 июня.
Data Commons централизует, стандартизирует и гармонизирует геномные и клинические данные на единой и совместимой платформе. Исследователи рака могут получить доступ к этим данным для анализа и предоставить свои собственные наборы данных, чтобы поделиться с исследовательским сообществом. Делая высококачественные данные широко доступными, GDC предоставляет столь необходимые инструменты для ускорения исследований биологических механизмов рака и разработки индивидуализированных методов лечения для отдельных пациентов.
UChicago разработал и управляет Data Commons при финансировании NCI по субподряду с Leidos Biomedical Research в Национальной лаборатории исследования рака имени Фредерика в сотрудничестве с Институтом исследований рака Онтарио.
Разработка GDC началась в 2014 году в Центре интенсивных исследований данных (CDIS) Калифорнийского университета в Чикаго. За последние два года команда создала инновационный набор инструментов, программного обеспечения и инфраструктуры на основе проектов с открытым исходным кодом CDIS, таких как Bionimbus Protected Data Cloud, для хранения огромных объемов данных, хранящихся в GDC.
"Сегодня делать открытия на основе геномных данных рака сложно, потому что различные исследовательские группы анализируют разные наборы данных о раке, используя различные методы, которые нелегко сопоставить," сказал главный исследователь GDC Роберт Гроссман, профессор медицины и директор CDIS в Калифорнийском университете в Чикаго. "Genomic Data Commons объединяет наборы геномных данных и анализирует данные, используя общий набор методов, чтобы исследователям было легче делать открытия, и, в этом смысле, демократизирует анализ больших наборов геномных данных рака."
"Большое количество данных" признано важным для усилий по пониманию и лечению рака. Рак настолько же сложен, насколько и разрушителен. Он включает в себя множество генетических факторов, факторов образа жизни и окружающей среды и, как теперь известно, включает сотни заболеваний, каждое из которых имеет уникальные особенности, движущие силы и уязвимость для лечения. Требуются большие размеры выборки, чтобы обеспечить статистическую мощность, чтобы понять, какие комбинации лекарств эффективны против каких комбинаций мутаций, вызывающих рак.
Преодолевая барьеры
В то время как огромное количество геномных и клинических данных было собрано исследованиями, финансируемыми NCI, некоторые препятствия не позволяют исследователям в полной мере использовать их. Геномные данные из различных проектов, клинических испытаний и типов рака хранятся в разных местах с помощью местных систем управления, что затрудняет обмен данными. Для загрузки этих больших наборов данных могут потребоваться месяцы, и не все исследователи имеют доступ к сложным инструментам, необходимым для их изучения. Кроме того, разрозненные подходы к сбору и анализу, применяемые отдельными исследовательскими группами, препятствуют совместной работе.
GDC устраняет эти барьеры, объединяя наборы данных геномики рака и связанные с ними клинические данные в одном месте, к которому может получить доступ любой исследователь. Он гармонизирует данные с общим набором аналитических конвейеров, чтобы упростить изучение информации, которая в прошлом обычно была доступна в виде отдельных наборов данных, анализируемых с помощью отдельных конвейеров. Делая эти данные доступными с использованием современных вычислительных и сетевых технологий, GDC позволяет любому исследователю задавать новые и фундаментальные вопросы о раке.
GDC, созданный и управляемый командой Гроссмана из Чикагского университета, будет:
Основа будущего
В качестве первого шага в системе знаний нового поколения по раку, GDC позволяет и ускоряет усилия по выявлению как высокочастотных, так и низкочастотных мутаций драйвера рака, помогает выявить генетические детерминанты ответа на терапию и информирует о составе клинических испытаний. когорты.
GDC поможет преодолеть разрозненность, предоставив исследователям доступ к высококачественным данным, инструментам, необходимым для их совместного использования и изучения, а также поддержку в отправке их собственных данных. Он будет содержать данные из новой эры программ, которые будут секвенировать ДНК пациентов, участвующих в клинических испытаниях NCI. Эти наборы данных приведут к гораздо более глубокому пониманию того, какие методы лечения наиболее эффективны при различных формах рака. GDC будет поддерживать клинические испытания, ориентированные на отдельных пациентов, известные как "п из 1" клинические испытания, и станет важным компонентом того, как точная медицина используется для лечения отдельных пациентов.
GDC также создает основу для будущих облачных технологий, которые могут позволить исследователям анализировать крупномасштабные наборы данных и проводить эксперименты удаленно, например, с помощью пилотной программы NCI по раку. Кроме того, программное обеспечение с открытым исходным кодом, разрабатываемое CDIS, может стать моделью для интенсивных исследований по другим заболеваниям, таким как болезнь Альцгеймера и диабет, которые значительно выиграют от аналогичных крупномасштабных подходов, основанных на данных. разработать лекарства.
"Сегодня мы находимся на перепутье в том, будем ли мы располагать критической массой связанных с раком данных, необходимой для новых открытий и улучшения лечения рака," Гроссман сказал. "Я ожидаю, что со временем GDC будет играть все более важную роль в предоставлении данных, необходимых в требуемом масштабе, чтобы прецизионная медицина выполнила свое обещание."