Naukowcy wzywają do wsparcia danych w chmurze, aby ułatwić badania genomiki

Anonim

Dzisiaj w czasopiśmie " Nature" wybitni badacze z Kanady, Europy i USA złożyli potężne wezwanie do głównych agencji finansujących, prosząc ich o zobowiązanie się do ustanowienia globalnych danych genomowych w chmurze, do których dostęp mieliby uprawnieni naukowcy z całego świata.

Zwiększyłoby to dostęp do danych dla naukowców, skróciłoby czas i koszty związane z przenoszeniem i przechowywaniem danych na lokalnych serwerach oraz przyspieszyło badania genomiczne na całym świecie. Przechowywanie danych w chmurze okazało się równie bezpieczne, jeśli nie bezpieczniejsze, niż przechowywanie ich lokalnie.

Przy typowym połączeniu uniwersyteckim pobieranie zbiorów danych z dużych międzynarodowych projektów, takich jak International Cancer Genome Consortium (ICGC), może trwać miesiące, a koszty sprzętu związane z przechowywaniem i przetwarzaniem tych danych również mogą okazać się dość kosztowne.

Dzięki przetwarzaniu w chmurze zbiór danych z dużego projektu genomu można wykonać w kilka dni za ułamek ceny.

Autorzy proponują, aby agencje finansujące zażądały, aby duże zbiory danych zostały załadowane do chmury i by płacić za ich długoterminowe przechowywanie. Dane musiałyby wówczas zostać skopiowane tylko raz, a naukowcy musieliby płacić tylko za tymczasowe przechowywanie, podczas gdy analiza była w toku. Dostęp zostałby zapewniony jedynie upoważnionym naukowcom.

"Obecnie naukowcy przenoszą dane z repozytorium na ich preferowany serwer, zamiast tracić je łatwo i tanio, za każdym razem, gdy potrzebują" - powiedział dr Lincoln Stein, dyrektor ds. Program Informatics and Bio-computing w Ontario Institute for Cancer Research, szef ICGC Data Coordination Center w Toronto i główny autor artykułu. "Zachęcamy do większych inwestycji w chmurę w celu skuteczniejszego wykorzystania funduszy publicznych i przyspieszenia tempa badań genomicznych."

"Posiadanie autoryzowanych procedur dostępu zapewnia poszanowanie życzeń dawców danych, w tym, że ich dane są wykorzystywane bezpiecznie, " powiedział dr Bartha Knoppers, dyrektor Centrum Genomiki i Polityki, McGill University. "Zastosowanie ram odpowiedzialnego dzielenia się danymi o genomie i zdrowiu jest pierwszym krokiem do uchwalenia prawa człowieka do korzystania przez obywateli z postępu naukowego i naukowców, którzy powinni być uznawani za swoją pracę".

"Złożoność biologii nowotworowej oznacza, że ​​potrzebujemy ogromnych zbiorów danych - w zasadzie im większy, tym lepszy" - powiedział dr Peter Campbell, szef zespołu Genomiki Nowotworów w Wellcome Trust Sanger Institute. "Doszliśmy teraz do etapu, w którym zbiory danych są zbyt duże, aby się przemieszczać - cloud computing oferuje nam elastyczność w utrzymywaniu danych w jednej wirtualnej lokalizacji i wyzwalaniu wszystkich badaczy na świecie razem".

"Ilość danych genomowych rośnie w zadziwiającym tempie. Przenoszenie danych i narzędzi analitycznych do chmury zdematyzuje dostęp do danych i zasobów obliczeniowych wymaganych do analizy tych danych" - powiedział dr Gad Getz, dyrektor ds. Obliczeń genomu raka Grupa analityczna w Broad Institute of MIT and Harvard. "Rozszerzony dostęp przyspieszy rozwój narzędzi, zwiększy populację badaczy analizujących te bogate zbiory danych i ostatecznie zwiększy tempo odkryć naukowych.Te oparte na chmurze platformy analityczne umożliwią również testowanie nowych rozproszonych modeli obliczeniowych, które rozszerzają zarówno skalę analizy i wyrafinowanie algorytmów obliczeniowych, a teraz budujemy pilota takiej platformy chmury. "

"Ustanowienie nowatorskich, potężnych struktur przetwarzania w chmurze, umożliwiających nam przechowywanie, udostępnianie i analizowanie danych za granicą, otworzy nowe perspektywy w badaniach nad rakiem" - powiedział dr Jan Korbel, lider grupy w Europejskim Laboratorium Biologii Molekularnej (EMBL). "Uwzględnią one rozwój nauki i polityki w zakresie dystrybucji i udostępniania zbiorów danych tak wrażliwych, jak dane genetyczne pacjentów, zapewniające bezpieczne środowisko, które służy interesom zarówno dawców, jak i badaczy".

Chmury obliczeniowe są najczęściej kojarzone z produktami konsumenckimi, takimi jak przechowywanie muzyki, zdjęć lub edycja dokumentów w czasie rzeczywistym. Ale w rzeczywistości wiele badań zostało już przeprowadzonych w chmurze, bezpiecznie i bezpiecznie. Przetwarzanie w chmurze to zasób dzielony, umożliwiający naukowcom dostęp do pamięci masowej i mocy obliczeniowej w razie potrzeby, zamiast dokonywania długoterminowych inwestycji w infrastrukturę komputerową. To również maksymalizuje wykorzystanie infrastruktury, ponieważ może być wykorzystywane przez wielu badaczy zamiast jednego.