Riesige Datenmenge von biologischen Bildern zur Verfügung gestellt Ansporn neue KI-algorithmen

Clinical-stage biotechnology Firma Rekursion angekündigt, den release des open-source-biologische dataset, RxRx1, die das Unternehmen baut seit mehr als fünf Jahren.

WARUM ES WICHTIG IST
Der Datensatz besteht aus Bildern, die in menschlichen Zellen von mehr als 1.000 experimentellen Bedingungen mit Dutzenden von biologischen Wiederholungen produziert, Wochen und Monate auseinander in einer Vielzahl von menschlichen Zelltypen.

Die Sammlung von Daten stellt eine potenziell riesige Ressource für die machine-learning-community, mit mehr als 100.000 Bildern und 300-plus Gigabyte an Daten aus unterschiedlichen biologischen Kontexten.

„Beantworten grundlegende Fragen, die sich der Biologie und der Krankheit, und reimagine die drug discovery Paradigma, bauen wir die weltweit größte, relatable, empirische biologische dataset“, sagte Rekursion CEO Chris Gibson in einer Erklärung.

Die Daten, die an mehreren Rekursion Standorten unter streng kontrollierten experimentellen Verfahren, könnte auch eine arena für Wissenschaftler arbeiten in mehreren Bereichen des Maschinen-Lern-Forschung, wie domain Adaption und k-shot-lernen – jede charge von experimentellen Daten enthält einzigartige experimentelle Variationen.

„Trotz der massiven Ausmaße dieser Datensatz repräsentiert es nur 0,4 Prozent von dem, was wir erzeugen, an die Rekursion auf einer wöchentlichen basis,“ Gibson Hinzugefügt. „Wir erwarten, dass der Reichtum dieser Datensatz, kombiniert mit der Kontext der Maßstab unserer Bemühungen, wird Sie begeistern die Welt des maschinellen Lernens und der KI-community zu helfen, uns in unserer mission zu entschlüsseln die Biologie grundlegend für ein besseres Leben.“

Gibson vorhergesagt, wenn die Freigabe hilft, damit gemeinsame Anstrengungen, neue Behandlungen, die machen würde es schneller auf den Markt bringen und mehr Unternehmen würde Anreiz, neue Medikamente zu entwickeln, die für kleinere Märkte, wie etwa den seltenen Krankheiten, wo viele Patienten immer noch mit einem großen ungedeckten Bedarf.

DER GRÖßERE TREND
Fortschritte in der machine-learning-Verfahren außerhalb des life sciences wurden bereits beschleunigt durch die Verfügbarkeit von großen öffentlichen Datensätzen, wie ImageNet und COCO, unter vielen anderen.

Wie die Initiativen, die Rekursion ist dataset zielt auf die Schaffung von Ressourcen, die helfen wird, aktivieren Sie die community, um gemeinsam zu identifizieren und zu verabschieden, die neue machine-learning-Verfahren, die zum nutzen für die gesamte life-sciences-Branche.

Die Firma relatable Datenbank von mehr als zwei Petabyte von biologischen Bildern generiert, die in-house auf der Unternehmens-Robotik-Plattform hilft aktivieren machine-learning-Ansätze zu offenbaren, Wirkstoff-Kandidaten, Wirkmechanismen und potentielle Toxizität.

AUF DER PLATTE
„Wir sind aufgeregt, um die Daten der wissenschaftlichen Gemeinde mit der ersten längs-generiert, menschliche Zelle Biologie Bild-dataset zu erleichtern, neue machine-learning-Anwendungen,“ Rekursion ist chief technology officer und chief product officer Mason Sieger sagte in einer Erklärung.

Durch die Kombination der experimentellen Biologie und automation mit AI in einem Massiv-parallelen system, Rekursion Hoffnungen auf eine Verbesserung der Effizienz Potenziale zu entdecken, Medikamente für verschiedene Indikationen, darunter genetische Erkrankungen, Entzündung, Immunologie und Infektionskrankheiten.

„Dieses dataset bietet einen tollen Spielplatz für diejenigen, die arbeiten in mehreren Bereichen des Maschinen-Lern-Forschung, wie domain Adaption und k-shot-lernen,“ sagte Berton Earnshaw, Vice President of Data Science, Rekursion. „Entwicklung von Methoden zur Berücksichtigung der nicht-zufälligen experimentellen Lärm ist etwas, das sollte von Interesse für diejenigen, die nicht nur die life-science-community.“

Nathan Eddy ist ein healthcare-und Technologie-freelancer mit Sitz in Berlin.

E-Mail der Autorin: [email protected]

Twitter: @dropdeaded209

Healthcare-IT-News ist die HIMSS Media-Publikation.