Stability AI ist vornehmlich für den Open-Source-Bildgenerator Stable Diffusion bekannt. Doch die Firma will weitere KI-Geschäftsfelder erschließen.
Stability AI investiert in OpenBioML, eine Forschungsgemeinschaft, die sich auf den positiven Einsatz von KI in den Biowissenschaften fokussieren will. Ein Feld, in dem auch Big-Tech-Schwergewichte wie Alphabet und Deepmind Potenzial sehen. Im Vergleich zu anderen Forschungsgruppen haben diese jedoch einen viel besseren Zugang zu Rechenkapazitäten - ein ungleicher Wettbewerb.
Hier setzt OpenBioML an: Ein dezentral organisiertes Forschungslabor soll vielen Forschenden den Zugang zu Rechen- und Speicherkapazitäten ermöglichen, die bislang nur den am besten finanzierten Forschungseinrichtungen zugänglich waren. Zudem möchte OpenBioML Anreize schaffen, die fortschrittlichsten Vorhersagemodelle zu veröffentlichen.
"Wir alle können von einer verbesserten Biotechnologie profitieren, und wenn das maschinelle Lernen in der computergestützten Biologie immer mehr an Bedeutung gewinnt, müssen wir dafür sorgen, dass diese Möglichkeiten entdeckt und voll ausgeschöpft werden", schreibt die Organisation.
Bild-KI-Fortschritt für die DNA-Sequenz-Prognose
Stability AI unterstützt die Organisation mit einem bei AWS gehosteten Cluster mit mehr als 5.000 Nvidia A100 GPUs für das KI-Training. Diese Kapazität soll genügen, um bis zu zehn Alphafold 2-ähnliche KI-Modelle zu trainieren. Alphafold 2 ist Deepminds Open Source Prognose-KI für die Proteinfaltung.
BioLM arbeitet derzeit konkret an drei Projekten:
- Bei der DNA Diffusion sollen Diffusionsmodelle, bekannt von DALL-E 2 oder Stable Diffusion, für die Generierung von DNA-Sequenzen anhand von Text trainiert werden. Das Ziel sind Modelle, die anhand einer Texteingabe zelltypspezifische oder kontextspezifische DNA-Sequenzen mit bestimmten regulatorischen Eigenschaften erzeugen können. Das Projekt wird von Pathologieprofessor Luca Pinello am Massachusetts General Hospital und der Harvard Medical School geleitet.
- Im Projekt BioLM sollen Fortschritte bei der maschinellen Verarbeitung natürlicher Sprache in der Biologie und Chemie angewandt werden. In Zusammenarbeit mit EleutherAI will die Forschungsgruppe spezielle biochemische Sprachmodelle trainieren und als Open Source veröffentlichen. Die Modelle sollen eine Reihe von Aufgaben lösen können, etwa die Erzeugung von Proteinsequenzen.
- Librefold soll mehr Forschenden Zugang zu Proteinfaltungprognosesystemen ähnlich Alphafold 2 verschaffen. Das Projekt baut auf der Vorarbeit von RoseTTAFold und Nvidias OpenFold auf. Librefold soll Experimente mit verschiedenen Systemen zur Vorhersage der Proteinfaltung erleichtern. Geleitet wird das Projekt von Forschenden des University College London, Harvard und Stockholm.
Weitere Informationen und die Möglichkeit zur Teilnahme gibt es über die Webseite von OpenBioML.