Anzeige
Short

Der BIOSCAN-1M Insect Datensatz soll die Katalogisierung der Biodiversität von Insekten durch einen großen Datensatz von einer Million handbeschrifteter Insektenbilder unterstützen. Der kuratierte Bilddatensatz ist in erster Linie für das Training von Computer-Vision-Modellen zur Erstellung bildbasierter taxonomischer Auswertungen vorgesehen. Ziel des Projekts ist es, die maschinelle Lern-Community für Biodiversitätsforschung zu gewinnen und eine umfassende Erfassung der globalen Biodiversität voranzutreiben.

Bild: Zentrum für Biodiversitätsgenomik
Short

Forschende der University of Washington, der Carnegie Mellon University und der Xi'an Jiaotong University zeigen, dass KI-Sprachmodelle unterschiedliche politische Bias aufweisen. ChatGPT und GPT-4 von OpenAI waren am linkslibertärsten, während LLaMA von Meta am rechtsautoritärsten war. Die Firmen hinter den KI-Modellen müssten sich dieser Voreingenommenheit bewusst sein, um fairere Modelle zu entwickeln.

Bild: Feng et al.
Anzeige
Anzeige
Anzeige
Anzeige
Short

Forschende der UC Berkeley und von Microsoft Research haben Gorilla entwickelt, ein großes Sprachmodell, das sich durch die Generierung präziser API-Aufrufe auszeichnet. Dieses LLaMA-basierte Modell übertrifft andere moderne Sprachmodelle wie GPT-4, indem es das Problem der Halluzinationen entschärft und sich an Dokumentenänderungen zur Testzeit anpasst. Gorilla wurde mit umfangreichen Datensätzen von Torch Hub, TensorFlow Hub und Hugging Face trainiert.

Der Code, das Modell, die Daten und die Demo von Gorilla sind jetzt auf GitHub verfügbar, und es ist geplant, weitere Bereiche wie Kubernetes, GCP, AWS und OpenAPI hinzuzufügen.

Anzeige
Anzeige
Google News