- Latam-GPT ist ein KI-Modell, das speziell für Lateinamerika entwickelt wird, um technologischen Fortschritt und Unabhängigkeit in der Region zu fördern. Das Projekt wird unter der Leitung des chilenischen Nationalen Zentrums für Künstliche Intelligenz (CENIA) umgesetzt und strebt die Schaffung eines quelloffenen Modells an. Ein Datenkorpus von über acht Terabyte Text wurde durch 33 strategische Partnerschaften gesammelt, um ein Sprachmodell mit 50 Milliarden Parametern zu entwickeln. Latam-GPT konzentriert sich auf kulturelle Diversität und die Einbeziehung indigener Sprachen und Informationen. Die Universität von Tarapacá stellt modernste Rechenleistung bereit, um das Modell zu trainieren und weiterzuentwickeln.
Latam-GPT ist ein ehrgeiziges KI-Modell, das speziell für Lateinamerika entwickelt wird, um technologischen Fortschritt und Unabhängigkeit in der Region voranzutreiben. Unter der Leitung des chilenischen Nationalen Zentrums für Künstliche Intelligenz (CENIA) strebt das Projekt an, ein quelloffenes KI-Modell zu schaffen, welches auf lateinamerikanischen Sprachen und Kontexten basiert. Wie Álvaro Soto, der Direktor von CENIA, betont, ist dies eine kollektive Herausforderung, die die Zusammenarbeit vieler Länder und Institutionen erfordert. Latam-GPT verfolgt das Ziel, ein offenes und gemeinschaftliches KI-Modell zu entwickeln, das die kulturellen Besonderheiten und Herausforderungen der Region berücksichtigt.
Zusammenarbeit und Partnerschaften
Durch 33 strategische Partnerschaften mit Institutionen in Lateinamerika und der Karibik konnte ein Datenkorpus von über acht Terabyte Text gesammelt werden, was Millionen von Büchern entspricht. Diese riesige Informationsbasis ermöglichte die Entwicklung eines Sprachmodells mit 50 Milliarden Parametern, das vergleichbar mit GPT-3.5 ist und mittel- bis hochkomplexe Aufgaben wie Übersetzung und Assoziationen ausführen kann. Das Modell wird auf einer regionalen Datenbank trainiert, die Informationen aus 20 lateinamerikanischen Ländern sowie Spanien umfasst. Eine Besonderheit ist die Konzentration der Daten in größeren Ländern wie Brasilien, Mexiko und Argentinien, die zusammen mit Spanien den Großteil der Daten liefern.
Einbindung kultureller Vielfalt
Zur Sicherstellung einer ausgewogenen Datenrepräsentation wird auf regionale und kulturelle Diversität großen Wert gelegt. Der Fokus liegt zudem auf der Einbeziehung kultureller Informationen über indigene Völker wie die Azteken und Inkas, während in zukünftigen Versionen auch indigene Sprachen integriert werden sollen. Bereits jetzt werden Übersetzer für Sprachen wie Mapudungun und Rapanui entwickelt, um die Vielfalt der Region zu stärken. Als offene Plattform soll Latam-GPT die Möglichkeit bieten, spezifische Modelle für bestimmte Bereiche wie Bildung oder Gesundheit zu entwickeln, was die Eigenständigkeit und Autonomie der Region weiter fördern kann.
Technologische Infrastruktur und Zukunftsperspektiven
Die Universität von Tarapacá in Arica, Chile, stellt mit einem Cluster modernster NVIDIA H200 GPUs die notwendige Rechenleistung für Latam-GPT bereit. Diese Infrastruktur ist entscheidend für das Training großer Modelle und unterstützt zudem die Dezentralisierung und Energieeffizienz. Die erste Version des Modells wird noch dieses Jahr veröffentlicht und soll mit der Zeit durch neu hinzukommende Partner und Datenbestände verfeinert werden. Langfristig könnte Latam-GPT eine zentrale Rolle in der technologischen Entwicklung Lateinamerikas spielen, indem es ermöglicht, lokale Bedürfnisse besser zu berücksichtigen und regionale Besonderheiten zu reflektieren. Damit könnte die Region einen bedeutenden Schritt in Richtung technologische Souveränität machen und neue Generationen mit maßgeschneiderter Technologie fördern.