Entdeckung der sprachlichen Vielfalt Indonesiens: FAIR Forward und Prosa.ai auf dem Weg zu inklusiver KI-Technologie
@ Eren Li von Pexels
FAIR Forward und Prosa.ai entdecken die sprachliche Vielfalt Indonesiens für inklusive KI-Technologie.
Indonesien erstreckt sich über drei Zeitzonen und ist ein Land voller Vielfalt, unterschiedlicher Geschichten und Perspektiven. Die vielen Regionalsprachen im Land werden jedoch oft unbeachtet gelassen. Es wird geschätzt, dass es über 700 Sprachen gibt, die im digitalen Raum nicht vertreten sind.
FAIR Forward und seine Partner von Prosa.ai zeigten auf der 10. International Conference on Advanced Informatics: Concepts, Theory and Applications (ICAICTA) auf Lombok, dass die Erfassung von Sprachdaten mithilfe von Künstlicher Intelligenz (KI) wichtige Voraussetzung dafür ist, damit alle Menschen am technologischen Fortschritt teilhaben können.
Prosa.ai ist ein indonesisches Start-up, das sich auf NLP-Lösungen für eine Vielzahl von Kunden spezialisiert hat, insbesondere für indonesische Sprachen. FAIR Forward und Prosa.ai sammeln Daten und trainieren Modelle für drei digital unterrepräsentierte Sprachen: Balinesisch, Bugis und Minangkabau. Das Ziel ist, lokale Anwendungen in Indonesien zu entwickeln. Zukünftig sollen weitere Regionalsprachen berücksichtigt werden.
Die Entwicklung und Anwendung von KI-Sprachtechnologie erfordern die Zusammenarbeit mit lokalen Gemeinschaften. Die Datenerfassung zeigt, wie wichtig unterrepräsentierte Sprachen für den Erhalt von Sprache und Kultur sowie für die Entwicklung von digitalen Lösungen sind, die auf lokale Herausforderungen zugeschnitten sind. „Datenannotation“ bietet auch neue berufliche Chancen für Landbewohner*innen, Frauen und andere marginalisierte Gruppen. Indem sie kurze Texte in ihrer Muttersprache schreiben, bestehende Texte übersetzen und qualitativ prüfen, tragen sie zu wertvollen NLP-Datensätzen in unterrepräsentierten Sprachen bei. Als Fernarbeit können sie solche Arbeit flexibel in ihren Alltag einbinden.
Das Publikum zeigte bei der Konferenz große Begeisterung für das Thema und wies auf wichtige Aspekte hin, wie Datengenauigkeit, Einwilligung und Datenschutz bei der Datensammlung, vor allem im indonesischen Kontext. In der Zukunft besteht Hoffnung auf weitere Zusammenarbeit mit den Anwesenden.