AI4D Takwimu Lab - Machine Translation Challenge
$2 000 USD
Can you translate French to Fongbe and Ewe?
340 data scientists enrolled, 71 on the leaderboard
TranslationUnstructuredNLP
18 December 2020—30 May 2021
164 days

Ewe and Fongbe are Niger–Congo languages, part of a cluster of related languages commonly called Gbe. Fongbe is the major Gbe language of Benin (with approximately 4.1 million speakers), while Ewe is spoken in Togo and southeastern Ghana by approximately 4.5 million people as a first language and by a million others as a second language. They are closely related tonal languages, and both contain diacritics that can make them difficult to study, understand, and translate.

Although those languages are at the core of the economic and social life of at least 3 major West African capital cities (namely Cotonou, Lome and Accra), they are today mostly spoken and very rarely written. Due to that fact (among other reasons), there is very little official or formal communication in those languages, leaving non-French/English speakers often unable to access critical facilities like education, banking, and healthcare. This challenge is part of an initiative that wishes to bring down the barriers between African local language speakers and modern society.

The objective of this challenge is to create a machine translation system capable of converting text from French into Fongbe or Ewe. You may train one model per language or create a single model for both. You may not use any external data, so a key component of this competition is finding a way to work with the available data efficiently.

This is a pioneer competition as far as low-resourced West African languages are concerned. A good solution would be a model that can be improved upon or used by researchers across the world to create APIs that can be integrated into day-to-day tools like ATMs, delivery applications etc., and help bridge the gap between rural West Africa and the modernized services.

This competition is one of five NLP challenges we will be hosting on Zindi as part of AI4D’s ongoing African language NLP project, and is a continuation of the African language dataset challenges we hosted earlier this year. You can read more about the work here.

L’éwé et le fon sont des langues du Niger-Congo d’un cluster de langues similaires appelé communément Gbe. Le fon est la langue la plus parlée au Bénin avec approximativement 4.1 millions d’utilisateurs. L’éwé est parlé au Togo et dans le sud-est du Ghana par approximativement 4.5 millions de personnes comme première langue et par un million d’ autres personnes comme deuxième langue. Les deux langages ont beaucoup de similarités, sont tonales et contiennent des diacritiques qui peuvent les rendre difficiles à étudier.

Bien que ces langues soient au cœur de la vie économique et sociale d’au moins capitales principales ouest africaines (Cotonou, Lomé et Accra), elles sont bien plus parlées qu’écrites au jour d’aujourd’hui. Pour cette raison (entre autres raisons), il y a très peu de communication officielle ou formelle dans ces langues, laissant les non francophones / anglophones souvent incapables d'accéder aux services fondamentaux comme l'éducation, la banque, la santé, etc. Ainsi, cette compétition s'inscrit dans une initiative qui souhaite faire tomber les barrières entre les locuteurs de langues locales et la société moderne.

L'objectif de ce défi est de créer un système de traduction automatique capable de convertir du texte du français en Fongbe ou Ewe. Vous pouvez former un modèle par langue ou créer un seul modèle pour les deux. Vous ne pouvez pas utiliser de données externes, donc un élément clé de cette compétition est de trouver un moyen de travailler efficacement avec les données disponibles.

Il s'agit d'une compétition pionnière en ce qui concerne les langues d'Afrique de l'Ouest à faibles ressources. La meilleure solution pourrait être améliorée ou utilisée par des chercheurs du monde entier pour créer des API qui peuvent être intégrées dans des outils du quotidien tels que les guichets automatiques, les applications de livraison, etc. et aider à combler le fossé entre l'Afrique de l'Ouest rurale et les services modernisés.

Ce concours est l’un des cinq défis de NLP que nous organiserons sur Zindi dans le cadre du projet NLP en langue africaine en cours d’AI4D, et est une suite de la compétition organisée sur la création de jeux de données en langue africaine que nous avons organisés plus tôt cette année. Vous pouvez en savoir plus sur le travail ici.

About Takwimu Lab (takwimulab.gitlab.io)

TakwimuLab is an association of francophone west african who are professionals and enthusiasts about AI technologies. Our goal is to spread awareness about the challenges AI can help solve in our communities, disseminate knowledge and build solutions that can resolve real issues in our countries. Takwimu Lab is based in Benin. You can keep in touch with us through on:

TakwimuLab est une association de francophones ouest-africains professionnels et passionnés des technologies de l'IA. Notre objectif est de sensibiliser aux défis que l'IA peut aider à résoudre dans nos communautés, de diffuser des connaissances et de créer des solutions capables de résoudre de vrais problèmes dans nos pays. Takwimu Lab est basé au Bénin. Vous pouvez rester en contact avec nous via:

About AI4D-Africa; Artificial Intelligence for Development-Africa Network (ai4d.ai)

AI4D-Africa is a network of excellence in AI in sub-Saharan Africa. It is aimed at strengthening and developing community, scientific and technological excellence in a range of AI-related areas. It is composed of African Artificial Intelligence researchers, practitioners and policymakers.

IAPD-Afrique est un réseau d'excellence en IA en Afrique subsaharienne. Il vise à renforcer et à développer l'excellence communautaire, scientifique et technologique dans un champ de domaines liés à l'IA. Il est composé de chercheurs, de praticiens et de décideurs en intelligence artificielle africaine.