Chers collègues,
Nous sommes très heureux de partager les ensembles de données publiés récemment et financés par le Lacuna Fund dans le domaine des langues ! L’équipe KenCorpus, une collaboration de chercheurs fondée par l’université de Maseno, l’université de Nairobi et l’université Africa Nazarene, a rassemblé de riches ressources textuelles et vocales pour certaines langues parlées au Kenya. Ces ensembles de données favoriseront l’égalité des chances, l’inclusion, la participation à la prise de décision et l’accessibilité. Découvrez les nouvelles ressources ci-dessous !
- Kencorpus : Corpus de langues kenyanes pour l’apprentissage machine et le traitement du langage naturel | Ce projet a permis de collecter des corpus de texte et de parole pour trois langues du Kenya – le kiswahili, le dholuo et 3 dialectes luhya (lumarachi, lulogooli et lubukusu), y compris des genres de textes représentatifs de l’utilisation quotidienne de la langue dans les communautés.
- KenPos : Ensemble de données avec étiquetage morpho-syntaxique pour les langues du Kenya | Ce projet a élaboré un ensemble de données à étiquetage morpho-syntaxique pour deux langues du Kenya : le dholuo et 3 dialectes luhya (lumarachi, logooli et lubukusu).
- KenSpeech : Transcriptions de la parole en swahili | Ce projet a produit un ensemble de données de la parole comprenant des enregistrements vocaux lus et spontanés, enregistrés au Kenya avec des locuteurs natifs du swahili, ainsi que les transcriptions correspondantes.
- KenTrans : Un corpus parallèle pour le swahili et les langues locales du Kenya | Ce projet a produit un corpus parallèle entre le swahili et deux autres langues du Kenya : le dholuo et 3 dialectes luhya (lumarachi, lulogooli et lubukusu).
- KenSwQuAD : Un ensemble de données questions/réponses pour le swahili, langue à faibles ressources | Ce projet a produit un grand ensemble de données de compréhension de lecture automatique pour la langue kiswahili.
Nous remercions l’équipe de KenCorpus pour son travail de création de ces ressources ouvertes et accessibles. Nous tenons également à remercier nos cofinanceurs, dont le soutien a rendu ces ensembles de données possibles : la Fondation Rockefeller, Google.org, le Centre de recherche pour le développement international du Canada et la GIZ au nom du ministère fédéral allemand de la Coopération et du Développement économiques.
Pour en savoir plus sur ces ensembles de données et d’autres ensembles de données financés par le Lacuna Fund, consultez notre page Ensembles de données.
En outre, les Q&R relatives aux appels à propositions sur le climat sont désormais publiées. Les documents sont disponibles en anglais, français et espagnol ci-dessous :
Vous pouvez également les trouver sur notre site web – cherchez les documents sur la page « Apply » / « Soumettre un projet » / « Postularse » (sous Appels à propositions ouverts au bas de la page).
Nous vous remercions une fois encore de votre soutien à la mission du Lacuna Fund !
Meilleures salutations,
Le Secrétariat du Lacuna Fund