Ya están disponibles los nuevos conjuntos de datos de idiomas + preguntas y respuestas sobre el clima

Estimados colegas:

¡Estamos emocionados de compartir los conjuntos de datos financiados por Lacuna recientemente publicados en idioma! El equipo KenCorpus, una colaboración de investigadores fundada por la Universidad de Maseno, la Universidad de Nairobi y la Universidad de Africa Nazarene, ha desarrollado excelentes recursos de datos de texto y de habla de idiomas seleccionados que se hablan en Kenia. Estos conjuntos de datos fomentarán la igualdad de oportunidades, la inclusión, la participación en la toma de decisiones y la accesibilidad. ¡Obtenga más información sobre dichos recursos!

KenCorpus: Corpus de idiomas de Kenia para el aprendizaje automático y el procesamiento del lenguaje natural | Este proyecto recopiló corpus de texto y habla de tres idiomas en Kenia: kiswahili, dholuo y 3 dialectos luhya (lumarachi, lulogooli y lubukusu), incluidos géneros de textos representativos del uso cotidiano del idioma en las comunidades.
KenPos: Conjunto de datos etiquetados como parte del habla de los idiomas de Kenia | Este proyecto desarrolló un conjunto de datos etiquetados como parte del discurso de dos idiomas en Kenia: dholuo y 3 dialectos luhya (lumarachi, logooli y lubukusi).
KenHabla: Transcripciones del habla del swahili | Este proyecto posee un conjunto de datos del habla que incluye grabaciones del habla leídas y espontáneas en Kenia con hablantes nativos del swahili y las transcripciones correspondientes.
KenTranscripción: Corpus paralelos para el swahili e idiomas locales de Kenia | Este proyecto produjo corpus paralelos entre el swahili y otros dos idiomas de Kenia: dholuo y 3 dialectos luhya (lumarachi, logooli y lubukusi).
KenSwQuAD: conjunto de datos de respuesta a preguntas del idioma swahili de bajos recursos | Este proyecto propició un gran conjunto de datos de comprensión de lectura automática para el idioma kiswahili.

Agradecemos al equipo de KenCorpus por su trabajo para crear estos recursos abiertos y accesibles. También agradecemos a nuestros copatrocinadores, cuyo apoyo hizo posible estos conjuntos de datos: The Rockefeller Foundation, Google.org, el Centro de Investigación para el Desarrollo Internacional de Canadá y la agencia de desarrollo alemana GIZ en nombre del Ministerio Federal de Cooperación y Desarrollo Económicos.

Obtenga más información sobre estos y otros conjuntos de datos publicados financiados por Lacuna en nuestra página de Conjuntos de datos.

Además, ya están publicadas las preguntas y respuestas para las solicitudes de propuestas climáticas. Los documentos están disponibles en inglés, francés y español:

Inglés | Francés | Español

También puede encontrarlos en nuestro sitio web: busque los documentos en la página “Apply”/”Soumettre un project”/”Postularse” (en solicitudes abiertas en la parte inferior de la página).

¡Como siempre, gracias por participar en la misión del Fondo!

Saludos cordiales,
Secretariado de Lacuna Fund