LUGHA NA PROGRAMU ZA KUTAMBUA SAUTI: IPO HAJA KUU YA KUJENGA MILIMBIKO ZA DATA/SETI ZA DATA
- Cynthia Nzuki |
- September 22, 2022 |
- Access To Information,
- Access to Knowledge,
- Artificial Intelligence,
- Uncategorized
Je, lugha ni nini? Kulingana na Kamusi, lugha ni mpangilio wa sauti na maneno unaoleta maana ambao hutumiwa na watu wa taifa au kundi fulani kwa ajili ya kuwasiliana na kujielezea. Ukizingatia maelezo haya, lugha ni moja wapo ya sehemu muhimu ya jamii yoyote. Ni njia inayotumika na watu kuwasiliana wao kwa wao, kujenga uhusiano, na kujenga hisia ya jamii. Kuna takriban lugha elfu sita mia tano zinazozungumzwa ulimwenguni leo1, na kila moja ni ya kipekee kwa njia moja au nyingine.
Lugha huturuhusu kuelezea mawazo na hisia zetu kwa wengine. Ni nyenzo inayotumika kuelezea mawazo, na hisia kwa namna ambayo watu wanaosikiliza wanaweza kuelewa na kuhusiana nayo. Baadhi ya umuhimu na matumizi ya lugha ni;
-
Dhima ya kuarifu – Dhima ya kuarifu ya lugha unaweza eleweka kama matumizi ya lugha kuwasilisha taarifa zozote. Kimsingi, kazi ya lugha ni kuwafahamisha wengine habari fulani kwa ukweli na uwazi.
-
Dhima ya kutoa maelezo – Kazi nyingine ya msingi ya lugha ni kazi ya kutoa maelezo. Haswa, hutumiwa kuimarisha ufahamu wa jambo moja au lingine kwa kutupa njia za kuwasilisha hisia, na mitazamo kuhusu jambo hilo.
-
Dhima ya kuwakilisha utamaduni na jamii – Lugha uhifadhi utamaduni na jamii. Inasaidia wengine kuelewa utamaduni wa mahali fulani na, ukweli unaojulikana ni kuwa kadiri utamaduni unavyobadilika ndivyo lugha inavyobadilika.
Dunia tunayoishi sasa imejaa teknolojia. Karibu kila sehemu ya maisha imeathiriwa, kwa njia moja au nyingine, na teknolojia. Sehemu au upande mmoja wa teknolojia unaoendelea kukua na kupata maarufu ni sehemu ya Akili Unde/Utafiti wa Akili Unde (Artificial Intelligence). Akili Unde/Utafiti wa Akili Unde ni utafiti na ukuzaji wa mifumo ya kompyuta ambayo inaweza kuiga tabia za binadamu mwenye umaizi. Ujenzi wa Akili Unde uhitaji kukusanywa kwa na kuleta pamoja milimbiko kubwa za data ambazo huchakatwa na alogaridhimu; ili kuruhusu programu maalum kujifunza kiotomatiki kutoka kwa ruwaza au vipengele vya milimbiko hizo za data. Ni muhimu pia kutaja kuwa nyanja ya Akili Unde lina nyanja zingine ndogo na kuwa zipo teknolojia kadhaa na tofauti zinazowezesha na kusaidia ujenzi wa Akili Unde.
Ukitizama programu zinazotumiwa kutambulisha sauti, kama vile ‘Alexa’ na ‘Siri’, programu hizi hutumia mifumo mbalimbali ya Akili Unde. Ukizingatia jinsi Akili Unde hujengwa, programu hizi haswa uhitaji milimbiko za data ambazo msingi wao ni lugha. Mojawapo ya changamoto kuu zinazoathiri teknolojia na programu za kutambua sauti ni ukosefu wa milimbiko tofauti za data zinazojumuisha na kuhusisha lugha mbalimbali na tofauti.
Changamoto hii ina ashiria kuwa teknolojia hii haitumikii kila mtu kwa usawa. Kwa mfano, programu kama vile ‘Alexa’ na ‘Siri’, hazina uwakilishaji wowote wa lugha hata moja ya asili ya Kiafrika.2 Hivyo basi, jukumu kuu linalo tutazama ni jukumu na lengo la kuhakikisha kuwa teknolojia hizi zinaweza tumikia kila mtu kwa usawa. Kufanikisha lengo hii ni muhimu kujua kuwa ipo pengo kuu katika aina za milimbiko za data zinazotumika, hivyo basi, kuna haja kuu ya kuunda milimbiko za data zilizo na lugha tofauti. La pili ni kuhimiza wote wanaohusika katika ujenzi wa teknolojia hizi kukusanya na kutumia milimbiko za data zinazojumuisha lugha tofauti.
Mojawapo ya mashirika yanayojaribu kushughulikia changamoto hii ya ukosefu wa milimbiko za data za lugha mbalimbali, na haswa zilizo na asili ya Kiafrika, ni Mozilla Foundation. Mradi wao wa The Mozilla Common Voice ni jukwaa linalo wapa watu fursa ya kurekodi jinsi lugha mbalimbali hutamkwa na hunenwa na kuhalalisha usahihi wa vipande vya sauti vya watu wengine.3 Rekodi hizi hutumika kutengeneza daftari za sauti ambazo hujumuishwa pamoja ili kuunda milimbiko za data za sauti zinazoweza kutumika na waundaji wa programu za sauti, kama vile ‘Alexa’ na ‘Siri’. Data hii inaweza kupatikana kwa uhuru na watu wa umma wanahimizwa kutoa sauti zao ili kujenga seti hizi za data. Jifunze mengi kuhusu mradi huu hapa.
Bila kupigania usawa, kuna uwezekano mkubwa wa kupoteza lugha na tamaduni zingine, na hilo halitakuwa sawa.
Image from Google Images as sourced from here.