Pecyn Cymorth Iaith Naturiol Cymru (WNLT)

Cefndir


Roedd Pecyn Cymorth Iaith Naturiol Cymru (WNLT) yn brosiect a ariannwyd gan Lywodraeth Cymru (2015-2016) o dan Grant Gweithredu Technoleg a Chyfryngau Digidol Cymraeg. Doug Tudhope oedd Cyfarwyddwr y prosiect, rheolwr prosiect oedd Daniel Cunliffe ac Andreas Vlachidis oedd y Cymrawd Ymchwil ar y prosiect.

Nodau


Nod WNLT yw datblygu cyfres o fodiwlau meddalwedd cod agored sy'n galluogi cymwysiadau ieithyddol cyfrifiadurol Cymraeg a chryfhau seilwaith technoleg Cymraeg gyda set o offer prosesu iaith naturiol (NLP) craidd o fewn y Porth Fframwaith.

Nod y prosiect yw

  • Galluogi siaradwyr Cymraeg a rhai di-Gymraeg o'r byd academaidd a diwydiant i ddatblygu pwrpas cyffredinol a rhaglenni pwrpasol ar gyfer amrediad o dasgau i brosesu'r Gymraeg.
  • Cyflymu'r broses o ddatblygu cymwysiadau ieithyddol a NLP cyfrifiadurol Cymraeg drwy hwyluso addasu rhaglenni sy'n bodoli eisoes o'r Saesneg i'r Gymraeg o ran echdynnu gwybodaeth a dadansoddi ieithyddol.
  • Cefnogi addysgu a hyfforddi ieithyddiaeth gyfrifiadurol ar gyfer y Gymraeg.
  • Galluogi cyflenwi allbynnau rhyngweithredu safonol y diwydiant o raglenni dadansoddi ieithyddol, gan hyrwyddo'r potensial ar gyfer gweithgareddau cydweithredol.

Amcanion


Mae'r gwaith arfaethedig yn cefnogi maes technoleg yr iaith Gymraeg gyda set o offer NLP sy'n hwyluso datblygiad datrysiadau dadansoddi testunol soffistigedig.
 
Mae prosiect WNLT yn cyflwyno pedwar modiwl NLP craidd

  • Segmentu geiriau i wahanu testun yn eiriau,
  • Pennu ffiniau brawddeg er mwyn dod o hyd i ffiniau brawddegau
  • Rhan o Dagiwr Lleferydd ar gyfer pennu rhan ymadrodd pob gair
  • Bonyn ar gyfer adnabod ffurf gwraidd geiriau.

Ar ben hyn, mae'r prosiect yn defnyddio'r modiwlau canlynol i lunio rhaglen enghreifftiol ar gyfer echdynnu gwybodaeth yn Gymraeg.

Gweithdy olaf

Cynhaliwyd gweithdy yn PDC ym mis Ebrill 2016 i drafod y canlyniadau gyda chyfranogwyr yn cynnwys cynrychiolwyr o brifysgolion Cymru a busnesau bach a chanolig, cymuned GATE NLP a CBHC.


Mae'r cyflwyniadau ar gael:

Pecyn cymorth WNLT
Cefndir
Cyflwyniad i'r prosiect


Allbynnau


Mae'r modiwlau wedi'u hysgrifennu yn JAVA ac wedi'u 'lapio' i'w gweithredu o dan fframwaith pensaernïaeth testun (Porth) cyffredinol. Fe'u lledaenir o dan drwydded gyhoeddus gyffredinol lai'r GNU (LGPL). 

Gellir lawrlwytho'r modiwlau WNLT o https://sourceforge.net/projects/wnlt/


Cynhaliwyd ail gam o'r gwaith o dan y prosiect  WNLT2.