Y Prosiect

RIAH thin image bar

CorCenCC logo

CORPWS CENEDLAETHOL CYMRAEG CYFOES: DULL CYMUNEDOL O ADEILADU CORPWS IEITHYDDOL

Yr Athro Tess Fitzpatrick (Adran Iaith Saesneg ac Ieithyddiaeth Gymhwysol), Steve Morris (Adran y Gymraeg) a Mark Stonelake (Academi Hywel Teifi) yw Cyd-ymchwilwyr y prosiect 42 mis hwn gwerth £1.8 miliwn a ariennir gan y Cyngor Ymchwil Economaidd a Chymdeithasol (ESRC) a Chyngor Ymchwil y Celfyddydau a'r Dyniaethau (AHRC).Arweinir y prosiect amlsefydliad hwn gan Brifysgol Caerdydd, ar y cyd â sefydliadau partner eraill, gan gynnwys Prifysgolion Abertawe, Bangor a Chaerhirfryn, a bydd yn torri tir newydd fel adnodd iaith ac fel model adeiladu corpws.  Mae dau Gynorthwy-ydd Ymchwil (un amser llawn ac un rhan-amser) ynghlwm wrth y prosiect ym Mhrifysgol Abertawe yn ogystal ag eraill yn y sefydliadau partner.

Bydd y prosiect hwn yn creu corpws sylweddol o’r Iaith Gymraeg: CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes).  Hwn fydd y corpws cyntaf erioed ar raddfa fawr i gynrychioli Cymraeg llafar, ysgrifenedig ac electronig ei natur (gan gasglu 10 miliwn o eiriau Cymraeg ynghyd mewn set ddata gychwynnol). Bydd ganddo ddyluniad ymarferol sy'n seiliedig, o'r cychwyn cyntaf, ar fewnbwn cynrychiolwyr yr holl grwpiau o ddefnyddwyr academaidd a chymunedol a ragwelir. Bydd CorCenCC yn darparu buddion cymdeithasol, economaidd ac academaidd drwy:

- Hwyluso’r defnydd o'r Gymraeg mewn sefyllfaoedd cyhoeddus, masnachol, addysgol a llywodraethol.

- Ailddiffinio cwmpas, perthnasedd ac isadeiledd dylunio methodoleg datblygu corpws.

CorCenCC project imageMae corpws yn caniatáu i ddefnyddwyr nodi ac archwilio iaith fel y mae'n cael ei defnyddio, yn hytrach na dibynnu ar reddf neu adroddiadau rhagnodol am sut y 'dylid' ei defnyddio. Mae’r dull hwn sy'n seiliedig ar dystiolaeth, yn cael ei ddefnyddio gan ymchwilwyr academaidd, geiriadurwyr, athrawon, dysgwyr iaith, aseswyr, datblygwyr adnoddau, llunwyr polisi, cyhoeddwyr, cyfieithwyr ac eraill, ac mae'n hanfodol i ddatblygiad technolegau megis cynhyrchu testun rhagfynegol, offer prosesu geiriau, cyfieithu peirianyddol, offer adnabod llais a chwilio'r we. Nid oes gan y Gymraeg unrhyw gyfleuster corpws cynhwysfawr i ddiwallu'r holl anghenion hyn.

Bydd CorCenCC yn manteisio ar ddiddordeb cymunedol cynyddol mewn cynnal a 'thyfu'r' Gymraeg, gan ddefnyddio cymorth arloesol ‘torfoli’, dull newydd, pwerus o gasglu data sydd â'r potensial i weddnewid prosesau adeiladu corpws. Caiff siaradwyr Cymraeg eu recriwtio, drwy'r cyfryngau cymdeithasol a darlledu, sioeau teithiol a rhwydweithiau sefydledig, i recordio a lanlwytho eu data eu hunain drwy ap symudol, gan gyfrannu at godio data hyd yn oed. Mae'r dull hwn yn addo cofnodi iaith gynrychioladol ar draws sawl genre, amrywiaeth iaith (ranbarthol a chymdeithasol) a chyd-destun. Bydd dulliau traddodiadol o gasglu data'n ategu'r torfoli, gan sicrhau cydbwysedd cynrychioladol o ddata fel y nodir yn nhargedau'r prosiect.

I gael mwy o wybodaeth am y prosiect, ewch i: http://sites.cardiff.ac.uk/corcencc

Aelodau'r prosiect

  • Dawn Knight Prifysgol Caerdydd (Ysgol Saesneg, Cyfathrebu ac Athroniaeth)
  • Irena Spasic Prifysgol Caerdydd (Ysgol Gyfrifiadureg a Gwybodeg)
  • Jeremy Evas Prifysgol Caerdydd (Ysgol y Gymraeg)
  • Tess Fitzpatrick Prifysgol Abertawe (Adran Iaith Saesneg ac Ieithyddiaeth Gymhwysol)
  • Steve Morris Prifysgol Abertawe (Adran y Gymraeg)
  • Mark Stonelake Prifysgol Abertawe (Academi Hywel Teifi)
  • Paul Rayson Prifysgol Lancaster (Ysgol Gyfrifiadura a Chyfathrebu)
  • Enlli Thomas Prifysgol Bangor (Ysgol Addysg)

 

Lansiad Prosiect CorCenCC