Title: Acmhainn
1Acmhainní Próiseála Urlabhra don Ghaeilge agus
don Bhreatnais
8ú Comhdháil do Theangeolaíocta na
GaeilgeColáiste Phádraig30 Aibreán - 1
Bealtaine 2004
- Welsh and Irish Speech Processing Resources
(WISPR) - Ailbhe Ní Chasaide
- Brian Ó Raghallaigh
- John Wogan
- Coláiste na Tríonóide
2Cúlra an Tionscadail
- Interreg IIIA
- Comhoibriú leis an mBreatain Bheag i bhforbairt
Shintéis na hUrlabhra (Téacs-go-hUrlabhra) don
Ghaeilge agus don Bhreatnais - Comhoibriú leis an mBreatain Bheag i bhforbairt
na n-acmhainní a úsáidfear i bhforbairt Shintéis
na hUrlabhra - Grúpa Urlabhra na Gaeilge Prifysgol Cymru (The
University of Wales), Bangor
3Rannpháirtithe
- Prifysgol Cymru/The University of Wales, Bangor
- Bill Hicks, Briony Williams, Delyth Prys, Dewi
Jones, and Nigel Ruddock - Coláiste na Tríonóide, Ollscoil BhÁC
- Ailbhe Ní Chasaide, Áine Ní Bhriain, Brian Ó
Raghallaigh, Christer Gobl, Irena Yanushevskaya,
Máire Ní Mhurchadha, Martha Dalton, Mika Ito,
John Duggan, and John Wogan - Coláiste na hOllscoile, BÁC
- Fred Cummins, Julie Berndsen, agus Máire Ní
Chiosáin - Ollscoil Chathair Bhaile Átha Cliath
- John McKenna agus Rónán Scaife
- Institiúid Teangeolaíochta Éireann
- Elaine Uí Dhonnchadha
4Cuspóirí (i gcás na Gaeilge)
- Corpas Gaeilge labhartha a ullmhú mar acmhainn
taighde - Dúshraith a leagadh síos le haghaidh sintéis na
Gaeilge - Bealaí a aimsiú le hacmhainn teicneolaíochta mar
seo a chur in úsáid go feidhmeach - Naisc a chothú le daoine a bhainfeadh feidhm as a
leithéid de theicneolaíocht - Oideachas Múinteoirí Gaeilge
- Daoine le Gaeilge atá faoi mhíchumas labhartha,
cloisteála agus radhairc
5Sintéis Téacs-go-hUrlabhra
TÉACS IONCHUIR
6Sintéis Téacs-go-hUrlabhra
TÉACS IONCHUIR
7Sintéis Téacs-go-hUrlabhra
TÉACS IONCHUIR
8Sintéis Téacs-go-hUrlabhra
GINIÚINT FUAIME
SRAITHEANNA A BHAINT ÓN gCORPAS
9Sintéis Téacs-go-hUrlabhra
GINIÚINT FUAIME
SRAITHEANNA A BHAINT ÓN gCORPAS
10Ullmhú Corpais
- Canúint agus cainteoir a roghnú
- Taifeadadh a dhéanamh
- Na sonraí taifeadtha (recorded data) a ullmhú le
gur féidir iad a úsáid mar acmhainn taighde
11Canúint agus Cainteoir a roghnú
- Canúint a roghnú
- Gaeilge Chonamara i dtús báire
- Cainteoir oiriúnach a aithint
- Cainteoir proifisiúnta
- Cainteoir le tuin mhaith ghutha
- Cainteoir fireann/baineann?
12An Taifeadadh a Dhéanamh
- Is gá go mbeadh an taifeadadh ar ardchaighdeán
- Coinníollacha foirfe taifeadta de dhíth
- Treallamh taifeadta den scoth riachtanach
- Suas le 15 uair a chloig de shonraí labhartha ag
teastáil don Ghaeilge
13Na Sonraí a Ullmhú
- Pacáiste oiriúnach bogearraí a roghnú leis an
gcorpas a fhorbairt - Trascríobh láimhe agus uathoibríoch a thosnú
- Rialacha trascríofa a fhorbairt
14Pacáiste Bogearraí a Roghnú
- Riachtanais
- Pacáiste Bogearraí le haghaidh anailís urlabhra
lenar féidir an tonnchruth a theascánú (to
segment) agus trascríobh a chur leis - Pacáiste Bogearraí lenar féidir a lán comhad
urlabhra a stóráil agus a eagrú i dteannta leis
na trascríbhinní a bhaineann leo, le gur féidir
anailís a dhéanamh orthu go héasca amach anseo - Réitigh
- Praat
- Emu
15Sampla ó Praat
16Trascríobh le haghaidh Sintéis
- Is gá an trascríobh a dhéanamh ar leibhéil
éagsúla - Trascríobh prosóide (lipéid IViE)
- Féach tionscadal Prosóid Chanúintí na Gaeilge
- Trascríobh fóinéimeach i dteannta le heolas
alaphóineach breise más gá - Trascríobh gramadaí (ranna cainte na bhfocal)
17Modh Trascríofa
- Modh a shocrú le haghaidh trascríobh foghraíochta
agus fóinéimeach na Gaeilge - Rialacha a shocrú maidir le giorrúcháin (a
réitíonn leis an bpacáiste bogearraí agus a
chuireann le luas an trascríofa) agus míniú na
ngiorrúchán a shonrú - Próiseas an teascánaithe a chomhshocrú agus a
chaighdeánú
18Sampla ó Praat
19Trascríobh Fóinéimeach
20Trascríobh Fóinéimeach WISPR
21(No Transcript)
22(No Transcript)
23Feidhmeanna an Chorpais Urlabhra Ullmhaithe
- Sintéis téacs-go-hurlabhra (TTS)
- Úsáid oideachasúil
- Úsáid do dhaoine atá faoi mhíchumas
- Acmhainn úsáideacha a thagann as forbairt na
sintéise - Acmhainn taighde
24Múineadh na Gaeilge
- Foghlaim idirghníomhach don Ghaeilge
- Féinteagascóirí fuaimnithe (Artificial
pronunciation tutors) - An-úsáideach nuair nach bhfuil múinteoirí le
Gaeilge ó dhúchas nó fiú Gaeilge líofa ar fáil go
héasca - Bheadh fáil ar áiseanna mar seo sa rang agus ar
an idirlíon - Bheadh éileamh ar áiseanna mar seo ag gach
leibhéal (bunscoil foghlaim aosach)
25Feidhmchláir do Dhaoine Míchumasaithe
- Uirlisí sintéis urlabhra do Ghaeilgeoirí le
- - míchumas urlabhra sintéiseoirí urlabhra
- - míchumas radhairc screen readers
- Uirlisí aithint urlabhra do Ghaeilgeoirí a bhfuil
míchumas cloisteála orthu
26Acmhainn úsáideacha
- Mar chuid dfhorbairt na sintéise déantar
forbairt ar acmhainn eile, m.sh. - Foclóir Fuaimnithe, a bheadh in oiriúint don
chanúint - Rialacha aistriúcháin ó litreacha go fuaim
(letter-to-sound)
27Taighde na Gaeilge
- Beidh an corpas féin tábhachtach le haghaidh
taighde ar Ghaeilge labhartha
28Réimse an Tionscadail
- Go bunúsach, acmhainní a fhorbairt a bhaineann le
teicneolaíocht urlabhra na Gaeilge - De bharr srianta ama, cuirfear an bhéim ar
fhorbairt an chorpais - Déanfar iniúchadh freisin ar an úsáid a bhainfidh
daoine as acmhainn mar seo amach anseo
29Amach Anseo
- An corpas a leathnú le freastal a dhéanamh ar na
mórchanúintí ar fad - An corpas a leathnú le freastal ar Ghàidhlig na
hAlban, ar an mBriotáinis
30Amach Anseo
- Ag cur le réamhiarrachtaí an Ghaeilge a ghiniúint
go sintéisiúil ó théacs - Ag cur le cruinneas an chorpais agus na
trascríbhinne le feabhas a chur ar chaighdeán na
sintéise
31Buíochas