Title: Taalkennis, taalverwerving, en taalevolutie
1Taalkennis, taalverwerving, en taalevolutie
2Inleiding op vandaag
- Indeling van het vakgebied
- Formele structuur van taal.
- Taal in het brein software en wetware, taal en
denken. - Hoe komt taal in het brein?
- (i) eerste taalverwerving
- (ii) taalevolutie
- Literatuur Kirby (2007)
3Taal en communicatie
Spreker
Hoorder
Begrip Verstaan Horen
boodschap Formulering Spreken
spraakklanken
4Taalkennis
- Het menselijk taalvermogen is complex
- Mensen hebben veel soorten kennis over hun taal
- Kennis over productie en begrip van klanken
- Kennis over productie en begrip van woorden
- Kennis over productie en begrip van structuren
(complexe woorden, combinaties van woorden in
zinnen, combinaties van zinnen in teksten). - Die kennis is onbewust je kunt het meestal niet
uitleggen.
5Kennis van woorden
- We weten wat welk woord bij dit concept hoort.
- We weten hoe we dat woord uitspreken.
- We kunnen het woord herkennen als iemand anders
het uitspreekt. - We weten wat variaties op het woord betekenen
tafel-s, tafel-tje, tafelen.
6Kennis van wat niet kan
- Mrok kan geen Nederlands woord zijn, wrok is
dat wel. - Man de vrouw kust elke is geen Nederlandse zin,
Elke man kust de vrouw is dat wel. - Ook al weten we niet wat een flimp is of
plit, toch begrijpen we de essentie van - Elke flimp is plit
- (als iemand een voorbeeld laat zien van een
flimp weten we gelijk dat dit object de
eigenschap plit heeft)
7Taalkunde opgedeeld (1)
- Fonologie (klankleer, p/b, a/o). pak/bak/bok.
- Fonemen hebben geen betekenis, maar zijn
betekenisonderscheidend. - Fonetiek (fysische eigenschappen van spraak,
geluidsgolven, intonatie). - B.v. de klankloze k wordt in bepaalde
conteksten uitgesproken als klankhebbend, b.v.
zakdoek.
8Fysieke eisen aan spraak
- Strottenhoofd (achter in keel, waar luchtweg en
slokdarm gescheiden worden) - Stembanden (waar lucht door wordt geperst)
- Mond (tong, lippen articulatie)
Bewegende stembanden tijdens spraak
9Verlaagde larynx
- Mensen hebben een verlaagd strottenhoofd.
- Ademhaling en spijsvertering liggen daardoor
dicht bij elkaar (in verkeerde keelgat
schieten) - Babys hebben dat nog niet, en kunnen tegelijk
drinken en ademhalen. - Nodig voor praten (apen hebben dat niet, en
kunnen niet praten).
10Taalkunde opgedeeld (2)
- Morfologie (vormleer, kind/kindje,
tafel/tafels/tafelen). - Morfeem kleinste betekenisdragende eenheid.
Woordniveau. - Classificatie van morfemen naar hun rol in
grotere gehelen zelfstandig naamwoord,
werkwoord, deelwoord, lidwoord, inflectie,
derivatie..
11Taalkunde opgedeeld (3)
- Syntaxis (grammatica)
- Combinatie van woorden in grotere structurele
eenheden (naamwoordelijke constituenten,
werkwoordelijke constituenten, zinnen, ..) (boven
woordniveau, niet hoger dan zinsniveau) - hij loopt ? loopt hij?
- Jan slaat Piet ? Piet slaat Jan.
12Recursie
- Onze kennis staat oneindig veel structuren toe,
en in principe oneindig lange zinnen. - Neem Jan slaapt. Voeg daaraan toe Ik denk
dat.., Piet hoorde dat.. - De oom van een bijzonder intelligente en
succesvolle student van een bevriende professor
van mij hoorde dat Jan de auto die ik van de
broer van de buurman van mijn tandarts gekregen
heb niet wilde poetsen. - Dit spel heeft maar één regel en die luidt dit
spel heeft maar één regel en die luidt dit ..
13Indeling vakgebied (3)
- Semantiek betekenis van woorden en constructies
binnen de taal - pen/schrijven/papier (lexicale semantiek),
naar/langs/richting de rivier alle/geen/de meeste
boeken (semantiek van complexe structuren) - Pragmatiek (taal in contekst)
- ik/hier/nudeixis), mogen/moeten (implicaturen),
beleefdheid (u/jij), teksten (discourse
semantiek).
14Rode draad door alle disciplines
- Fonologie morfologie syntaxis semantiek
pragmatiek - Methode vergelijk (een aspect) van natuurlijke
taal met een formel taal. - Natuurlijke taal we hebben meestal geen complete
beschrijving. - Formele talen we hebben expliciete kennis.
- Formele eigenschappen van grammaticas.
- Denk ook aan implementaties, taaltechnologie.
15Formele structuur
- Chomsky hiërarchie indeling in klassen van
formele talen naar het type formele grammatika
dat alle talen binnen een bepaalde klasse kan
genereren. - Oorspronkelijk informatica, toegepast op
natuurlijke taal door Chomsky. - http//nl.wikipedia.org/wiki/Chomsky-hiC3ABrarch
ie
16Fonologie
- Talen hebben beperkingen op welke fonemen op
elkaar mogen volgen, b.v. mrok vs. wrok. - Japans sofuto wea (software)
- soft ? sofuto
- Vraag wat voor soort grammatica heb je hiervoor
nodig?
17Formele talen (1)
- Een formele taal is een verzameling
symbolen-rijtjes (strings) - Formele talen over het alfabet 0,1
- 01, 0101, 010101, 01010101,
- 01, 001, 0001, 00001, ..
- 01, 0011, 000111, 00001111,
- Wat is een welgevormde uitdrukking?
18Formele talen (2)
- Formele talen over het alfabet a, b, c, z
- ab, ac, ad, , abab, abac,
- sofuto, kanazawa, riku, arugato,
- Wat is een welgevormde uitdrukking?
19Formele talen (3)
- Formele talen over het alfabet Jan, Marie,
slaapt, zingt, haat, kust, - Jan slaapt, Marie zingt, Jan haat Marie, Marie
kust Jan, - Wat is een welgevormde uitdrukking?
- algoritme
20Formele grammaticas
- Een taal kun je karakteriseren door de grammatica
(automaat) die m herkent. - 01, 0101, 0101, 010101, ... finite state
- 01, 0011, 000111, 00001111, phrase structure
grammar.
21Finite state grammatica
- Hiermee kunnen we een eindige toestands automaat
bouwen voor de taal 01, 0101, 010101, 01010101,
.
22Push down automaat
- Geen eindige toestandsautomaat voor 01, 0011,
000111, 00001111, , want we moeten onthouden
dat er evenveel nullen als enen zijn
stapelautomaat. - S ? 01
- S ? 0S1
- Geheugen bestaat uit een stack last in first out.
23Recursie
- Finiete bouwstenen beperkt aantal regels ?
oneindig aantal uitdrukkingen. - Recursie in finite state sekwenties (AB)n.
ABABAB, - Recursie in contextvrije talen AnBn. AAABBB
- Phrase structure AAABBB.
24Drie klassen talen
- Reguliere grammatica (finite state)
- Contekstvrije grammatica (push down automaat)
- Contekstgevoelige grammatica (lineair gebonden
Türing machine).
25Contekstgevoelige grammatica
- Lineair gebonden automaat geheugen is tape
regels kunnen op verschillende cellen aangrijpen.
Tape is oneindig, maar alleen eindig deel
toegankelijk. - Restrictie op contekstgevoelige taal geen string
afbeelden op een kortere string dan zichzelf.
26Chomsky hiërarchie
- Elke taal die je kunt herkennen met een push down
automaat kun je ook herkennen met een eindige
toestands automaat (maar niet andersom).
Contekstvrije talen
Reguliere talen
27Formele talen en natuurlijke talen
- Veel fonologische regels kun je schrijven m.b.v.
een eindige toestandsautomaat (b.v. restricties
op foneem volgorde in Japans) - Voor syntaxis lukt dat niet minimaal phrase
structure automaat (contekstvrije grammatica). - Hebben we te maken met contekstvrije grammatica?
28Nederlands/Duits
- omdat ik Jan Piet de nijlpaarden zag helpen
voeren. - weil ich Jan Piet die hippopotamus füttern
helfen sag.
29Taal in het brein
- Taal als kennissysteem software.
- Opgeslagen in brein wetware
- Bij rechtshandige mensen vooral in
linkerhersenhelft. - Gebieden specifiek voor taal Wernickes gebied
(taalbegrip), Brocas area (spraakproductie).
30Taal uniek menselijk
- Wat is er uniek aan menselijke taal?
- Meerdere kandidaten
- (i) recursie Chomsky, Hauser and Fitch (2004)
Science. - (ii) dubbele articulatie
- (iii) parametrische variatie
- (iv) groot lexicon
Homo erectus
31Onderzoek naar taalevolutie
- Taal laat geen fossielen achter hoe doe je
onderzoek naar taalevolutie? - Vergelijkend gedragsonderzoek (communicatie bij
dieren) - Restricted linguistic systems waaruit je
conclusies trekt over taalevolutie (b.v. pidgins,
homesign) - Computationele modellering.
32Lexicon bij dieren
- Rhesusapen 3 verschillende roepen, voor
verschillende roofdieren. - http//www.wjh.harvard.edu/mnkylab/media/vervetca
lls.html - Lexicon beperkt tot 3 uitdrukkingen geen
samenstelling tot complexere uitdrukkingen.
33Lexicon bij getrainde dieren
- mensen, 6 jaar 14.000
woorden - volwassen mensen 60.000
woorden - tussen mensen opgegroeide dieren
- Washoe (chimpanzee) 250 woorden
- Koko (gorilla) 1000-2000 woorden
- Rico (border collie) 200 woorden
- Vergelijkbaar dolfijnen, zeeleeuwen, papagaaien
34Links
- Sign language used by Koko the gorilla
- http//www.koko.org/world/signlanguage.html
- Spoken language understanding by Kanzi the bonobo
- http//www.greatapetrust.org/media/video-bonobo-ka
nzi.php
35Recursie in apen
- Fitch en Hauser (2004) Tamarin monkeys kunnen
een finite state grammar leren herkennen, maar
geen contextvrije, phrase structure grammatica. - Claim phrase structure grammatica
(contekstvrij/gevoelig) uniek menselijk.
36Link
- Computational Constraints on Syntactic Processing
in a Nonhuman PrimateW. Tecumseh Fitch and Marc
D. HauserScience 16 January 2004Vol. 303. no.
5656, pp. 377 380. - http//www.sciencemag.org/cgi/content/full/303/565
6/377/DC1 - Maar vgl. recente nieuwe experimenten waar apen
het beter zouden doen. http//news.bbc.co.uk/2/hi/
8139322.stm
37Recursie in spreeuwen
- Gertner, Fenn et al. (2006), Nature motieven
(rattle, warble). Sekwenties worden herkend
in finite state grammar en contekstvrije
grammatica. - Niet alleen geheugen, generalizatie naar nieuwe
patronen regels! - Vogelzang heeft geen compositionele betekenis.
Phrase structure?
38Syllabe structuur in vinkenzang
Syllabe structuur in vinkenzang
39Link
- Recursive syntactic pattern learning by
songbirds, byTimothy Q. Gentner, Kimberly M.
Fenn, Daniel Margoliash, Howard C. Nusbaum,
Nature 440, 1204 1207. - http//www.nature.com/nature/journal/v440/n7088/ab
s/nature04675.html - Grote discussie op Language Log over
interpretatie van de resultaten.
40Universele recursie?
- Everett (2005), Science Pirahã geen syntactische
embedding. - Jan leest. Jan leest dat Marie droomt. Jan leest
dat Marie droomt dat Tom kwam. - Pirahã Jan zegt. Marie droomde. Tom kwam.
41Links
- Dan Everett (2005)
Cultural constraints
on grammar and
cognition in Pirahã,
Cultural Anthropology 46, 621-646. - More on Dan Everett http//www.llc.ilstu.edu/dlev
ere/ - More on Pirahã http//en.wikipedia.org/wiki/Pirah
C3A3_language
42Dubbele articulatie
- Fonemen zijn zelf betekenisloos, maar vormen in
combinatie betekenisvolle eenheden (morfemen,
woorden) pak/bak/bok. - Die woorden kunnen in combinatie met elkaar weer
nieuwe betekenissen uitdrukken (compositionele
semantiek).
43Voordeel van dubbele articulatie
- Door deze dubbele articulatie kunnen we met
weinig klanken toe (beperking van spraakproductie
organen), en kunnen we toch oneindig veel
betekenissen uitdrukken.
44Niet in dieren
- Spreeuwen rattles en warbles (motieven),
maar geen fonemen, geen compositionele
semantiek. - Vervet monkey calls verschillende calls, voor
verschillende roofdieren (arend, luipaard,
slang), marginale sekwentie van calls, geen
fonemen, geen compositionele semantiek.
45Parametrische variatie
- Vogelzang van spreeuwen op
verschillende geogra- fische
locaties nauwelijks verschillend. - Calls van apen overal gelijk, gebaren wel
groepsgebonden. - Mensentaal grote variatie in lexicon,
parametrische variatie in fonologie, syntaxis
(binnen UG).
46Joint attention als basis
- Mensen joint attention
- driehoek spreker-hoorder-referent.
- Hebben mensenkinderen van nature (v.a. 3
maanden). Tomasello - Bij apen veel minder ontwikkeld.
- samenwerking, vertrouwen, culturele ontwikkeling
wil tot communicatie
47Conclusie
- Groot gat tussen communicatiesystemen van dieren
(anders dan de mens) en de mens. - Hoe heeft de mens dat gat overbrugd?
- Waren er tussenstadia?
- vgl. discussie over ontwikkeling oog in
evolutionaire biologie).
48Wat heb je aan een beetje oog?
- http//www.kennislink.nl/publicaties/ogen-in-de-ev
olutie - Ogen van weekdieren
49Wat heb je aan beetje taal?
- Tussenstadium in taalevolutie prototaal.
- Evidentie komt van restricted linguistic
systems pidgins, homesign, L2 verwerving. - Eenvoudig taalsysteem, toch nuttig in
communicatie prototaal.
50Pidgin
- Pidgin zijn talen die spontaan ontstaan door
contact tussen taalgemeenschappen - Meestal wordt de taal van de meest dominante
gemeenschap vereenvoudigd - Klein lexicon, eenvoudige zinsbouw, gebruikt als
lingua franca, nooit L1. - Indien het contact aanhoudt, ontstaat een creole
wordt geleerd door kinderen.
51Hawaiian pidgin
- Ontstaan als lingua franca onder plantagewerkers.
- Grotendeels gebasseerd op het Engels. Ook invloed
van Hawaiiaans, Portugees, Cantonees, Japans. - Geen lidwoorden, geen markering van tijd, geen
copulas (is, zijn), geen markering van geslacht
(hij/zij) of getal (sg/pl).
52Hawaiian pidgin
- When time up I go to boss and say you take old
woman back now. He get verra mad, and make me pay
all up. Marie, he good woman, but talk, talk all
time, make me mad then pilikia again. - (Een Portugese immigrant, 19e eeuw.)
- Uit Hopper Traugott 2003, citerend S. Roberts
1998, citerend Vergne 1898.
53Prototaal
- Eigenschappen van prototaal
- Beperkt lexicon, mogelijk geen onderscheid tussen
naamwoorden en werkwoorden. - Simpele Predikaat-argumentstructuur (geen
kwantoren, etc.). - Rol van informatiestructuur agent first, focus
last.
54Transitie naar taal
- Prototaal ? verdere ontwikkeling van cognitie
(o.a. geheugen) ? verdere ontwikeling van taal ?
cognitie? etc. - Leerbaarheid overdracht op volgende generatie.
- Verankerd in genen? (Baldwin effect)
- Beperkt ons brein mogelijke talen door
beperkingen op leerbaarheid van taal?
55Cultuur
- Rol van cultuur begravingsrituelen, maken van
objecten zoals kralen, ontwikkeling van religie. - Taal als niche anders dan andere soorten.
- Ontwikkeling van externe geheugens schrift.
56Tot slot
- Kennis van taal is complex veel verschillende
soorten van kennis van taal. - Taalevolutie vereist interdisciplinair onderzoek
veel verschillende factoren die met elkaar
samenhangen (fysiek, cognitief, cultureel). - Om verankering taalkennis in menselijke cognitie
en ontwikkelingen als taalevolutie en
taalverwerving beter te begrijpen moeten we meer
weten van structuur van taal.