Deskriptivna analiza jezika


Autor William R. Jones

Već neko vrijeme nisam slao članke, ne zbog psihološke inhibicije blokade pisca, već zbog mojih poteškoća u pronalaženju privlačnih tema koje su kritične. Sada, iako možda pomalo pretenciozno, pišem o onome o čemu najviše znam: američkom engleskom jeziku.

Predstavljam svoj razred ESL (engleski kao drugi jezik) za odrasle sa spiskom riječi od tri slova jer je većina jednoslogova i većina naših učenika ih zna. Dakle, nastavljam da dajem po abecednom redu od “A do Z”, sa izuzetkom “Q i X”, zajedno sa lepim pratećim slikama za svaku reč. Ovi materijali dopunjuju vodič koji koristimo. Osim toga, u svakom razrednom periodu, oni dobijaju listu od 10 do 20 najčešće ili najčešće korištenih riječi sa “the” na vrhu liste. Pokrivamo samo prvih 500, za koje svaki učenik formira rečenicu sa zadatom riječju, a zatim izlazi i zapisuje je na tabli. Čitaju ga razredu i vrše ispravke.

Posebno se ističe da Brown Corpus (prva velika zbirka pisanog i govornog engleskog jezika koja se pojavila i koja se koristi za naučno proučavanje jezika) ima 57 posto tokena riječi od četiri slova ili manje, ali za izgrađene rječnike riječi od četiri ili manje znakova čini manje od 9 posto rječnika. Statistike koje stoje iza svega ovoga sugeriraju efikasnost kao i redundantnost kako bi se postigla i komunikacijska korisnost i pouzdanost, a to vrijedi za većinu jezika u njihovoj prirodnoj evoluciji.

Danas, jedan od najnovijih i najsveobuhvatnijih korpusa tekstova za američki engleski je Korpus savremenog američkog engleskog. Njegova impresivnost i dirljivost obuhvataju tekstove od 1990. do danas, s ažuriranjima koja se redovno nastavljaju s više od milijardu riječi. Na tome zahvaljujemo obradi teksta.

Svi jezici nemaju korpuse koji bi vodili lingviste, nastavnike, prevodioce i istraživače. Međutim, nije iznenađujuće i ne neočekivano za vas, korejski jezik ima nekoliko dostupnih korpusa teksta. Veoma je značajan Sejong korpus, koji je takođe poznat kao Korejski nacionalni korpus, koji sadrži desetine miliona reči. Ima ih još! Nedavno sam kroz korpuse saznao da je najčešća riječ u korejskom jeziku čestica “ui” koja se koristi za označavanje posjedovanja ili odnosa, slično engleskoj riječi “of”.

Ovisno o vašem izvoru, možda ćete otkriti da je najčešća riječ u korejskom jeziku na osnovu lista frekvencija “geot” što znači stvar ili predmet. Uobičajeni primjeri upotrebe ove riječi su: “Igeoseun mueosimnikka?” što se prevodi kao “Šta je ovo?”; i “Geugeoseun nae geosimnida”, što znači “To je moje.” Savladavanje brojnih riječi o učestalosti dat će vam čvrstu osnovu u vašim studijama jezika.

Na kraju, dajem vam povoda za razmišljanje ili, bolje rečeno, za istraživanje. Navodi se da se kompletna Shakespeareova djela sastoje od ukupno 884.647 riječi teksta koji sadrže ukupno 29.066 različitih riječi, uključujući i vlastita imena. Na vašem maternjem jeziku, da li je vaš lični leksički vokabular veći? Pretpostavljam da da, pogotovo ako ste načitani ili ste diplomirani fakultet.

Autor (wrjones@vsu.edu) je objavio novelu “Beyond Harvard” i predaje engleski kao drugi jezik.





Detaljnije na izvornom linku >>>