Corpusak hizkuntza guztiek behar duten baliabidea dira eta, gaur egun, hizkuntzaren ikerketan eta hizkuntza-teknologien garapenean asko erabiltzen dira. Corpusak formatu elektronikoan eta linguistikoki etiketatuta (hau da, hitz bakoitzari dagokion lema, kategoria, etab. emanda) dauden testu-bildumak dira. Oso baliabide garrantzitsua dira hizkuntza-teknologiak garatzeko, hiztegiak egiteko, hizkuntza bera arautzeko, itzulpenetan laguntzeko, eta hainbat gauzatarako. Azken finean, corpusek hitzen erabilera errealaren inguruko informazioa ematen digute.
Corpusen azterketa hau egiteko aukeratu ditugun corpusak Corpeus, internet euskarazko corpus gisa eta Euskararen Corpusa izan dira, euskal corpus orokorrak direlako aukeratu ditugu, hau da ez dira gai zehatz bati buruzko corpusak. Corpeus corpusa Elhuyar Fundazioko I+G taldeak garatua da, EHUko Informatika Fakultateko IXA Taldearen laguntzarekin, eta honek egiten duena Internet euskarazko corpus gisa erabiltzeko aukera ematea da, corpus hau beti ari da eguneratzen eta edukia gehitzen; beraz, hitz berrienak ere kontsulta daitezke. Euskararen Corpusa UZEI elkarteak egindako XX. mendeko euskararen corpus estatistikoa da. Corpus estatistikoaren oinarria, hainbat irizpideen arabera sailkatutako XX. mendeko euskal argitalpenen inbentario osoa da. Esan beharra dago, euskara idatzia dela hemen jasotzen dena, ez ahozkoa. Bi corpusak pixka bat aurkeztu ondoren, has gaitezen azterketarekin.
CORPEUS, internet euskarazko corpus gisa
1. IZEN BATEN BILKAETA
Etxe izena aukeratu dugu corpusetan bilaketa egiteko, izan ere, oso erabilia eta emankorra da. Hauek dira etxe izena sartuta bilaketak egiteko modu desberdinak:
- 1. modua
a) “Zer” atalean lema markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan, guk nahi dugun izena jarriko dugu, kasu honetan, etxe.
c) “Analisia” atalean, izena dela argi utzi behar dugu.
d) “Motorra” laukitxoan, non bilatu nahi dugun jarriko dugu. Lehenengo saiakera honetan Google markatu dugu bilaketa egiteko.
Emaitzak:
Lehenik eta behin esan behar dugu bilaketa guztien emaitzak alda daitezkeela bilaketa egiten dugun bakoitzean, corpusa etengabe berritzen delako. Ematen duen informazioa oso ugaria da, ez baikara etxe hitzera soilik mugatzen, etxe daukaten hitz guztiak agertu zaizkigu: hitz eratorriak, hitz elkartuak edota izena deklinatuta. Corpusa gai da guk etxe hitza sartuta honen forma deklinatu eta barianteak emateko. Oso emaitza zabala lortu dugu:
-8 orrialde etxe izenarekin
-114 agerpen
-71 baliozkoak
Hauek dira formaren arabera kopuruari buruzko datuak:
etxe | 22 |
etxeko | 21 |
etxea | 12 |
etxeen | 4 |
etxeak | 4 |
etxearen | 3 |
etxeei | 2 |
etxez | 1 |
etxeari | 1 |
etxeekin | 1 |
Guztira | 71 |
Honen adibideak ikusteko: http://www.corpeus.org/cgi-bin/kontsulta.py
- 2. modua
a) “Zer” atalean lema markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan etxe idatziko dugu.
c) “Analisia” atalean, izena dela markatuko dugu.
d) “Motorra” laukitxoan, bigarren saiakera honetan Bing markatu dugu Google beharrean.
Emaitzak:
Kasu honetan ere, ez gara etxe hitzera soilik mugatzen eta honen deklinazioak etab. agertzen zaizkigu.
-10 orrialde
-163 agerpen
-51 baliozkoak
Hona hemen formaren arabera kopuruari dagozkion datuak, ikus daiteke Bing bilatzaileak formei dagozkienez ematen dituen emaitzak ez direla Google-k ematen dituenak bezain ugariak:
etxe | 18 |
etxeak | 13 |
etxea | 10 |
etxeko | 8 |
etxearen | 1 |
etxeek | 1 |
Guztira | 51 |
Honen adibideak ikusi ahal izateko hemen klikatu: http://www.corpeus.org/cgi-bin/kontsulta.py
- 3. modua
a) Kasu honetan, “Zer” atalean lema markatu beharrean, forma jarriko dugu.
b) “Bilatu” jartzen duen laukitxoan etxe idatziko dugu.
c) “Analisia” atalean, izena dela markatuko dugu.
d) “Motorra” laukitxoan, bilaketa Google-k egitea eskatuko dugu.
Emaitzak:
Etxe hitzaren forma daukaten sarrerak agertu zaizkigu, hau da, deklinatu gabe.
-8 orrialde
-54 agerpen
-22 baliozkoak
Honen adibiderik ikusi nahi izatekotan, hona hemen orrialdera eramaten duen esteka: http://www.corpeus.org/cgi-bin/kontsulta.py
- 4. modua
a) Kasu honetan, “Zer” atalean lema markatu beharrean, forma jarriko dugu.
b) “Bilatu” jartzen duen laukitxoan etxe idatziko dugu.
c) “Analisia” atalean, izena dela markatuko dugu.
d) “Motorra” laukitxoan, orain Bing-en egingo dugu bilaketa.
Emaitzak:
-10 orri
-106 agerpen
-23 baliozkoak
Saiakera honen emaitzak orrialdean ikusi ahal izateko esteka hau jarraitu: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
2. ADITZ BATEN BILAKETA
Jakin aditza aukeratu dugu bilaketa egiteko. Hemen ere modu ezberdinetan egingo dugu bilaketa:
- 1. modua
a) “Zer” atalean lema markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan, guk nahi dugun aditza jarriko dugu, kasu honetan, jakin.
c) “Analisia” atalean, jakin aditza jarri dugu.
d) “Motorra” laukitxoan, non bilatu nahi dugun jarriko dugu. Lehenengo saiakera honetan Google markatu dugu bilaketa egiteko.
Emaitzak:
-8 orrialde
-58 agerpen
-51 baliozkoak
Hemen forma bakoitzeko kopuruak agertzen zaizkigu:
jakin | 23 |
jakitea | 9 |
jakiteko | 9 |
jakina | 7 |
jakite | 2 |
jakipen | 1 |
Guztira | 51 |
Honen adibideak ikusi ahal izateko: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
- 2. modua
a) “Zer” atalean lema markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan, guk nahi dugun aditza jarriko dugu, kasu honetan, jakin.
c) “Analisia” atalean, jakin aditza markatu dugu.
d) “Motorra” laukitxoan, non bilatu nahi dugun jarriko dugu. Bigarren bilaketa honetan Google-n ordez Bing-en egingo dugu bilaketa.
Emaitzak: argi ikusten da bilaketa Bing-en eginez gero emaitzak ugariagoak direla.
-10 orrialde
-342 agerpen
-325 baliozkoak
Jakin aditza deklinaturik agertutako kopuruak:
jakin | 282 |
jakina | 14 |
jakiteko | 9 |
jakitea | 7 |
jakiten | 3 |
jakinda | 3 |
jakinik | 2 |
jakingo | 2 |
jakitean | 1 |
jakiteak | 1 |
beste guztiak | 1 |
Guztira | 325 |
Honen adibideak ikusteko, klikatu: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
- 3. modua
a) “Zer” atalean lema markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan jakin aditza jarri dugu.
c) “Analisia” atalean, jakin aditz trinko gisa bilatuko dugu.
d) “Motorra” laukitxoan, kasu honetan Google-n egingo dugu bilaketa.
Emaitzak:
-8 orrialde
-72 agerpen
-53 baliozkoak
Forma bakoitzeko kopuruei dagokionez:
dakit | 24 |
jakin | 10 |
dakigu | 7 |
daki | 6 |
dakite | 3 |
dakizu | 2 |
dakizki | 1 |
Guztira | 53 |
Saiakera honen adibideak ikusteko: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
- 4. modua
a) “Zer” atalean lema markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan jakin aditza idatziko dugu.
c) “Analisia” atalean, jakin aditz trinko gisa bilatuko dugu.
d) “Motorra” laukitxoan, laugarren bilaketa honetan Google-n ordez Bing-en egingo dugu bilaketa.
Emaitzak:
-10 orrialde
-52 agerpen
-46 baliozkoak
Aditz forma ezberdinen kopurua:
dakit | 21 |
jakin | 9 |
daki | 7 |
dakigu | 6 |
dakite | 2 |
dakizu | 1 |
Guztira | 46 |
Honen adibideak hemen ikus daitezke: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
- 5. modua
a) “Zer” atalean lema beharrean forma markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan jakin aditza idatziko dugu.
c) “Analisia” atalean, jakin aditza bilatuko dugu.
d) “Motorra” laukitxoan, bilaketa honetan Google erabiliko dugu.
Emaitzak:
-8 orrialde
-20 agerpen
-20 baliozkoak
Kasu honen adibideak ikusteko esteka hau jarraitu: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
- 6. modua
a) “Zer” atalean lema beharrean forma markatuko dugu.
b) “Bilatu” jartzen duen laukitxoan jakin aditza idatziko dugu.
c) “Analisia” atalean jakin aditza bilatuko dugu.
d) “Motorra” laukitxoan, bilaketa honetan Bing erabiliko dugu Google-n ordez.
Emaitzak: Bing-ek eskeintzen dituen emaitzak Google-k eskeintzen dituenak baino ugariagoak dira.
-10 orrialde
-433 agerpen
-395 baliozkoak
Honen adibideak ikusi nahi izatekotan hemen klikatu: http://corpeus.elhuyar.org/cgi-bin/kontsulta.py
EUSKARAREN CORPUSA
Corpus hau euskaltzaindiaren corpus bat da eta 2002. urtekoa da egin zaion azken modifikazioa. Corpus honek testu- hitzak edo lemak bilatzeko aukera ematen du. Esan beharreko gauza da corpusak ez duela hitzen kategorien arteko bereizketarik egiteko baliabiderik, berak hitzaren kategoria zein den berdin izango zaigu bilaketa egiterako orduan. Hala ere, beste corpusean erabilli dugun metodologia jarraituz, honetan ere bilaketa bi ataletan banatuko dugu.
1. IZEN BATEN BILAKETA
- 1. aukera
“Lema(k)” aukera hautatu eta ”Hitz bat” jartzen duen lekuan klikatzen badugu eta etxe izena bilatzen badugu, hurrengo hau izango litzateke emaitza:
1. 1900-1939 Bizkaiera Ikasliburuak Euskeraz irakurteko 0042 Gure amak yosten diardu etxean.
2. 1900-1939 Bizkaiera Literatur prosa BAizk Ipuin 0083 Urijaz aiztu zan, eta azkenez, bere etxian baxen pozik eguan.
3. 1900-1939 Bizkaiera Ikasliburuak Euskeraz irakurteko 0046 Andoni’k.- Etxe osteko lizarretan.
4. 1900-1939 Bizkaiera Saio-liburuak K. Basabe 0063 – “Suaz, ba, ezquer asco zor deutsaguz eche orrerita”.
5. 1900-1939 Bizkaiera Literatur prosa Or Tormes 0011 Abade ta praille, batak txiroai ostuten deutse, ta besteak etxetik atsotxuentzat ataraten dabe.
6. 1900-1939 Bizkaiera Literatur prosa E. Bengoa 0003 Biyen bittartian, echeko guztiak maiyen alderdi biyetan zutunik dagoz ichoroten arik eta asabak eurena jan deiyen artian.
7. 1900-1939 Bizkaiera Literatur prosa E. Bengoa 0003 Orduen echeko guztiak belaunikoturik egiten deutzee asaben arimari adoraziñoia, eta eurak ill-errira utsik biurtu ezteizen, erreten deutzeez (au da illen giro-mutuo) diru-paperak (olan derichoe, baia eztira benetakoak) oneen ustez, andikaldian be dirudunak obeto bizi eidiralako.
8. 1900-1939 Gipuzkera Saio-artikuluak Muj 0538 Biotz-biotzez maite du euskaldunak bere etxea.
9. 1900-1939 Gipuzkera Saio-artikuluak Muj 0539 Elizanburu’k ere maite zuan bere etxea.
10. 1900-1939 Gipuzkera Saio-artikuluak A Lamiak 0101 Etxera itzultzean eztezanala gibela begiratu
Adibide guzti hauetan, etxe izena agertzen den liburu, artikulu edota testuan agertzen zaizkigu. Izena bere horretan, deklinaturik edota forma zaharrean ere bilatzen du corpus honek.
Aipatutako adibideez gain beste asko daude, gehiago ikusi nahi izatekotan hemen klikatu: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
- 2. aukera
Beste aukera bat, lema bilatu beharrean testu- hitzak bilatzea da. Honetarako, lehenengo laukitxoan “Testu- hitza(k)” aukeratu eta lehengo moduan, “Hitz bat” jartzen duen laukitxoa berdin utziko dugu. Hurrengo hau da lortutako emaitza:
1. 1900-1939 Bizkaiera Saio-artikuluak Euzkadi 1908 0081 ¡A! ¡duinge zantarrak eta duinge zantarrak! ¡Jagiko alda aberrtzale arrtetik etxe-arerijo orrei lepasur diru-aurrian duingero makurrtu ori zigorr gogorraz auzi ta trisketan dautsenen bat! Orren okerrez, atsebakotu gadixan Aberrijaren atze baga-aldijetan, eta atseginez bete gadixan bere atsegin-aldijetan.
2. 1900-1939 Bizkaiera Ikasliburuak Euskeraz irakurteko 0046 Andoni’k.- Etxe osteko lizarretan.
3. 1900-1939 Bizkaiera Literatur prosa BAizk Ipuin 0031 Aldi atan Marte bere guraso ta nebearekin bixi-zan iturrmendi zarran, gaurr etxe-ondakiñak baño eztan Iurrmendi zarran.
4. 1900-1939 Bizkaiera Literatur prosa Ag Kr 0117 Benetan egoan ondo, ta neskame izatekotan, ezeukean egundo etxe atatik beste batera urtengo.
5. 1900-1939 Bizkaiera Literatur prosa Ag Kr 0117 – Ementxe bertan, aurreko etxe onetantxe.
6. 1900-1939 Gipuzkera Saio-artikuluak Muj 0539 ¿Nork ez dakizki buruz neurtitz aiek?¿Nork ez ditu bein baño geiagotan erestu?¿Nor ez da neurtitz aiezaz oroitu etxetik urruti gogoa etxe aldera biurtzean?¡Etxea! Izen dontsu-dontsu ta gozoa.
7. 1900-1939 Gipuzkera Saio-artikuluak Muj 0539 Bi idi aundi mendian, bildotxak, beiak, auntzak, ardiak… Etxe ura ordea, bere-berea zuan, bere sorlekua, aiten-aitak autatua.
8. 1900-1939 Gipuzkera Saio-artikuluak F. Urkia 0007 Etxe askotan labeko atakak sukaldean jotzen du.
9. 1900-1939 Gipuzkera Saio-artikuluak F. Urkia 0007 Beste batzuk etxe-ondoko legorpetxo batean.
10. 1900-1939 Gipuzkera Saio-artikuluak JBDei 1922 0253 – Asarre zeuden igeltzeroak, lanian ari ziran etxe arretako etxeko-andreak, amarretakorik etzietela ematen eta.
Kasu honetan, etxe izena agertzen den testuak aipatzen dira adibide hauetan baina bere horretan soilik egiten da bilaketa; ez da izen hau deklinatuta agertzen bilaketa honetan.
Adibide guztiak ikusi ahal izateko: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
- 3. aukera
Bestalde, corpus honek izena esaldiaren hasieran, amaieran edo tartean bilatzeko aukera ere ematen du. Horretarako, bilaketa egiterakoan lehen “Hitz-bat” aukeratu dugun lekuan, orain “Hasieran”, “Bukaeran” edo “Tartean” aukeratuko dugu. “Lema(k)” hautaturik, (gauza berbera egin daiteke “Testu hitza(k)” aukeratzen badugu ere) esaldiaren hasieran aukeratzerakoan hauek dira emaitzetako batzuk:
1. 1900-1939 Gipuzkera Saio-artikuluak F. Urkia 0007 Etxe askotan labeko atakak sukaldean jotzen du.
2. 1900-1939 Bizkaiera Literatur prosa Echta Jos 0035 Etxe onek eukazan eskaratz edo sukalde ona, iru logela nasaiak, berbaleku txikitxo bat, sabai ta goianengo zabalak eta korta eder bi, abelgorri ta ardientzat; baita etxe aurrean egozan laba-gela ta oillatoki onak euren teillatuakaz.
3. 1900-1939 Gipuzkera Literatur prosa Elizondo Loretegi 0186 Etxe batekoak, gosaria egiteko esnea egunero erosten zioten, eta neskamea zintzo-zintzo etortzen zan, garai jakiñean, esne billa.
4. 1900-1939 Gipuzkera Antzerkia Lab 0019 Etxe. – Baietz, lapurra! Nik ikusi det sartzen-da.
5. 1900-1939 Gipuzkera Antzerkia Lab 0019 Etxe. – (igesi itzuliaz) Ai! ai!.
6. 1900-1939 Gipuzkera Antzerkia Lab 0019 Etxe. – Nik ez ba.
7. 1900-1939 Gipuzkera Antzerkia Lab 0019 Etxe. – Ni ametsetan eta lapurra or barruan.
8. 1900-1939 Gipuzkera Antzerkia Lab 0019 Etxe. – (Aundi-mandi’ri besotik elduta) Ez zabaldu ez!.
9. 1900-1939 Gipuzkera Antzerkia Alz Osaba 0015 Etxe au izan danarekin….
10. 1900-1939 Sailkatu gabeak Egunkariak El Día 1934 0001 Etxe gutxitan utzi zayote pakian ta ortatik dator oyen igas egitea gure aldetik.
Adibide guztiak ikusteko: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
Esaldiaren bukaeran etxe hitza bilatzerakoan hurrengo hauek lirateke emaitzetako batzuk:
1. 1969-1990 Gipuzkera Saio-liburuak D. Garmendia 0106 Gaurko Arantzazu bere pelota-leku, automobillentzako leku zabal, prailegaien etxe….
2. 1969-1990 Euskara Batua Saio-liburuak NekazArkit 0500 <hi type=”caption”>Lasernan altxatzen diren zenbait etxe</hi>.
3. 1991-1999 Sailkatu gabeak Aldizkariak A. Loidi 0018 ETXERIK ETXE
4. 1991-1999 Sailkatu gabeak Aldizkariak E. Otamendi 0006 Gainera, hiru polikiroldegiren eraikuntza jarri dugu martxan, zaharrentzat lau egoitza eta bi zahar etxe.
5. 1991-1999 Bizkaiera Literatur prosa J.M. Etxebarria 0036 Orduan, herriko gazteak eta, alkar hartu, eta etxe-errearena batzen joaten ginen etxerik etxe.
6. 1991-1999 Euskara Batua Saio-artikuluak Peillen 0015 Turismoaren aldetik duela hogei bat urte Zuberoako Sindikatak mendi-herrixka bat eraiki zuen Iratin, orain mozkinemaile dena, asko iretsi ondoren (50. bat etxe).
7. 1991-1999 Euskara Batua Saio-artikuluak J. Cillero 0023 Eta etxekoiak gezalagoak, ordea: Steve, Darrel, Bryon, Charlie (taberna du etxe)…
8. 1991-1999 Sailkatu gabeak Aldizkariak Aretxagazeta 1996 0012 <head>Zazpi mendi etxe</head>
9. 1991-1999 Bizkaiera Literatur prosa L. Ayesta 00099 Urtearen asierako lenengo egunean, Urte Barri goxean, eguna zabalduaz beste barik, soñeko arropa barriak jantzirik, oñetako eta guzti, joaten ginean umezko guztiak iru-lau moltsotan, ze orduko sasoian famili andiak ginean danok, eta esate baterako amar urtetik berakoak, limosna bila etxerik etxe.
10. 1991-1999 Sailkatu gabeak Egunkariak Euskadi Inf 1999 00005 Irungo lurretan hasitako sute batek arriskuan jarri zituen bertako zenbait baserri eta etxe.
Adibide guztiak ikusteko: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
Eta azkenik, esaldiaren tartean bilatzerakoan, ez da emaitzik ageri, izan ere, hitz bat baino gehiago idatzi behar dira koma bidez banatuak emaitzen bat lortu ahal izateko.
- 4. aukera
Corpus honek bilaketak ordenatuta edo ordenatu gabe egiteko baliabideak ere eskaintzen ditu. Horretarako egin beharrekoa, “Ordenatuta” jartzen duen laukitxoan klikatzea izango litzateke eta kontrako bilaketa egiteko, “Ordenatu gabe” dakarren laukitxoan klikatzea.
- 5. aukera
Beste baliabide bat idatzitako hitza garbitzeko aukera ematen duela da. Honetarako ere, “Garbitu” jartzen duen laukitxoa dugu eta hor klikatzeaz batera, lehenago bilaketa egiteko idatzitako hitza garbitu egingo da hitz berria idazteko laukitxoa garbi utziz.
- 6. aukera
Aukera bezala jarri ditugun adibideetan “Epea“, “Euskalkia” eta “Testu-mota” aukeretan guztia da guk markatuta eduki duguna, baina aukera gehiago daude. Bilaketak epe baten barruan egitea ere ahalbidetzen du corpus honek. Ezkerreko lehenengo laukian urte tarte batzuk ageri dira eta horietako batean klikatuz, bilaketa zehatzago bat egitea ahalbidetzen du. Honez gain, lauki honen beheko aldean beste bat dago eta hemen euskalkia zehazteka ahalbidetzen da eta azkenik, hirugarren laukiak testu-motak zehazteko aukera ematen du, hala nola, testu artikuluak, saio-liburuak… etab.
2. ADITZ BATEN BILAKETA
Jakin aditza aukeratu dugu bilaketa hau egiteko eta aurreko izenarekin konparatzeko.
- 1. aukera
Lema moduan bilaketa eginez hauek dira jasotako emaitza batzuk:
1. 1900-1939 Bizkaiera Saio-artikuluak Eguzk ItzBik 0595 Erronkarin-edo izan ezik (eta an be -d-, -r- ala besterik dan ziur ez dakigu) euskal-itzen amayan -d- rik ez datorr: -t, ostera, sarritan: augaitik euskaldunak, euren aboskiñen azturari jarraituaz beste barik, azken gediña kendu ezkero, gelditzen ziran -d oro -t izatera itzuli ebezan.
2. 1900-1939 Bizkaiera Literatur prosa E. Bengoa 0003 Oiñ kontu gero zeure berbakin; gaurko arratsaldian da gabian, eta biyer, etzi ta etzigaramon itz eztitsuak eta atsegiñez betiak baño ezin esan leizela biarbada zuek eztozue jakingo-ta.
3. 1900-1939 Bizkaiera Administrazio-idazkiak Jauparijak 0008 c) Bere GUDAL-JAUPARIEN aldentzeko baimenak jakin bear dauz, geiegi ugaritu ezdaitezan, eta beti, aldendu danaren ordezkoa jarriaz.
4. 1900-1939 Bizkaiera Saio-artikuluak Zam 0025 <head>¡JAKIN BANEU..!</head>.
5. 1900-1939 Bizkaiera Saio-artikuluak Zam 0027 Ainbeste adiskide daukadaz, alkarregaz, neuk jakin barik, aide edo senide diranak, ze….
6. 1900-1939 Bizkaiera Saio-artikuluak JBDei 1923 0097 – Gizona! Nondik nora ezer be jakin barik, griego edo ijito usaña susmaten neutzen nik.
7. 1900-1939 Bizkaiera Literatur prosa BAizk Ipuin 0058 Arrantza-salletan beste edozeñek baño geyago edo-daki.
8. 1900-1939 Bizkaiera Literatur prosa BAizk Ipuin 0083 ¿Zelan ixan leike ori, bere atteak euzkeraz ekijan-eta?.
9. 1900-1939 Bizkaiera Saio-artikuluak Euzkadi 1908 0080 Ez dakit onddiño selango azazkundia emongo dautsedan idazkun onei, baña beti ixango dira, bilddurr barik, Euzkadi-mattetasunaren inddarrez neure buruban sorrtu ta errniak.
10. 1900-1939 Bizkaiera Saio-liburuak Eguzk GizAuz 0130 An naste-borraste andia dabillela badakigu-ta, gizartekeri ta baltsakeria be nastean dabiltzala esango neuke.
Gainontzeko adibideak ikusteko hemen klikatu: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
- 2. aukera
“Testu-hitza(k)” moduan bilatzerakoan, hauek izan dira lortutako emaitzak:
1. 1900-1939 Bizkaiera Administrazio-idazkiak Jauparijak 0008 c) Bere GUDAL-JAUPARIEN aldentzeko baimenak jakin bear dauz, geiegi ugaritu ezdaitezan, eta beti, aldendu danaren ordezkoa jarriaz.
2. 1900-1939 Bizkaiera Saio-artikuluak Zam 0025 <head>¡JAKIN BANEU..!</head>.
3. 1900-1939 Bizkaiera Saio-artikuluak Zam 0027 Ainbeste adiskide daukadaz, alkarregaz, neuk jakin barik, aide edo senide diranak, ze….
4. 1900-1939 Bizkaiera Saio-artikuluak JBDei 1923 0097 – Gizona! Nondik nora ezer be jakin barik, griego edo ijito usaña susmaten neutzen nik.
5. 1900-1939 Bizkaiera Saio-artikuluak A. Urrutia 0147 Eztakizu zelako poza arrtu dodan euzkeraz autorrtuten dozula jakin dodanian.
6. 1900-1939 Bizkaiera Literatur prosa Ibarg 0036 Baña jakin ez dauana, neke edo zigorra dagokion zerbait egiñarren be, ez da ain zigorrtua izango. (Luk. XIII-17).
7. 1900-1939 Bizkaiera Literatur prosa Echta JayM 0145 Agaton, oneik berbok esaten eguanarte, bere emaste ta lagunak ito-biarrik egozan barreka, ta Amele’k erantzun eutsan: – ¿Nun jakin dok Hamburg’on ainbeste korkoch dagozana?.
8. 1900-1939 Bizkaiera Literatur prosa Echta JayM 0145 – ¿Nun jakin dodan? Onutz ekarri genduzan ontziko nagosiak esan yeustanan.
9. 1900-1939 Gipuzkera Saio-artikuluak EE 1914 0194 Bere lenbiziko maisutzat, beste donostiar asko jakin bat izan zuben: Bizente Manterola argidotarra.
10. 1900-1939 Gipuzkera Saio-artikuluak JAg 0018 Lenengo aldiz jakin zituanean A. Iñazio’k Gandia’ko Dukea’ren jesuita izateko asmo onak esan zuan: “Oraindik isillik gorde bearko degu berri au; ez dira bada gauza mundutarren belarriak orrelako otsaundi edo tumpadarik aditzeko”.
Emaitza guztiak ikusteko esteka hau jarraitu: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
- 3. aukera
“Hasieran“, “Bukaeran” eta “Tartean” aukerak, adibide hauetan “Testu hitza(k)” izan da markatuta eduki duguna, baina “Lema(k)” aukeratuta ere egin daiteke. Bestalde, “Epea“, “Euskalkia” eta “Testu-mota” aukeretan guztia da markatuta eduki duguna. Esaldiaren hasieran jakin aditzaren bilaketa egiterakoan, askoz ere emaitza gutxiago agertzen dira. Hona hemen emaitza hauen adibide batzuk:
1. 1900-1939 Bizkaiera Saio-artikuluak Zam 0025 <head>¡JAKIN BANEU..!</head>.
2. 1900-1939 Gipuzkera Saio-artikuluak Inzag 0130 Jakin nai nuke nondik ote datozen emen bertan Zumaya’n: Txotxa-apaindu, Urtaingoa, Kaldes ta Tantanenekoa.
3. 1900-1939 Sailkatu gabeak Egunkariak El Día 1933 0001 Jakin dezala mundu guziak, nola garabizkiten.
4. 1900-1939 Sailkatu gabeak Egunkariak El Día 1931 0001 Jakin zazute gañera gorago aitatutako oyek, guztiyak itz egiteko errextasunik ez badute ere, idazteko beintzat idazle koxkor onek baño geyagokoa dutela.
5. 1940-1968 Gipuzkera Saio-artikuluak K. Enbeita 0076 <bibl>JAKIN</bibl>
6. 1940-1968 Gipuzkera Saio-artikuluak Vill 0178 Jakin beharrekoa dela uste dut Lafitte jaunak Euskaltzaindiko batzarre batean gogoratu zigun harako hura.
7. 1940-1968 Gipuzkera Literatur prosa Ugalde Iltz 0024 – Jakin al’dezu, Joxepa? -esan zion, aulki, Inaxi’k-.
8. 1940-1968 Sailkatu gabeak Bertsoak BerTxapel 1962 0049 Mattinek Jakin beauzu ni haur oiekin arras kontentu nagola, eta nai nuke luzaro bizi segur oino hola-hola, ta gero ere zabalduko da Mattin gaizoaren odola, eta hau berriz zertarako da fruitu gabeko arbola?.
9. 1969-1990 Gipuzkera Saio-liburuak A. Elustondo 0019 Jakin! Asko jakin! Gizon argien otsa entzun.
10. 1969-1990 Gipuzkera Antzerkia Onaind 0092 – Jakin nahi nuke, ba!.
Adibide guztiak ikusteko hemen sakatu: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
Esaldiaren bukaeran aditz hau bilatzerakoan, hurrengoak dira agertutako emaitza batzuk:
1. 1900-1939 Lapurtera-Nafarrera Saio-artikuluak Zerb Metsiko 0054 Ez da harritzeko: hamabi kilometra ondo… eta iherika guk ez jakin!.
2. 1900-1939 Sailkatu gabeak Aldizkariak Eskual 1904 0001 Aberats okhitu handi zenbeit othe zen, ala segurrago ez hango berekoa; gu bezala hura ere arrotza othe? Ez jakin.
3. 1940-1968 Gipuzkera Saio-artikuluak Jaunaren Deia 1965 0054 Jainkoak agertu ezik, gizonak ezin du bere indarrez txirotasunaren barne-muña soilki jakin.
4. 1940-1968 Bizkaiera Saio-artikuluak C. Jemein 0052 Nik askori itandu dautset eta erantzuten eztabe jakin.
5. 1940-1968 Gipuzkera Saio-artikuluak K. Enbeita 0076 <bibl>JAKIN</bibl>
6. 1940-1968 Gipuzkera Saio-artikuluak Lfn 0003 Bestalde, olako lanen egiteko, bear da zerbaitetaraño euskeraz mintzatzen eta izkiriatzen jakin.
7. 1940-1968 Gipuzkera Literatur prosa Gure mixioak 0012 Nola jakin?
8. 1969-1990 Gipuzkera Saio-artikuluak Onaind 0060 Ikasi ezik, nola jakin?.
9. 1969-1990 Gipuzkera Saio-liburuak A. Arrinda 0105 – Ilko ote dute…? – Ez ba jakin….
10. 1969-1990 Gipuzkera Literatur prosa B. Latiegi 0224 Gauza bat bakarrik nai du Luter`ek: salbatuko dala seguru jakin.
Emaitza guztiak ikusteko: http://www.euskaracorpusa.net/XXmendea/Konts_arrunta_fr.html
Azkenik, hitz biren artean aditz honen bilaketa egiterakoan ere, hitz bi bilatu beharko lirateke komen bidez banaturik aurreko kasuan gertatu den bezala.
Hona hemen ondorioei dagokienez esan beharreko gauza batzuk: Corpeusek emaitzak ematerakoan grafikoa eta hitzen testuingurua batera ematen digu, eta horrek ulermenari lagun diezaioke; Euskararen Corpusak, ordea, hitzen testuingurua besterik ez digu ematen. Bestalde, Euskararen Corpusak ez du hitzen kategoriaren bereizketarik egitea ahalbidetzen, eta era berean, bakarrik “Testu-hitza(k)“ sakatzen badugu agertuko zaigu hitza bere horretan; Corpeusean, ordea, forma sakatuz gero, emaitzetan hitza bere horretan emango zaigu, eta ez da zertan testu-hitz izan behar. Corpeusak daukan beste gauza on bat etengabe berritzen dela da, izan ere, internet da erabiltzen duen baliabidea, Euskararen Corpusak, ordea, ez du zertan aldaketarik eduki behar, izan ere, XX. mendeko testuen gaineko corpusa da, eta jadanik XXI. mendean gaude.
Euskararen Corpusak bilaketak egiterakoan zehatzagoak izatea ahalbidetzen digu; izan ere, bilatu nahi dugun hitza, testuaren hasieran, bukaeran edo tartean topatzeko eska diezaiokegu. Era berean, hainbat hitz konbinatuta bilatzea ere posible da corpus honetan, eta hori ez dauka Corpeusek. Honez gain, epea, euskalkia eta testu-mota zehaztu nahi badugu, egin dezakegu, eta horrek bilaketa zehatzagoak egitea posible egingo luke.
Honez gain esan behar dugu, guk egindako bilaketak “Bilaketa arrunta” moduan egin ditugula, baina garrantzitsua da azpimarratzea, hiztegi biek ahalbidetzen dutela bilaketa askoz ere zehatzago bat egitea “Bilaketa aurreratua”ren bitartez. Gure ustez corpus biak dira onak, egin beharreko gauza bakarra gure nahien arabera bata edo bestea aukeratzea da, biak izan daitezke egoki egin nahi dugun bilaketa motaren arabera.
Iturriak:
- Corpeus, internet euskarazko corpus gisa, Elhuyar eta IXA taldea. Kontsultatua: 2011ko apirila. Orrialdea: http://www.corpeus.org/cgi-bin/kontsulta.py
- Corpeus: internet, corpusak eta euskara uztartuz (2007), Elhuyar Zientzia eta Teknika aldizkaria. Kontsultatua: 2011ko apirila. Orrialdea: http://www.zientzia.net/artikulua.asp?Artik_kod=13078
- Corpeus, a “web as corpus” tool designed for the agglutinative nature of Basque (2007), Elhuyar R&D eta IXA taldea. Kontsultatua: 2011ko apirila. Orrialdea: http://www.corpeus.org/CorpEus%20WAC3.pdf
- Euskararen Corpusa, UZEI. Kontsultatua: 2011ko apirila. Orrialdea: http://www.euskaracorpusa.net/
- Euskararen Corpus Plangintza. Kontsultatua: 2011ko apirila. Orrialdea: http://www.euskara.euskadi.net/r59-738/eu/contenidos/informacion/corpus_plangintza/eu_6771/adjuntos/c-plangintza.pdf
- XX. mendeko euskararen corpus estatistikoa, Miriam Urkia, UZEI elkartea. Kontsultatua: 2011ko apirila. Orrialdea: http://www.uzei.com/modulos/usuariosFtp/conexion/archivos123A.pdf
Egileak: Ainhoa Causo, Jone Flores eta Leire Zamalloa