sql >> Database teknologi >  >> RDS >> Mysql

Wordnet SQL-forklaring

WordNet er en super fed orddatabase. Jeg har selv undersøgt det. Jeg vil liste mine resultater nedenfor - og forhåbentlig vil det hjælpe dig til at forstå tabellerne bedre.

Synset-tabellen Synsets tabellen er en af ​​de vigtigste tabeller i databasen. Det er ansvarligt for at rumme alle definitionerne i WordNet. Hver række i synset-tabellen har et synsetid, en definition, et pos (dele af talefelt) og et lexdomainid (som linker til lexdomain-tabellen) Der er 117373 synsets i WordNet-databasen.

Tabellen Ord WordNet har også en "words"-tabel, der kun har to felter:et wordid og et "lemma". Ordtabellen er ansvarlig for at rumme alle lemmaer (basisord) i Wordnet-databasen. Der er 146625 poster i denne tabel

Så.. hvordan er disse to tabeller forbundet? Svaret? Sansebordet!

The Sense Table Forstandstabellen er ansvarlig for at sammenkæde ord (i ordtabellen) med definitioner (i synset-tabellen). Indtastningerne i meningstabellen omtales som "ord-sans-par" - fordi hver parring af et ordid med et synset er én fuldstændig betydning af et ord - en "ordets sans".
Der er i alt 206.354 ordsanser i WordNet-databasen.

Tabellen Lexdomains Lexdomains-tabellen refereres til af sense-tabellen og bruges til at definere hvilket leksikalsk domæne et ord-sansepar tilhører. Der er 45 leksikale domæner i lexdomains-tabellen. Lexdomain-tabellen er derfor WordNets måde at "tagge" et ord-sans-par. Det er dog ret begrænset, fordi et ord-sansepar kun kan tilhøre ET leksikalske domæne.

De 45 leksikalske domæner inkluderer:

Adjektiver: alt sammen, forresten

Adverbier alle

Substantiveord toppe, handle, dyr, artefakt, egenskab, krop, erkendelse, kommunikation, begivenhed, følelse, mad, gruppe, placering, motiv, objekt, person, fænomen, plante, besiddelse, proces, mængde, linkdef, form, tilstand, stof, tid,

Verber krop, forandring, kognition, kommunikation, konkurrence, forbrug, kontakt, skabelse, følelser, bevægelse, opfattelse, besiddelse, social, stativ, vejr, ppl

Tabellen med store og små bogstaver Nogle ord i ordtabellen har naturligvis det første bogstav med stort, dvs.:"A-hold". Da ordtabellen gemmer alle ord som små bogstaver, bruger WordNet denne tabel til at angive den store version af ordet.Der er 40313 poster i denne tabel.

Der er mange andre tabeller i WordNet DB, når jeg har undersøgt dem, skriver jeg igen.

Sådan finder du dine synonymer For at besvare dit spørgsmål vedrørende synonymer - Du skal gøre følgende.

Lad os sige, at du vil finde synonymerne for ordet "Carry". For at gøre det skal du først søge i ordtabellen efter et lemma, der matcher ordet "bære". Dette ville give wordid 21253. Du ville derefter søge i sanstabellen for at finde alle ord-sans-par for ordet bære. Dette giver 41 resultater - hvert resultat viser wordid 21253, og et senseid (som er indekset for ord-sans-parret) og et synsetid.

Nu skal du forespørge synset-tabellen for hver af de returnerede synsetider, så du kan få adgang til det tilknyttede definitionsfelt i synset-tabellen.

Til sidst for at finde synonymerne for hvert af de angivne synssæt, skal du blot søge i sense-tabellen efter andre ord-sansepar, der delte det samme synset.

Eksempel:Et af de 41 ord-sans-par for ordet "bære" er angivet nedenfor:Hvis vi slår definitionen for denne synsetid 202083512 op, vil du finde "transmit eller tjene som medium for transmission"

For at finde alle synonymerne til denne definition, ville du derefter søge i sense-tabellen efter den samme synsetid 202083512. Dette giver synonymer:kanal, conduct, convey, impart og transmit(bemærk:du skal venstre slutte dig til ordtabellen for at få de faktiske lemmaer)

Jeg håber, at dette hjælper med at afmystificere WordNet for dig.. Jeg synes, det er ret fedt...



  1. Skæring af flere arrays i PostgreSQL

  2. ORA-06502:PL/SQL:numerisk eller værdifejl:tegnstrengbuffer for lille

  3. HIbernate problem med Oracle Trigger til generering af id fra en sekvens

  4. Lyt til afsnit 2 af Microsoft Access Podcast