Wéi benotzt 'Ngram Viewer' Tool an Google Books

A Ngram, och nach N-Gramm genannt, ass eng statistesch Analyse vum Text oder Sprachinhalt, fir n (e Zuel) e puer Elemente am Text ze fannen. Et kann all Zorte Saachen sinn, wéi Phoneme, Präfixe, Sätze oder Bréiwer. Obwuel d'N-Gramm eppes ausserhalb vun der Fuerscher ass, ass et tatsächlech an enger grousser Palette genotzt ginn, an et huet vill Implikatiounen fir Leit ze maachen Computerprogrammer déi verstinn an mat der natierlecher Sprooch schwätzen. Dat, an engem Noutfall, ass Google Interesse an der Idee.

Am Fall vun Google Books Ngram Viewer ass den Text ze analyséieren vu ville Betrag vu Büroen Google huet gescannt vun ëffentleche Bibliothéiken fir seng Google Books Sichmaschinn ze gesin. Fir Google Books Ngram Viewer, si bezéie sech op den Text deen Dir sicht wéi de "Corpus". De Kapital am Ngram Viewer gedeelt vu Sprooch, obwuel Dir britesch an amerikanesch englesch englesch analyséiere kann oder se zesummen bréngen. Et schlussend datt et super interessant ass fir aus der britescher bis amerikanescher Benotzung vun Konditiounen ze widderhuelen an d'Charts z'änneren.

Wéi Ngram Works

  1. Gitt op Google Books Ngram Viewer op books.google.com/ngrams.
  2. Elementer sinn kaempfindlech, am Géigesaz zu Google Web Recherchen, also solle sécher si proper Propositiounen ze kapitaliséieren.
  3. Gidd an eng Iddi oder Phrasen déi Dir analyséiert wëllt. Sech sécher all Frae mat engem Comma ze trennen. Google proposéiert de "Albert Einstein, Sherlock Holmes, Frankenstein" fir Iech matzemaachen.
  4. Niewt dem Typ an enger Datumreiwe. De Standard ass 1800 bis 2000, awer et ginn méi rezent Bicher (2011 waren déi neisten Lëscht am Google Dokumentationsbureau, awer dat kéint geännert ginn.)
  5. Kuckt e Corpus. Dir kënnt friemsprooche Texter oder englesch aussoen, an zousätzlech zu den normale Choixe kënnt Dir Saachen wéi "Englesch (2009) oder American English (2009)" am ënneschten. Dëst sinn äert Kapital, dat Google zanter aktualiséiert ass, awer Dir hutt e puer Grond fir Är Vergläicher mat alen Datensätzen ze maachen. Déi meescht Benotzer kënne ignoréieren se a konzentréieren sech op déi jonk Korpora.
  6. Stellt Äert Gläichteg. Glättung verweist op wéi glatt de Graf ass am Ende. Déi genee Exemplatioun wier e Gläichgewiicht vu 0, awer dat kéint schwiereg ginn fir ze liesen. De Standard gëtt op 3 festgeluecht. In de meeschten Fäll kënnen Dir dës net änneren.
  1. Dréckt d' Sich vill Bicherknäppchen un. (Dir kënnt och séier op der Sichkontrolle kommen.)

Wat ass Ngram Zeechnen?

Google Books Ngram Viewer wäert eng Grafik ausginn déi d'Benotze vun enger spezieller Formel an Bicher duerch d'Zäit repräsentéiert. Wann Dir méi wéi ee Wuert oder Droge benotzt hutt, da gesitt color-codéiert Linnen déi verschidden Differenzéierungsbedingungen. Dëst ass relativ ähnlech wéi Google Trends , nëmmen d'Sich deckt eng länger Zäit.

Hei ass e real-life example.Wou hu viru kuerzem iwwert Essegbëscher. Si sinn am Laura Ingalls Wilder's Little House op der Prairie- Serie erwähnt, awer mir hu ni vun esou eppes gehéiert. Mir benotzen d'Websäit vun der Google fir méi iwwer Essegpillen ze léieren. Anscheinend si si als Deel vun der amerikanescher Südlechkitchen betraff a si gi vu Esseg. Si héieren op Zäiten, wann net jiddereen op frësch Produkter all Joers vum Joer war. Ass dat déi ganz Geschicht?

Mir gesicht de Google Ngram Viewer, an et sinn e puer Erklärungen vum Patt an am fréien an spéide 1800er Joer, vill vun de 1940er an engem zousätzlech Unzuel vu ville Beräicher (vläicht e puer Nostalgie.) Bon, et ass e puer Problem mat den Donnéeën op e Gläichtungsniveau vun 3. Et ass e Plateau iwwer d'Erwäerten am Joer 1800. Wahrscheinlech sinn et net all gläichwäerteg Nummer vun engem speziellen Puer fir all Joer fënnef Joer? Wat geschitt ass, datt et net vill Bicher an der Zäit publizéiert gëtt, a well eis Donnéeën glécklech sinn, verzerrt de Bild. Wahrscheinlech war et ee Buch, dat erwuesse Maillelstéck, et ass just gemittlech ginn, fir e Spikes ze vermeiden. Wann Dir de Gläicht op 0 setzt, kënne mer kucken datt dat genee de Fall ass. D'Spikezentren op 1869, an et ass eng aner Spike am Joer 1897 an 1900.

Huet keen derzou bäigedroen de Rescht vun der Zäit? Si hu wahrscheinlech iwwer dës Priester geschwat. Et waren wahrscheinlech Rezepter schwächt iwwerall d'Plaz. Si hunn einfach iwwer hir net an Bicher geschriwwen, an dat ass eng Begrenzung vun dëse Ngram Recherchen.

Advanced Ngram Siches

Vergiesst net wéi mir gesot hunn datt Ngrams aus all Sorten vun anerem Text sichen kënnen. Google erméiglecht Iech ganz vill mat der Ngram Viewer ze brengen. Wann Dir de Fësch de Fengsucht fënnt anstatt d'Nierfecht ze fësch, da kënnt Dir et mat der Bestëmmung benotzen. An dësem Fall wäerte Dir fir "fish_VERB"

Google liefs eng komplett Lëscht vun Kommandoen déi Dir benotzt an aner erweidert Dokumentatioun op hirer Websäit.