Jazykový model nečte písmena ani slova jako my. Text si nejdřív rozseká na tokeny a každému přiřadí vektor čísel (embedding), který zachycuje význam. Podobná slova mají podobné vektory — a leží v prostoru blízko sebe. A language model doesn't read letters or words the way we do. It first chops the text into tokens and assigns each a vector of numbers (an embedding) that captures meaning. Similar words have similar vectors — and lie close together in the space.
Co to jeWhat it is Ukázka, jak model „vidí" text. Nejdřív ho rozseká na tokeny (kousky slov) a každému přiřadí embedding — sadu čísel zachycující význam. Podobná slova mají podobná čísla, a tak leží na mapě blízko sebe.A demo of how a model “sees” text. First it chops it into tokens (word pieces) and gives each an embedding — a set of numbers that captures meaning. Similar words get similar numbers, so they sit close together on the map.
Co zkusitWhat to try Napiš text a sleduj, jak se rozdělí na tokeny a rozmístí na 2D mapě významů. Pak zkus „počítání s významem" — slavné analogie jako král − muž + žena = královna.Type some text and watch it split into tokens and spread out on a 2D map of meaning. Then try “computing with meaning” — famous analogies like king − man + woman = queen.
Proč je to důležitéWhy it matters Tohle je první krok každého jazykového modelu: převést slova na čísla, se kterými umí počítat. „Mapa významů" je důvod, proč modely chápou, že pes a štěně spolu souvisejí.This is the first step of every language model: turning words into numbers it can compute with. The “map of meaning” is why models understand that dog and puppy are related.
Slovo samo o sobě je pro stroj jen řetězec znaků. Embedding ho převede na bod v prostoru (ve skutečnosti o stovkách rozměrů, tady promítnutý do 2D). Model se ho naučí tak, že slova z podobných souvislostí umístí blízko sebe — a vzdálenosti i směry pak nesou význam. A word by itself is just a string of characters to a machine. An embedding turns it into a point in space (actually with hundreds of dimensions, here projected into 2D). The model learns it so that words from similar contexts are placed close together — and distances and directions then carry meaning.
Model pracuje s tokeny — kousky textu (slovo, část slova, znaménko). Díky tomu zvládne i slova, která nikdy neviděl, složením z částí. The model works with tokens — pieces of text (a word, part of a word, a punctuation mark). This lets it handle even words it has never seen by composing them from parts.
Pes a kočka leží blízko, auto a vlak taky. Vzdálenost mezi vektory měří, jak významově podobná slova jsou. Dog and cat lie close together, so do car and train. The distance between vectors measures how similar in meaning words are.
Nejde jen o blízkost — i směry něco znamenají. Posun „muž → žena" je stejný jako „král → královna". Proto vyjde král − muž + žena ≈ královna. It's not just about closeness — directions mean something too. The shift "man → woman" is the same as "king → queen". That's why king − man + woman ≈ queen.
Každé slovo na vstupu modelu je takový vektor. Celé „porozumění" jazyku stojí na tom, že podobné věci mají podobná čísla. Every word on a model's input is such a vector. All "understanding" of language rests on similar things having similar numbers.