Tokenizace textu: základní operace při zpracování přirozeného jazyka
Zdroj:
root.cz
12.03.2024 (00:00)
it, počítače
Seznámíme se s knihovnou Tiktoken, která umožňuje takzvanou tokenizaci textu. Jedná se o jednu ze základních operací používaných v systémech pro zpracování přirozeného jazyka, což je bouřlivě se rozvíjející oblast. celý článek
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 3.část
Zdroj:
root.cz
26.11.2024 (00:00)
it-pocitace
Budeme se zabývat velmi často řešenou úlohou: analýzou, zda je předložený text spam nebo se jedná o jiný typ textu (ham). Při vektorizaci textu využijeme takzvané n-gramy.
pgvector : vektorová databáze postavená na Postgresu
Zdroj:
root.cz
06.03.2025 (00:00)
it-pocitace
Ukážeme si základní vlastnosti rozšíření Postgresu, které se jmenuje pgvector. Umožňuje používat PostgreSQL ve funkci vektorové databáze, například při zpracování přirozeného jazyka, rozpoznávání obrázků, detekci anomálií atd.
FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů
Zdroj:
root.cz
08.07.2025 (00:00)
it-pocitace
Ukážeme si základní vlastnosti knihovny FAISS, která je určena pro vyhledávání vektorů (s vysokými počty dimenzí) na základě jejich podobnosti. Tato knihovna se používá třeba při zpracování přirozeného jazyka.
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část
Zdroj:
root.cz
21.11.2024 (00:00)
it-pocitace
Dnes si vysvětlíme algoritmy pro vektorizaci jazykového korpusu, což je proces, při kterém se z jednotlivých textových dokumentů (každý dokument je představován řetězcem) konstruuje matice s numerickými hodnotami.
Knihovna FAISS a embedding: základ jazykových modelů
Zdroj:
root.cz
29.07.2025 (00:00)
it-pocitace
Ukážeme si praktické použití knihovny FAISS, společně s embedding modely, které mj. umožňují vyhledávání v textech na základě sémantické podobnosti. S touto technologií se setkáme při zpracování přirozeného jazyka atd.
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP)
Zdroj:
root.cz
14.11.2024 (00:00)
it-pocitace
V článcích o scikit-learn jsme se zabývali zpracováním a predikcí numerických dat. Ovšem v praxi je zapotřebí pracovat i s dokumenty psanými v přirozeném jazyce. I v takových případech najde scikit-learn své využití.
SQLite-vec: vektorové rozšíření databáze SQLite
Zdroj:
root.cz
13.01.2026 (00:00)
it-pocitace
Seznámíme se s vlastnostmi rozšíření databáze SQLite, které se jmenuje SQLite-vec. Umožňuje SQLite používat ve funkci vektorové databáze, zejména při zpracování přirozeného jazyka, rozpoznávání obrázků, detekci anomálií atd.
Zpracování hodnot typu half float (fp16) na platformě AArch64
Zdroj:
root.cz
09.09.2025 (00:00)
it-pocitace
Programátoři, zabývající se generativní AI či zpracováním přirozeného jazyka, se často setkávají s vektory obsahujícími prvky typu half float (FP16). Vysvětlíme si, jak se s těmito hodnotami pracuje na platformě AArch64.
Programovací jazyk R: práce s maticemi
Zdroj:
root.cz
10.09.2020 (00:00)
it-pocitace
[24 minut čtení] Třetím důležitým datovým typem programovacího jazyka R jsou matice. Dnes se seznámíme s funkcemi ze základní knihovny, které jsou určeny právě pro konstrukci matic popř. pro jejich další zpracování. 1. Programovací jazyk R: práce s maticemi
Druhý cizí jazyk je zásadní pro rozvoj žáků i země, míní odbornice
Zdroj:
ceskenoviny.cz
25.03.2023 (06:55)
it-pocitace
Praha - Výuka druhého cizího jazyka na základní škole přináší nejen znalost samotného jazyka, ale také poznání odlišného kulturního prostředí a otevírá širší možnosti pracovního...
BaCon: transpřekladač z jazyka BASIC do jazyka C
Podrobnější popis vlastností programovacího jazyka R
Lua Fun: knihovna pro zpracování konečných i nekonečných sekvencí v jazyce Lua
Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua (dokončení)
Zpracování hodnot typu half float (fp16) na platformě AArch64: operace s vektory
Převody zdrojových kódů z jazyka C do jazyka Go
Basilisp: interpret programovacího jazyka Clojure integrovaný s Pythonem
Moonscript: jazyk inspirovaný CoffeeScriptem určený pro ekosystém jazyka Lua
Poznámkový blok překračuje další hranici. Vytasil Markdown a formátování textu
Technologie WebAssembly a GopherJS: předávání argumentů mezi Go a JavaScriptem (dokončení)
Základní funkce pro zpracování signálů v knihovně SciPy: FFT a její varianty
Základní funkce pro zpracování signálů v knihovně SciPy
Propojení Pythonu s nativními knihovnami s využitím balíčku cffi (2)
Faust: platforma pro proudové zpracování dat v Pythonu
Testování aplikací s využitím nástroje Hypothesis (dokončení)
Funkce vyššího řádu určené pro zpracování sekvencí v knihovně funcy
Aritmetické operace s hodnotami uloženými binárně i ve formátu BCD
Jupyter Notebook – operace s rastrovými obrázky a UML diagramy, literate programming
Calysto Hy: integrace programovacího jazyka Hy s Jupyter Notebookem
„Mine englisch is well.“ DeepL Write používá AI k opravě anglických a německých vět
Programovací jazyk R: vektory ve funkci základního datového typu jazyka
Manipulace s binárními datovými strukturami v Pythonu
Standardní šablonovací systém jazyka Go
Go v roli skriptovacího programovacího jazyka
Funkce a typový systém programovacího jazyka ML
Standardní šablonovací systém jazyka Go (dokončení)
Lexikální a syntaktická zdrojových kódů jazyka Go
ULua: univerzální distribuce programovacího jazyka Lua
EndBASIC: moderní reinkarnace klasického jazyka BASIC
Projekt Gambit – další kvalitní interpret i překladač programovacího jazyka Scheme
Kombinace programovacího jazyka C3 s assemblerem

