Knihovna FAISS a embedding: základ jazykových modelů

Zdroj Zdroj: root.cz     29.07.2025 (00:00)     Sekcia it, počítače

Ukážeme si praktické použití knihovny FAISS, společně s embedding modely, které mj. umožňují vyhledávání v textech na základě sémantické podobnosti. S touto technologií se setkáme při zpracování přirozeného jazyka atd. celý článek

Související články
 
Ďalšie články
 

Knihovna FAISS a embedding: základ jazykových modelů (2. část)

Zdroj Zdroj: root.cz     05.08.2025 (00:00)     Sekcia it-pocitace

Dnes si vyzkoušíme, jak se knihovny FAISS a Sentence-transformers chovají v situacích, v nichž je použita datová sada s velkým počtem vět, konkrétně s cca jedním milionem anglických vět.

 

Knihovna FAISS a embedding: základ jazykových modelů (3. část – role indexů)

Zdroj Zdroj: root.cz     19.08.2025 (00:00)     Sekcia it-pocitace

Důležitou součástí knihovny FAISS je široká nabídka indexů. Kromě interně naivních „lineárních“ indexů existují indexy založené na rozdělení prostoru Voroného dekompozicí či index HNSW: Hierarchical Navigable Small World.

 

FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů

Zdroj Zdroj: root.cz     08.07.2025 (00:00)     Sekcia it-pocitace

Ukážeme si základní vlastnosti knihovny FAISS, která je určena pro vyhledávání vektorů (s vysokými počty dimenzí) na základě jejich podobnosti. Tato knihovna se používá třeba při zpracování přirozeného jazyka.

 

Matfyz, Seznam, Phonexia, MAMA AI a další dostanou stomilionovou dotaci na výzkum jazykových modelů

Zdroj Zdroj: lupa.cz     17.07.2024 (12:19)     Sekcia it-pocitace

Ministerstvo školství schválilo evropskou dotaci téměř sto milionů korun z evropského Operačního programu Jan Amos Komenský (OP JAK) na čtyřletý výzkum velkých jazykových modelů (LLM), které jsou například základem ChatGPT, v aplikacích a dalším nasazení.

 

FAISS: knihovna pro rychlé a efektivní vyhledávání podobných vektorů (2. část)

Zdroj Zdroj: root.cz     17.07.2025 (00:00)     Sekcia it-pocitace

Zabývat se budeme sice na první pohled relativně snadnou otázkou, která však má několik odpovědí: které vektory jsou podobné a které nikoli. Odpověď závisí na tom, jakou metriku při porovnávání vektorů použijeme.

 

Shluková analýza (clustering) a knihovna Scikit-learn

Zdroj Zdroj: root.cz     05.12.2023 (00:00)     Sekcia it-pocitace

Knihovna Scikit-learn kromě modelů (a jejich tréninku) poskytuje i další nástroje. Jedním z užitečných nástrojů, které zde nalezneme, je podpora pro provádění takzvané shlukové analýzy (cluster analysis, clustering).

 

Google uvedl AI model Gemini 2.5 s kontextovým oknem 1 milion tokenů

Zdroj Zdroj: lupa.cz     25.03.2025 (18:25)     Sekcia it-pocitace

Americká společnost Google představila novou generaci svých AI modelů Gemini. Verze Gemini 2.5 je mulitmodální a tzv. „uvažující“ (reasoning). Podle firmy v různých testech velkých jazykových modelů překonává konkurenci, včetně GPT-4.5, Claude 3.7 Sonnet nebo DeepSeek R1.

 

Pražská knihovna ruší možnost přihlášení přes mojeID

Zdroj Zdroj: lupa.cz     31.03.2025 (11:14)     Sekcia it-pocitace

Městská knihovna v Praze od začátku dubna ukončí podporu mojeID k přihlašování do čtenářského účtu. Knihovna o tom informovala na svém webu. Důvodem má být „velmi malý počet aktivních uživatelů“. Knihovna také argumentuje „předpokládanými náklady, které by bylo nutné investovat do nového technického řešení služby“.

 

Důležitý rozsudek ukazuje, že by tvůrci AI měli platit za trénovací data

Zdroj Zdroj: idnes.cz     12.11.2025 (16:21)     Sekcia it-pocitace

Společnost OpenAI prohrála v Německu spor, který by mohl ukázat cestu, jak se autoři mohou bránit proti využití svých děl zdarma pro trénování velkých jazykových modelů. Jedna z tamních organizací na ochranu autorských práv dostala za pravdu, když chtěla zaplatit autorské poplatky za díla, která firma využila pro trénink svého AI modelu.

 

Zeptali jsme se chatbotů, jak zničit svět. Odpověděl jen Bard a nový Mistral 7B, který nemá etické zábrany

Zdroj Zdroj: zive.cz     02.10.2023 (17:45)     Sekcia it-pocitace

Většina velkých jazykových modelů od renomovaných značek trpí velmi silnou autocenzurou. Není divu, leckde by totiž velmi rychle dostaly stopku. Pomalu na to začínají reagovat tvůrci malých, nezávislých, nijak regulovaných, a hlavně open-source modelů. Aktuálně třeba pařížští inženýři z ...

OpenAI vysvětluje, proč vám ChatGPT nikdy nepomůže vyrobit zbraň hromadného ničení

Langtail: Češi finančně podporovaní Cendrou spouští nástroj pro vývoj aplikací jazykových modelů

Kiwi.com už všechnu komunikaci se zákazníky odbavuje pomocí AI. Člověk je lepší hlavně v empatii

AI chatboty podporují psychózu a mánii. Lidské terapeuty nenahradí

Vytrénovali jste ChatGPT a Bing nelegálně na našich datech. New York Times žalují OpenAI a Microsoft

Llama Stack: framework pro tvorbu aplikací s generativní AI (2. část)

Co čekat od AI akcelerátorů v procesorech AMD a Intel. Zatím jsou bez práce, ale postupně se to bude měnit

Chatbot od DuckDuckGo nabízí GPT 3.5 Turbo nebo Llamu 3. Zdarma a anonymně

Česká média nechtějí zdarma dávat data umělé inteligenci typu OpenAI. A Seznam dělá mrtvého brouka

Postřehy z bezpečnosti: Sysmon bude nativní součástí Windows

AI rozevře nůžky mezi dobrými a špatnými vývojáři. V Netclubu debatovali Michal Pěchouček, Honza Sládek a Jan Macek

Blíží se vystřízlivění? Možná. Generativní umělá inteligence ztrácí na síle

Kombinace možností ggplot2 a Pythonu: knihovna Plotnine

AI jako pomocník pro studenty i učitele. Poradíme, jak dostupné nástroje využít ve škole

Nevěřte jí. Výzkum ukazuje, že si AI vymýšlí i tam, kde se to možná nečeká

ChatGPT od rána hlásí výpadky po celém světě, nejde ani generátor videí

Knihovna ipycanvas aneb kreslicí plátno pro Jupyter Notebook

Podvodníky zaměstná umělá inteligence – sebere jim čas, který by jinak věnovali okrádání skutečných lidí

Jak na umělou inteligenci? Radí diskusní fóra, odborníci i samotné firmy

Segmentace MRI mozku – knihovna TASM

AI GPT za vás bude na počítači klikat i psát. Nová funkce dorazí za tři měsíce

Filozofové předpověděli, kterak zlé myslící stroje ovládnou svět. Už zase

Microsoft se pochlubil malým jazykovým modelem Phi-2. Prý je lepší než Gemini Nano od Googlu

OpenAI zpřístupnila nové jazykové modely, které běží i na běžných noteboocích

Knihovna Pandas: práce s datovými řadami (series)

StabilityAI zveřejnilo svou první jazykovou AI StableLM pod svobodnou licencí. Najdete ji na GitHubu

Nahradí AI vývojáře? Sledujte diskusi s Michalem Pěchoučkem (Gen), Honzou Sládkem (Contember) a Janem Mackem (MAMA AI)

EU dává miliony eur na vývoj AI. Projekt povede Univerzita Karlova

Seznam testuje vlastní AI chatovací aplikaci. Oproti ChatGPT má mít navrch v češtině

UBports chystá nový prohlížeč, Red Hat se zapojí do vývoje LLM

Brněnské Kiwi.com rozjíždí MCP server pro zapojení AI agentů do vyhledávání letenek

Buďte hodní na herní postavy. Nvidia ACE má vylepšenou AI pro generování odpovědí

Google má třetí AI generace Gemini 2.5. Flash-Lite má všechny funkce, ale je mnohem rychlejší

Chatbot Arena řadí AI do žebříčků a modely si v ní můžete rovnou vyzkoušet

 
Počasí Kurzy

1 € = 27.453   CZK

1 € = 0.7276   GBP

1 € = 1.0736   CHF

1 € = 4.1582   PLN

1 € = 1.1168   USD

Program

Markíza19:00 TELEVÍZNE NOVINY

 

Jednotka19:55 Góly - body - sekundy

 

Dvojka20:00 Záznam zo žrebovania: KENO 10, Keno Joker, Loto, Joker, Loto 5 z 35 (B)

 

JOJ19:30 NOVINY TV JOJ

 

Kompletný tv program

Reality Horoskopy

Beran: Ak sa vás partner pýta, ako využijete voľné dni, vy sa pýtajte, ako si ich predstavuje. Je možné, že sa s vami bude chcieť pochváliť a pozve vás medzi priateľov, na ich úsudku mu veľmi záleží.

Býk: Dnes zacítite pocit naplnenia a úspechu. A ak sa darí vám, vaši priatelia a známi môžu rovnako počítať s vašou podporou a pomocou. Čaká vás množstvo pracovných aj súkromných stretnutí, kde prejavíte svoju schopnosť prejaviť účasť a poskytnúť cennú radu.

Blíženci: Dnes je váš deň, tak to využite. Poteší vás nejaká dobrá správa. Všetko sa pohne dopredu. Rozdávajte okolo seba úsmevy a ukazujte veselú tvár, lebo nie ste tak chudí, aby ste trocha šťastia nemohli dať.

Rak: Ak sa budete dnes predbiehať v rade alebo nebudete radu rešpektovať, môžete prísť domov dosť zničený. Na vašom okolí potom bude vysvetliť vám, prečo tomu tak je.

Lev: Ak sa chcete hádať, uvedomte si, že deň vám dáva energiu, takže máte dosť síl, aby ste neuhli a vytrvali až do víťazného konca. Buď uhnete, alebo deň zakončíte ujmou na zdraví.

Panna: Dnes vám uspokojenie môže prinášať iba láska, ale pretože váš nepružný a konzervatívny postoj môže hocikoho odradiť, voľte radšej úsmev. Ak sa k vám opačné pohlavie dnes priblíži, využite svoje šance.

Váhy: Plný energie budete iba v dopoludňajších hodinách. Celý ďalší zbytok dňa budete vyžadovať citlivejšie a jemnejšie zachádzanie. Ak si to navzájom poskytnete s ostatnými, budete celkom v príjemnej pohode.

Štír: Neprehrabávajte vrecká svojmu partnerovi! List od nelegálneho partnera tam síce neobjavíte, ale mohli by ste nájsť podrobný rozpis všetkých domácich prác, ktoré chce vo voľných dňoch stihnúť, čo by vás spoľahlivo otrávilo.

Střelec: Nesmiete sa stať panovačnými až diktátorskými. Mohlo by to mať netušené následky. Hľadajte svoje prednosti a verte, že ste dobrý taký, aký ste. Vo vzťahu máte potrebu väčšej istoty, alebo by ste radi realizovali niečo, čo vám už dlho vŕta v hlave.

Kozoroh: Dovoľte si byť voľný a ničím nezaťažený, aj keď je situácia neúnosná a vy máte pocit, že sa vám niečo vymklo z rúk.

Vodnář: Vaša dnešná fyzická odolnosť sa nedá porovnávať so silnejším znameniami horoskopu. Potreba odpočinku je u vás proste vyššia, a tak pozorne vnímajte signály vášho tela, ktoré poukazuje na preťaženie organizmu.

Ryby: Pozor dajte pri vysvetľovaní hocičoho. Budete hovoriť rýchlejšie než normálne a môžete nechtiac vyrobiť dosť veľký trapas. Pokiaľ nemusíte, radšej sa k ničomu nevyjadrujte, najmä nie písomne.

Ďalšie horoskopy