| |
Textové informační systémy (36TIS)
předmět denního studia, v tomto semestru se nevyučuje
Rozsah (přednášky + cvičení): 2+2
Zakončení: Zápočet, zkouška
Anotace:
| |
Textové informační systémy obsahují textové dokumenty, které obvykle nejsou strukturované a jsou v přirozeném jazyce. Hlavní problémy, které tyto systémy řeší spočívají ve vyhledávání dokumentů podle jejich obsahu, komprese textu a kontrola správnosti textu. Těmto problémům je věnována hlavní pozornost v přednáškách i cvičení.
|
Osnova:
| |
- Základní pojmy a klasifikace informačních systémů
- Vyhledávání v textu, modely vyhledávacích algoritmů
- Simulace nedeterministických konečných automatů, dynamické programování a bitový paralelismus
- Vyhledávací stroje, KMP a AC algoritmy
- Protisměrné vyhledávání, BM a CW algoritmy
- Dvoucestné automaty se skokem
- Faktorové automaty
- Indexové metody, analýza textu, tezaurus
- Signaturové metody
- Komprese dat, základní pojmy, modelování a kódování
- Statistické metody komprese dat
- Slovníkové metody komprese dat
- Syntaktické metody komprese dat
- Kontrola správnosti textu
|
Osnova cvičení:
| |
- LaTeX, základní pojmy
- LaTeX, matematická sazba
- LaTeX, grafika
- Konečné automaty pro vyhledávání řetězců v textu
- Konečné automaty pro vyhledávání posloupností v textu
- Simulace konečných automatů, dynamické programování
- Simulace konečných automatů, bitový paralelismus
- Boyer-Mooreův algoritmus a jeho varianty
- Dvoucestné automaty se skokem
- Textový systém s indexováním
- Komprese dat statistické metody
- Komprese dat slovníkové metody
- Modely dat pro kompresi dat
|
Literatura:
| |
[1] Melichar, B.: Textové informační systémy. Skripta ČVUT, Praha 1996
|
|














 
|