Number of found documents: 193131
Published from to

Aplikace pro vytváření osobního rozvrhu
Rajczy, Pavol; Pešková, Klára; Svoboda, Martin
2024 - Slovak
This work presents a Windows application developed to increase user focus and effici- ency through effective time and schedule management strategies. The software integrates established methods such as Eat That Frog!, the Eisenhower Matrix, the 80-20 Rule, and the modified Eat That Frog! along with the Pomodoro Technique to help users create and stick to optimized schedules. After successfully mastering the activity in the schedule, the user has the opportunity to share his result with other users, which also increases motivation. The study underscores the app's role in promoting improved work habits and concentration. The development process, from design to implementation, prioritizes practical functions in the creation of a schedule. Táto práca predstavuje Windows aplikáciu vyvinutú na zvýšenie zamerania a efek- tívnosti užívateľov prostredníctvom efektívnych stratégií riadenia času a rozvrhu. Softvér integruje zavedené metódy ako Eat That Frog!, Eisenhower Matrix, 80-20 Rule a up- ravenú metódu Eat That Frog! spolu s Pomodoro Technique na pomoc používateľom pri vytváraní a dodržiavaní optimalizovaných rozvrhov. Po úspešnom zvládnutí aktiv- ity v rozvrhu má užívateľ možnosť zdieľať svoj výsledok s inými užívateľmi, čo taktiež zvyšuje motiváciu. Štúdia podčiarkuje úlohu aplikácie pri podpore zlepšených pracovných návykov a koncentrácie. Proces vývoja, od návrhu až po implementáciu, uprednostňuje praktické funkcie pri tvorbe rozvrhu. Keywords: Pomodoro|Eat That Frog!|Eisenhower Matrix|80-20 Rule|časový manažment|stavanie rozvrhu; Pomodoro|Eat That Frog!|Eisenhower Matrix|80-20 Rule|time managment|construction of timetable Available in a digital repository NRGL
Aplikace pro vytváření osobního rozvrhu

This work presents a Windows application developed to increase user focus and effici- ency through effective time and schedule management strategies. The software integrates established methods such ...

Rajczy, Pavol; Pešková, Klára; Svoboda, Martin
Univerzita Karlova, 2024

Zpracování jízdních řádů
Mrkus, František; Fink, Jiří; Pilát, Martin
2024 - English
A goal of this thesis is to create an open-source application which could serve as foundation for public bus transport analysis and organizing, while di- rectly operating with timetables in a JDF format for a comfortable workflow. The application is centered aroud bus scheduling for public transport orga- nizers and agencies,including related functions such as displaying timetable sheets and departure/arrival lists, map visualization of the planned routes, and creation of custom timetables. All of these features were sucesfully im- plemented and tested on real-world data. Cílem této práce je vytvořit open-source aplikaci, která by mohla slou- žit jako základ pro analýzu a organizaci veřejné autobusové dopravy, přičemž přímo pracuje s jízdními řády ve formátu JDF, pro zajištění pohodlného pra- covního postupu. Aplikace je zaměřena na plánování autobusových spojů pro organizátory a dopravce veřejné dopravy, včetně souvisejících funkcí, jako je zobrazení jízdních řádů a seznamů odjezdů/příjezdů, vizualizace plánovaných tras na mapě a vytváření vlastních jízdních řádů. Všechny tyto funkce byly úspěšně implementovány a otestovány na reálných datech. Keywords: rozvrhování autobusů|veřejná doprava|optimalizace|vývěsný jízdní řád; bus scheduling|public transport|optimization|spreadsheet timetable Available in a digital repository NRGL
Zpracování jízdních řádů

A goal of this thesis is to create an open-source application which could serve as foundation for public bus transport analysis and organizing, while di- rectly operating with timetables in a JDF ...

Mrkus, František; Fink, Jiří; Pilát, Martin
Univerzita Karlova, 2024

Asistent pro psaní textu založený na velkých jazykových modelech
Klement, David; Helcl, Jindřich; Libovický, Jindřich
2024 - Czech
A standard approach to many natural language processing tasks is to take an existing, pre-trained large language model and fine-tune it for the given task. Such an approach leads to having a separate model for each task; furthermore, the fine-tuning must be repeated when upgrading to a new pre-trained model. This thesis explores the possibilities of using a single off-the-shelf model for three different tasks without fine-tuning. We present Preditor, a writing assistant that supports rewriting a sentence after replacing one of its words, suggesting continuations, and suggesting words that fit into a sentence. We design the system in a model-agnostic way, making it possible to upgrade to a new model with little effort. We also provide an extension that integrates the assistant into the text editor. 1 Standardní přístup k mnoha úlohám zpracování přirozeného jazyka je vzít existující předtrénovaný velký jazykový model a dotrénovat jej pro danou úlohu. Tento přístup vede k tomu, že pro každou úlohu vznikne samostatný model, navíc je nutné dotrénování opakovat při přechodu na lepší předtrénovaný model. Tato práce zkoumá možnosti po- užití jediného veřejně dostupného modelu pro tři různé úlohy bez nutnosti dotrénování. Představujeme Preditor, asistenta pro psaní, který umí přepsat větu po nahrazení jed- noho z jejích slov, navrhuje pokračování věty a navrhuje slova, která se hodí doprostřed věty. Systém navrhujeme nezávisle na konkrétním modelu, což umožňuje jednoduchý pře- chod na nový model. Poskytujeme také rozšíření, které integruje asistenta do textového editoru. 1 Keywords: velké jazykové modely|zpracování přirozených jazyků|deep learning; large language models|natural language processing|deep learning Available in a digital repository NRGL
Asistent pro psaní textu založený na velkých jazykových modelech

A standard approach to many natural language processing tasks is to take an existing, pre-trained large language model and fine-tune it for the given task. Such an approach leads to having a separate ...

Klement, David; Helcl, Jindřich; Libovický, Jindřich
Univerzita Karlova, 2024

Interactive pandemic simulation to encourage critical thinking
Goldscheiderová, Sára; Petříček, Tomáš; Klímek, Jakub
2024 - Czech
The complexity of pandemic simulations often makes them opaque and difficult to understand for the general public. Critical thinking is essential for understanding the results of these simulations, but the current methods are lacking in this regard. They commonly leave people skeptical and un- able to comprehend the implications of the simulations. This thesis aims to design an interactive pandemic simulation that encourages critical thinking and implement a prototype of it. Through this simulation design, we can illustrate how future models can be made more socially beneficial and how they can be used to educate the public. Složitost simulací pandemií způsobuje, že jsou pro veřejnost často nejasné a obtížné k pochopení. Přestože je kritické uvažování nezbytné pro správné pochopení výsledků těchto simulací, současné metody v tomto ohledu selhá- vají. Důsledkem toho lidé simulacím často nedůvěřují, nechápou je, a neví, co si z nich ve skutečnosti odnést. Tato práce si klade za cíl navrhnout interak- tivní simulaci pandemie, která podporuje kritické uvažování, a implementovat její prototyp. Skrz ní pak můžeme ukázat, jak by se mohly budoucí modely simulací stát společensky přínosnějšími. Keywords: simulation|data visualization; simulation|data visualization Available in a digital repository NRGL
Interactive pandemic simulation to encourage critical thinking

The complexity of pandemic simulations often makes them opaque and difficult to understand for the general public. Critical thinking is essential for understanding the results of these simulations, ...

Goldscheiderová, Sára; Petříček, Tomáš; Klímek, Jakub
Univerzita Karlova, 2024

Segmentace skenovanych PDF dokumentů
Saydametov, Nikita; Šikudová, Elena; Tódová, Lucia
2024 - English
Keywords: PDF|OCR|segmentace; PDF|OCR|segmentation Available in a digital repository NRGL
Segmentace skenovanych PDF dokumentů

Saydametov, Nikita; Šikudová, Elena; Tódová, Lucia
Univerzita Karlova, 2024

PerfEval: Spojení unit testů s vyhodnocováním výkonu
Hrdý, Dominik; Tůma, Petr; Hnětynka, Petr
2024 - Czech
When developing software, unit tests are commonly used. This thesis proposes Perf- Eval, a tool that performs performance testing in a similar way. The PerfEval tool is designed to compare the performance measurement results of two software versions and evaluate whether the performance of the newer version differs. The tool uses the results of measurements from common benchmarking frameworks. By comparing the results of measurements from these frameworks using statistical methods, it detects changes in performance between versions. Just as unit tests alert the user if their code is incorrect, PerfEval also alerts the user to changes in performance. PerfEval is a console application, so it can be easily controlled from scripts just like unit tests. Při vývoji softwaru se běžně používají unit testy. Tato práce navrhuje nástroj PerfEval, který podobným způsobem provádí testování výkonu. Nástroj PerfEval má za úkol porovnat výsledky měření výkonu dvou verzí softwaru a vyhodnotit jestli je výkon novější verze jiný. Nástroj využívá výsledky měření běžných benchmarkovacích frameworků. Porovnáním výsledků měření těchto frameworků pomocí statistických metod zjišťuje změny výkonu mezi verzemi. Stejně tak jako unit testy upozorní uživatele, pokud jeho kód není korektní, tak i Perf- Eval upozorňuje uživatele na změnu výkonu. PerfEval je konzolová aplikace, a tudíž je možné jej ovládat jednoduše ze skriptů stejně jako unit testy. Keywords: testování|výkonnost; testing|performance Available in a digital repository NRGL
PerfEval: Spojení unit testů s vyhodnocováním výkonu

When developing software, unit tests are commonly used. This thesis proposes Perf- Eval, a tool that performs performance testing in a similar way. The PerfEval tool is designed to compare the ...

Hrdý, Dominik; Tůma, Petr; Hnětynka, Petr
Univerzita Karlova, 2024

Textové šifry jako nástroj pro lepší pochopení modelů Transformer
Provazník, Jan; Libovický, Jindřich; Kasner, Zdeněk
2024 - English
The Transformer architecture is very popular, so it is potentially im- pactful to interpret what influences its performance. We test the hypothesis that the model relies on the linguistic properties of a text when working with it. We remove interference with cultural aspects of meaning by using a character-level task with the ByT5 Transformer model. We train ByT5 to decipher sentences encrypted with text ciphers (Vigenère, Enigma). We annotate a sentence dataset with linguistic properties with published NLP tools. On this dataset, we study the relationships between the linguistic properties and the fine-tuned ByT5 decipherment error rate. We analyze correlations, train ML models to predict error rates from the properties and interpret them with SHAP. We find small significant correlations but can- not predict error rates from the properties. We conclude the properties we identified do not give much insight into the performance of the Transformer. Architektura Transformer je velmi populární, takže může být potenciálně významné interpretovat, co ovlivňuje její výkon. Testujeme hypotézu, že mo- del se při práci s textem spoléhá na jeho lingvistické vlastnosti. Abychom eli- minovali vliv kultury na význam, používáme úlohu pracující na úrovni znaků s Transformer modelem ByT5. Dotrénujeme ByT5-small na dešifrování vět zašifrovaných pomocí textových šifer (Vigenère, Enigma). Anotujeme eva- luační dataset vět pomocí publikovaných nástrojů pro NLP. Na evaluačním datasetu zkoumáme vztahy mezi lingvistickými vlastnostmi a četností chyb dotrénovaného ByT5 při dešifrování vět. Analyzujeme korelace, trénujeme ML modely na predikci četnosti chyb věty z jijích lingvistických vlastností a interpretujeme důležitost vlastností pomocí SHAP. Nacházíme malé signifi- kantní korelace, ale predikce četnosti chyb z vlastností selhává. Dospíváme k závěru, že identifikované vlastnosti neposkytují vhled do výkonu Transfor- merů. Keywords: Transformer|interpretovatelnost|NLP|deep learning|šifry; Transformer|interpretability|NLP|deep learning|ciphers Available in a digital repository NRGL
Textové šifry jako nástroj pro lepší pochopení modelů Transformer

The Transformer architecture is very popular, so it is potentially im- pactful to interpret what influences its performance. We test the hypothesis that the model relies on the linguistic properties ...

Provazník, Jan; Libovický, Jindřich; Kasner, Zdeněk
Univerzita Karlova, 2024

Aplikace na vytváření kytarových zpěvníku z písní dostupných na webu
Mezera, Matěj; Kliber, Filip; Kofroň, Jan
2024 - Czech
The guitar songbook is a list of song lyrics with chords. Most guitarists create their own songbooks, and the existing programs for guitar songbook creation may not cover most of the features that the user expects from them. In this work we are focusing on design and implementation of a new application for guitar songbook creation. The application differs from others in that it allows you to add songs available on the Internet to the songbook. Songs from websites are added to the songbook using the web scraping technique. Other functions of the application are for example editing existing songs, saving the songbook for later editing or adding your own songs to the songbook. The resulting songbook can be saved in several formats, especially in PDF format. Kytarový zpěvník je seznam textů písní s akordy. Většina kytaristů si vytváří vlastní zpěvníky, přičemž existující programy pro tvorbu kytarového zpěvníku nemusí pokrývat většinu funkcí, které od nich uživatel očekává. V této práci se zabýváme návrhem a implementací nové aplikace, která slouží k tvorbě kytarového zpěvníku. Aplikace se od ostatních liší tím, že umožňuje přidávat do zpěvníku písně dostupné na internetu. Písně se z webových stránek přidávají do zpěvníku pomocí techniky web scraping. Dalšími funkcemi aplikace jsou například úprava existujících písní, uložení zpěvníku pro pozdější úpravu či přidávání vlastních písní do zpěvníku. Výsledný zpěvník lze uložit v několika formátech, především ve formátu PDF. Keywords: zpěvník|application|web|scraping; songbook|application|web|scraping Available in a digital repository NRGL
Aplikace na vytváření kytarových zpěvníku z písní dostupných na webu

The guitar songbook is a list of song lyrics with chords. Most guitarists create their own songbooks, and the existing programs for guitar songbook creation may not cover most of the features that the ...

Mezera, Matěj; Kliber, Filip; Kofroň, Jan
Univerzita Karlova, 2024

Maskované nadřetězce pro efektivní reprezentaci a indexování množin k-merů
Sladký, Ondřej; Veselý, Pavel; Medvedev, Paul
2024 - English
The exponential growth of genomic data calls for novel space-efficient algorithms for compression and search. State-of-the-art approaches often rely on tokenization of the data into k-mers, which are substrings of a fixed length. The popularity of k-mer based methods has led to the development of compact textual k-mer set representations, however, these rely on structural assumptions about the data which may not hold in practice. In this thesis, we demonstrate that all these representations can be viewed as superstrings of the k-mers, and as such can be generalized into a unified framework that we call the masked superstrings of k-mers. We provide two different greedy heuristics for their computation and implement them in a tool called KmerCamel. We further demonstrate that masked superstrings can serve as a building block of a novel, simple k-mer set index which we call FMS-index. Additionally, if masked superstrings further integrate a demasking function f, the resulting f-masked superstrings framework allows for seamless set operations with k-mers. We experimentally evaluate the performance of masked superstrings, as well as of our FMS-index implementation, FMSI, and show that masked superstrings achieve better compression in situations where the previous methods were far from optima. Furthermore, we... Současný exponenciální nárůst genomických dat vyžaduje nové prostorově úsporné algoritmy pro jejich kompresi a vyhledávání. Moderní přístupy často místo původních dat využívají příslušných množin k-merů, což jsou podřetězce pevné délky k. Popu- larita metod založených na k-merech vedla k vzniku kompaktních textových reprezen- tací množin k-merů, jež však stojí na strukturálních předpokladech, které pro data v praxi nemusí platit. V této bakalářské práci ukážeme, že na všechny tyto reprezentace lze nahlížet jako na nadřetězce množin k-merů a jako takové je zobecníme pomocí uceleného konceptu, kterému říkáme maskované nadřetězce k-merů. Navrhneme dva různé hladové algoritmy na jejich výpočet a implementujeme je v nástroji KmerCamel. Dále demonstru- jeme, že maskované nadřetězce fungují jako stavební kámen pro nový a jednoduchý index pro množiny k-merů, který nazýváme FMS-index. Pokud k maskovaným nadřetězcům přiřadíme navíc odmaskovávací funkci f, výsledný koncept f-maskovaných nadřetězců umožňuje jednoduché provádění množinových operací s k-mery. Experimentálně ověříme prostorovou úspornost maskovaných nadřetězců, stejně tak i naší implementace FMS- indexu. Ukážeme, že maskované nadřetězce jsou lépe komprimovatelné v situacích, kde předchozí přístupy byly daleko od optima a že FMS-index je prostorově... Keywords: množiny k-merů|bioinformatika|výpočetní genomika|datové struktury|algoritmy|problém nejkratšího nadřetězce; k-mer sets|bioinformatics|computational genomics|data structures|algorithms|shortest superstring problem Available in a digital repository NRGL
Maskované nadřetězce pro efektivní reprezentaci a indexování množin k-merů

The exponential growth of genomic data calls for novel space-efficient algorithms for compression and search. State-of-the-art approaches often rely on tokenization of the data into k-mers, which are ...

Sladký, Ondřej; Veselý, Pavel; Medvedev, Paul
Univerzita Karlova, 2024

Vícejazyčné propojování entit pomocí vektorového vyhledávání
Farhan, Dominik; Straka, Milan; Bojar, Ondřej
2024 - English
Entity linking (EL) is the computational process of connecting textual mentions to corresponding entities. Like many areas of natural language processing, the EL field has greatly benefited from deep learning, leading to significant performance improvements. However, present-day approaches are expensive to train and rely on diverse data sources, complicating their reproducibility. In this thesis, we develop multiple systems that are fast to train, demonstrating that competitive entity linking can be achieved without a large GPU cluster. Moreover, we train on a publicly available dataset, ensuring reproducibility and accessibility. Our models are evaluated for 9 languages giving an accurate overview of their strengths. Furthermore, we offer a detailed analysis of bi-encoder training hy- perparameters, a popular approach in EL, to guide their informed selection. Overall, our work shows that building competitive neural network based EL systems that oper- ate in multiple languages is possible even with limited resources, thus making EL more approachable. Propojování entit je úloha, ve které jsou zmínky z textu propojovány s příslušnými entitami. Stejně jako v mnoha jiných oblastech zpracovaní přirozeného jazyka se i v pro- pojování entit výrazně projevil vliv hlubokého učení, což vedlo k významnému zlepšení výkonu. V současnosti se ale stávající modely trénují pomalu a spoléhají na nejednotné zdroje dat, což ve výsledku komplikuje reprodukovatelnost. V této práci vyvíjíme něko- lik systémů, které se učí rychle, čímž ukazujeme, že konkurenceschopných výsledků lze dosáhnout i bez velkého GPU clusteru. Zároveň trénujeme na konkrétním veřejně dostup- ném datasetu. Naše výsledky jsou tak snadno reprodukovatelné. Modely vyhodnocujeme na devíti jazycích, což nám poskytuje kvalitní přehled o jejich silných stránkách. Mimo to také podrobně analyzujeme nastavení značného množství hyperparametrů bi-enkóderů - populárního přístupu pro propojování entit - čímž zjednodušujeme rozhodování na- vazujícím pracem. Náš výzkum ukazuje, že lze vytvářet silné mnohojazyčné systémy na propojování entit i za použití pouze omezených výpočetních zdrojů. Tím činíme celou úlohu přístupnější. Keywords: propojování entit|vektorové vyhledávání|vícejazyčné propojování entit|bi-enkóder; entity linking|dense retrieval|entity disambiguation|multilingual entity linking|bi-encoder Available in a digital repository NRGL
Vícejazyčné propojování entit pomocí vektorového vyhledávání

Entity linking (EL) is the computational process of connecting textual mentions to corresponding entities. Like many areas of natural language processing, the EL field has greatly benefited from deep ...

Farhan, Dominik; Straka, Milan; Bojar, Ondřej
Univerzita Karlova, 2024

About project

NRGL provides central access to information on grey literature produced in the Czech Republic in the fields of science, research and education. You can find more information about grey literature and NRGL at service web

Send your suggestions and comments to nusl@techlib.cz

Provider

http://www.techlib.cz

Facebook

Other bases