Počet nalezených dokumentů: 22292
Publikováno od do

Optimalizace energie v rodinném domě
David, Jakub; Fink, Jiří; Švancara, Jiří
2024 - anglický
The goal of this thesis is to compare various optimization algorithms for optimizing energy usage in residential households. We consider a model of a household with heat and power cogeneration, fixed electricity and domestic hot water consumption and devices with controllable start of their operation. For this problem, we use a mixed-integer linear programming solver, and we implemented local search, evolutionary algorithm and particle swarm optimization. We compare these algorithms on data measured from multiple different households. Cílem této práce je porovnat různé optimalizační algoritmy pro optimalizaci spotřeby energie v domácnostech. Uvažujeme model domácnosti s kogenerací tepla a elektřiny, fixní spotřebou elektřiny a horké vody a se zařízenímy s ovladatelným začátkem provozu. K řešení tohoto problému používáme řešič smíšeně celočíselných lineárních úloh a imple- mentovali jsme lokální prohledávání, evoluční algoritmus a optimalizaci hejnem částic. Tyto algoritmy provnáváme na datech naměřených v různých domácnostech. Klíčová slova: optimalizace energie|MILP|lokální prohledávání|přírodou inspirované algoritmy; energy optimization|MILP|local search|nature inspired algorithms Plné texty jsou dostupné v digitálním repozitáři NUŠL
Optimalizace energie v rodinném domě

The goal of this thesis is to compare various optimization algorithms for optimizing energy usage in residential households. We consider a model of a household with heat and power cogeneration, fixed ...

David, Jakub; Fink, Jiří; Švancara, Jiří
Univerzita Karlova, 2024

Nástroj lsql-csv na zpracování CSV souborů z příkazového řádku
Šťastný, Přemysl; Hubička, Jan; Pangrác, Ondřej
2024 - anglický
lsql-csv is a tool for small CSV file data querying from a shell with short queries. It makes it possible to work with small CSV files like with a read-only relational databases. The tool implements a new language LSQL similar to SQL, specifically designed for working with CSV files in a shell. LSQL aims to be a more lapidary language than SQL. Its design purpose is to enable its user to quickly write simple queries directly to the terminal. 1 lsql-csv je nástroj pro provádění krátkých dotazů nad daty malých CSV souborů z shellu. Díky němu je možné pracovat s malými CSV soubory jako s read-only relační databází. Nástroj implementuje nový jazyk LSQL podobný SQL, speciálně navržený pro práci se CSV soubory v shellu. Designovým cílem LSQL je být lapidárnějším jazykem než SQL. Účelem jeho návrhu je umožnit uživateli rychle psát jednoduché dotazy přímo do terminálu. 1 Klíčová slova: relační databáze|CSV|SQL|Haskell|dotazovací jazyk|unixová filozofie|lsql-csv|LSQL; relational database|CSV|SQL|Haskell|query language|Unix philosophy|lsql-csv|LSQL Plné texty jsou dostupné v digitálním repozitáři NUŠL
Nástroj lsql-csv na zpracování CSV souborů z příkazového řádku

lsql-csv is a tool for small CSV file data querying from a shell with short queries. It makes it possible to work with small CSV files like with a read-only relational databases. The tool implements a ...

Šťastný, Přemysl; Hubička, Jan; Pangrác, Ondřej
Univerzita Karlova, 2024

Zpracování jízdních řádů
Mrkus, František; Fink, Jiří; Pilát, Martin
2024 - anglický
A goal of this thesis is to create an open-source application which could serve as foundation for public bus transport analysis and organizing, while di- rectly operating with timetables in a JDF format for a comfortable workflow. The application is centered aroud bus scheduling for public transport orga- nizers and agencies,including related functions such as displaying timetable sheets and departure/arrival lists, map visualization of the planned routes, and creation of custom timetables. All of these features were sucesfully im- plemented and tested on real-world data. Cílem této práce je vytvořit open-source aplikaci, která by mohla slou- žit jako základ pro analýzu a organizaci veřejné autobusové dopravy, přičemž přímo pracuje s jízdními řády ve formátu JDF, pro zajištění pohodlného pra- covního postupu. Aplikace je zaměřena na plánování autobusových spojů pro organizátory a dopravce veřejné dopravy, včetně souvisejících funkcí, jako je zobrazení jízdních řádů a seznamů odjezdů/příjezdů, vizualizace plánovaných tras na mapě a vytváření vlastních jízdních řádů. Všechny tyto funkce byly úspěšně implementovány a otestovány na reálných datech. Klíčová slova: rozvrhování autobusů|veřejná doprava|optimalizace|vývěsný jízdní řád; bus scheduling|public transport|optimization|spreadsheet timetable Plné texty jsou dostupné v digitálním repozitáři NUŠL
Zpracování jízdních řádů

A goal of this thesis is to create an open-source application which could serve as foundation for public bus transport analysis and organizing, while di- rectly operating with timetables in a JDF ...

Mrkus, František; Fink, Jiří; Pilát, Martin
Univerzita Karlova, 2024

Segmentace skenovanych PDF dokumentů
Saydametov, Nikita; Šikudová, Elena; Tódová, Lucia
2024 - anglický
Klíčová slova: PDF|OCR|segmentace; PDF|OCR|segmentation Plné texty jsou dostupné v digitálním repozitáři NUŠL
Segmentace skenovanych PDF dokumentů

Saydametov, Nikita; Šikudová, Elena; Tódová, Lucia
Univerzita Karlova, 2024

Textové šifry jako nástroj pro lepší pochopení modelů Transformer
Provazník, Jan; Libovický, Jindřich; Kasner, Zdeněk
2024 - anglický
The Transformer architecture is very popular, so it is potentially im- pactful to interpret what influences its performance. We test the hypothesis that the model relies on the linguistic properties of a text when working with it. We remove interference with cultural aspects of meaning by using a character-level task with the ByT5 Transformer model. We train ByT5 to decipher sentences encrypted with text ciphers (Vigenère, Enigma). We annotate a sentence dataset with linguistic properties with published NLP tools. On this dataset, we study the relationships between the linguistic properties and the fine-tuned ByT5 decipherment error rate. We analyze correlations, train ML models to predict error rates from the properties and interpret them with SHAP. We find small significant correlations but can- not predict error rates from the properties. We conclude the properties we identified do not give much insight into the performance of the Transformer. Architektura Transformer je velmi populární, takže může být potenciálně významné interpretovat, co ovlivňuje její výkon. Testujeme hypotézu, že mo- del se při práci s textem spoléhá na jeho lingvistické vlastnosti. Abychom eli- minovali vliv kultury na význam, používáme úlohu pracující na úrovni znaků s Transformer modelem ByT5. Dotrénujeme ByT5-small na dešifrování vět zašifrovaných pomocí textových šifer (Vigenère, Enigma). Anotujeme eva- luační dataset vět pomocí publikovaných nástrojů pro NLP. Na evaluačním datasetu zkoumáme vztahy mezi lingvistickými vlastnostmi a četností chyb dotrénovaného ByT5 při dešifrování vět. Analyzujeme korelace, trénujeme ML modely na predikci četnosti chyb věty z jijích lingvistických vlastností a interpretujeme důležitost vlastností pomocí SHAP. Nacházíme malé signifi- kantní korelace, ale predikce četnosti chyb z vlastností selhává. Dospíváme k závěru, že identifikované vlastnosti neposkytují vhled do výkonu Transfor- merů. Klíčová slova: Transformer|interpretovatelnost|NLP|deep learning|šifry; Transformer|interpretability|NLP|deep learning|ciphers Plné texty jsou dostupné v digitálním repozitáři NUŠL
Textové šifry jako nástroj pro lepší pochopení modelů Transformer

The Transformer architecture is very popular, so it is potentially im- pactful to interpret what influences its performance. We test the hypothesis that the model relies on the linguistic properties ...

Provazník, Jan; Libovický, Jindřich; Kasner, Zdeněk
Univerzita Karlova, 2024

Maskované nadřetězce pro efektivní reprezentaci a indexování množin k-merů
Sladký, Ondřej; Veselý, Pavel; Medvedev, Paul
2024 - anglický
The exponential growth of genomic data calls for novel space-efficient algorithms for compression and search. State-of-the-art approaches often rely on tokenization of the data into k-mers, which are substrings of a fixed length. The popularity of k-mer based methods has led to the development of compact textual k-mer set representations, however, these rely on structural assumptions about the data which may not hold in practice. In this thesis, we demonstrate that all these representations can be viewed as superstrings of the k-mers, and as such can be generalized into a unified framework that we call the masked superstrings of k-mers. We provide two different greedy heuristics for their computation and implement them in a tool called KmerCamel. We further demonstrate that masked superstrings can serve as a building block of a novel, simple k-mer set index which we call FMS-index. Additionally, if masked superstrings further integrate a demasking function f, the resulting f-masked superstrings framework allows for seamless set operations with k-mers. We experimentally evaluate the performance of masked superstrings, as well as of our FMS-index implementation, FMSI, and show that masked superstrings achieve better compression in situations where the previous methods were far from optima. Furthermore, we... Současný exponenciální nárůst genomických dat vyžaduje nové prostorově úsporné algoritmy pro jejich kompresi a vyhledávání. Moderní přístupy často místo původních dat využívají příslušných množin k-merů, což jsou podřetězce pevné délky k. Popu- larita metod založených na k-merech vedla k vzniku kompaktních textových reprezen- tací množin k-merů, jež však stojí na strukturálních předpokladech, které pro data v praxi nemusí platit. V této bakalářské práci ukážeme, že na všechny tyto reprezentace lze nahlížet jako na nadřetězce množin k-merů a jako takové je zobecníme pomocí uceleného konceptu, kterému říkáme maskované nadřetězce k-merů. Navrhneme dva různé hladové algoritmy na jejich výpočet a implementujeme je v nástroji KmerCamel. Dále demonstru- jeme, že maskované nadřetězce fungují jako stavební kámen pro nový a jednoduchý index pro množiny k-merů, který nazýváme FMS-index. Pokud k maskovaným nadřetězcům přiřadíme navíc odmaskovávací funkci f, výsledný koncept f-maskovaných nadřetězců umožňuje jednoduché provádění množinových operací s k-mery. Experimentálně ověříme prostorovou úspornost maskovaných nadřetězců, stejně tak i naší implementace FMS- indexu. Ukážeme, že maskované nadřetězce jsou lépe komprimovatelné v situacích, kde předchozí přístupy byly daleko od optima a že FMS-index je prostorově... Klíčová slova: množiny k-merů|bioinformatika|výpočetní genomika|datové struktury|algoritmy|problém nejkratšího nadřetězce; k-mer sets|bioinformatics|computational genomics|data structures|algorithms|shortest superstring problem Plné texty jsou dostupné v digitálním repozitáři NUŠL
Maskované nadřetězce pro efektivní reprezentaci a indexování množin k-merů

The exponential growth of genomic data calls for novel space-efficient algorithms for compression and search. State-of-the-art approaches often rely on tokenization of the data into k-mers, which are ...

Sladký, Ondřej; Veselý, Pavel; Medvedev, Paul
Univerzita Karlova, 2024

Vícejazyčné propojování entit pomocí vektorového vyhledávání
Farhan, Dominik; Straka, Milan; Bojar, Ondřej
2024 - anglický
Entity linking (EL) is the computational process of connecting textual mentions to corresponding entities. Like many areas of natural language processing, the EL field has greatly benefited from deep learning, leading to significant performance improvements. However, present-day approaches are expensive to train and rely on diverse data sources, complicating their reproducibility. In this thesis, we develop multiple systems that are fast to train, demonstrating that competitive entity linking can be achieved without a large GPU cluster. Moreover, we train on a publicly available dataset, ensuring reproducibility and accessibility. Our models are evaluated for 9 languages giving an accurate overview of their strengths. Furthermore, we offer a detailed analysis of bi-encoder training hy- perparameters, a popular approach in EL, to guide their informed selection. Overall, our work shows that building competitive neural network based EL systems that oper- ate in multiple languages is possible even with limited resources, thus making EL more approachable. Propojování entit je úloha, ve které jsou zmínky z textu propojovány s příslušnými entitami. Stejně jako v mnoha jiných oblastech zpracovaní přirozeného jazyka se i v pro- pojování entit výrazně projevil vliv hlubokého učení, což vedlo k významnému zlepšení výkonu. V současnosti se ale stávající modely trénují pomalu a spoléhají na nejednotné zdroje dat, což ve výsledku komplikuje reprodukovatelnost. V této práci vyvíjíme něko- lik systémů, které se učí rychle, čímž ukazujeme, že konkurenceschopných výsledků lze dosáhnout i bez velkého GPU clusteru. Zároveň trénujeme na konkrétním veřejně dostup- ném datasetu. Naše výsledky jsou tak snadno reprodukovatelné. Modely vyhodnocujeme na devíti jazycích, což nám poskytuje kvalitní přehled o jejich silných stránkách. Mimo to také podrobně analyzujeme nastavení značného množství hyperparametrů bi-enkóderů - populárního přístupu pro propojování entit - čímž zjednodušujeme rozhodování na- vazujícím pracem. Náš výzkum ukazuje, že lze vytvářet silné mnohojazyčné systémy na propojování entit i za použití pouze omezených výpočetních zdrojů. Tím činíme celou úlohu přístupnější. Klíčová slova: propojování entit|vektorové vyhledávání|vícejazyčné propojování entit|bi-enkóder; entity linking|dense retrieval|entity disambiguation|multilingual entity linking|bi-encoder Plné texty jsou dostupné v digitálním repozitáři NUŠL
Vícejazyčné propojování entit pomocí vektorového vyhledávání

Entity linking (EL) is the computational process of connecting textual mentions to corresponding entities. Like many areas of natural language processing, the EL field has greatly benefited from deep ...

Farhan, Dominik; Straka, Milan; Bojar, Ondřej
Univerzita Karlova, 2024

Vizuální editace doménové řídící informace pro plánování
Gráf, Martin; Barták, Roman; Chrpa, Lukáš
2024 - anglický
The ability to only define the physics of an environment in classical plan- ning tasks has been a long-standing obstacle in practical applications of such an approach. Current generic planners are typically capable of finding a solution to a given problem, but their inability to consider domain-specific constraints is often mirrored in a significant performance gap when compared to domain-specific algorithms. Remedying this gap would prove invaluable in making classical domain-independent planners viable in production envi- ronments. In this paper, we will first introduce the area of classical planning and briefly touch on popular approaches to solving planning tasks. We will then show the principle of Attributed Transition-Based Domain Control Knowledge, which encodes additional problem-specific information into a domain. Finally, we will present our implementation along with experimental results. Schopnost definovat pouze možnosti prostředí v úkolu klasického plá- nování je dlouhodobou překážkou pro praktické aplikace tohoto přístupu. Moderní obecné plánovače jsou typicky schopné nalézt řešení daného pro- blému, ale jejich neschopnost využít informací specifických pro doménu se často projeví ve výrazném rozdílu výkonu oproti algoritmům přizpůsobeným dané doméně. Pro použitelnost obecných plánovačů v produkčních prostře- dích je tudíž klíčové tento výkonostní rozdíl dohnat. V této práci nejprve představíme téma klasického plánování a krátce shr- neme běžné přístupy k řešení plánovacích problémů. Poté popíšeme princip Attributed Transition-Based Domain Control Knowledge, což je technika pro zakódování kontextuálních informací do domény a problému. Nakonec odpre- zentujeme naší implementaci spolu s experimentálními výsledky. Klíčová slova: znalostní inženýrství|doménové řídící informace|klasické plánování; domain control knowledge|classical planning|knowledge engineering Plné texty jsou dostupné v digitálním repozitáři NUŠL
Vizuální editace doménové řídící informace pro plánování

The ability to only define the physics of an environment in classical plan- ning tasks has been a long-standing obstacle in practical applications of such an approach. Current generic planners are ...

Gráf, Martin; Barták, Roman; Chrpa, Lukáš
Univerzita Karlova, 2024

Cesta Hora: Panství a přechodová symbolika ve Sporu Hora a Sutecha
Čermák, Michal; Pehal, Martin; Spalinger, Anthony John; Goebs, Katja
2024 - anglický
The present study explores the Ancient Egyptian tale Contendings of Horus and Seth, attested from the New Kingdom Papyrus Chester Beatty I, with focus on its complex symbolism and relationship to contemporary Egyptian religious thought and royal ideology. Intertextual ties between the tale and multiple Egyptian textual corpora are outlined, including ritual texts, funerary inscriptions, royal inscriptions of various types and literature proper. The symbolic analysis is followed by an interpretation of the story as a literary rite of passage, centred on the drama of royal succession, represented in the tale by the maturation of the god Horus. Elements of individual stages of this process are identified, with particular attention being given to the liminal aspect of succession, in which the various symbolic layers merge into a single narrative focused on the transformation of a prince into a king. The study shows how the tale presents a complex theology of kingship as an earthly image of the creator god, who subsumes in the drama of his ascension to the throne the totality of vital processes in the universe, including the revival of the dead in the afterlife and a cyclic renewal of the whole cosmos. The figure of the god Seth serves as another major focus of the thesis, which describes his... Tato studie zkoumá staroegyptský příběh Spor Hora a Sutecha, doložený na papyru Chester Beatty I z Nové říše se zaměřením na jeho složitou symboliku a vztah k soudobému egyptskému náboženskému myšlení a královské ideologii. Věnuje se intertextuálním vazbám mezi příběhem a četnými egyptskými textovými korpusy včetně rituálních textů, pohřebních nápisů, královských inskripcí a literatury. Po této symbolické analýze následuje výklad příběhu jako literárního přechodového rituálu, jehož středobod představuje drama královského nástupnictví, které je v příběhu reprezentováno dospíváním boha Hora. Práce identifikuje prvky jednotlivých fází tohoto procesu, přičemž zvláštní pozornost je věnována liminálnímu aspektu nástupnictví, v němž se různé symbolické vrstvy spojují v jediné vyprávění zaměřené na proměnu prince v krále. Studie v příběhu odhaluje komplexní teologii královského úřadu jako pozemského obrazu boha stvořitele, který v dramatu svého nástupu na trůn subsumuje souhrn vitálních procesů ve vesmíru včetně oživení mrtvých v posmrtném životě a cyklické obnovy celého kosmu. Zkoumání postavy boha Sutecha představuje druhý ústřední prvek práce, která popisuje jeho nezastupitelnou funkci v životním cyklu kralování. Sutech je ukázán jako komplementární kosmický princip k Horovi, a zajišťuje trvalou... Klíčová slova: Arnold van Gennep|Dér el-Medína|Hor|Kruhová kompozice|Liminalita|Maurice Bloch|Mýtus a rituál|Papyrus Chester Beatty I|Pozdně egyptská literatura|Přechodové rituály|Přechodové rituály (Starý Egypt)|Spor Hora a Sutecha|Staroegyptská kosmologie|Staroegyptská literatura|Staroegyptská mytologie|Staroegyptské náboženství|Staroegyptský královský úřad|Sutech|Victor Turner; Ancient Egyptian Cosmology|Ancient Egyptian Kingship|Ancient Egyptian Literature|Ancient Egyptian Mythology|Ancient Egyptian Religion|Arnold van Gennep|Contendings of Horus and Seth|Deir el-Medina|Horus|Late Egyptian Literature|Liminality|Maurice Bloch|Myth and Ritual|Papyrus Chester Beatty I|Ring Composition|Rites of Passage|Rites of Passage (Ancient Egypt)|Seth|Victor Turner Plné texty jsou dostupné v digitálním repozitáři NUŠL
Cesta Hora: Panství a přechodová symbolika ve Sporu Hora a Sutecha

The present study explores the Ancient Egyptian tale Contendings of Horus and Seth, attested from the New Kingdom Papyrus Chester Beatty I, with focus on its complex symbolism and relationship to ...

Čermák, Michal; Pehal, Martin; Spalinger, Anthony John; Goebs, Katja
Univerzita Karlova, 2024

Experimentální analýza dotazovacích jazyků v moderních databázových systémech
Čorovčák, Martin; Koupil, Pavel; Holubová, Irena
2024 - anglický
The rise of Big Data has highlighted the limitations of relational databases while handling large datasets, leading to the growth of NoSQL databases. This has made DBMS benchmarking crucial for performance evaluation and decision-making. This thesis compares relational (MySQL, SQLite), graph (Neo4j, ArangoDB), docu- ment (MongoDB), and column-family (Cassandra) databases. We analyze the expressive power of their query languages and their runtime efficiency across varying data sizes. We conclude, that there's no "number one" solution for all use cases. The choice depends on factors like data volume, query complexity, and the need for joins. For complex queries and frequent joins, MySQL and SQLite are the most expressive but may struggle with very large datasets. Cassandra and MongoDB excel in perfor- mance and scalability but require efficient schema design and targeted data redundancy. ArangoDB presents a versatile option capable of handling multiple data models but might require further investigation into its performance compared to Neo4j. Príchod Vel'kých Dát poukázal na obmedzenia relačných databáz pri spracovanível'kých datasetov, čo viedlo k nárastu NoSQL databáz. Z tohto dôvodu sa DBMS benchmarking stal kl'účovým pre hodnotenie výkonnosti a celkový rozhodovací proces. Táto práca porovnáva relačné (MySQL, SQLite), grafové (Neo4j, ArangoDB), doku- mentové (MongoDB) a stĺpcovo-orientované (Cassandra) databázy. Analyzujeme vyja- drovaciu silu ich dopytovacích jazykov a efektivitu počas behu pri rôznych vel'kostiach dát. Dospeli sme k záveru, že neexistuje žiadne riešenie "číslo jeden" pre všetky prípady použitia. Výber závisíod faktorov, ako je objem dát, zložitost' dopytov a potreba spájania. V prípade zložitých dotazov a častého spájania majú MySQL a SQLite najv̈ačšiu vy- jadrovaciu silu, avšak môžu mat' problémy s vel'mi vel'kými datasetmi. Cassandra a Mon- goDB vynikajú výkonom a škálovatel'nost'ou, ale vyžadujú efektívny návrh schématu a cielenú redundanciu dát. ArangoDB predstavuje univerzálnu možnost', ktorá dokáže pra- covat' s viacerými dátovými modelmi, ale pre hlbšie porovnanie s Neo4j sa môže vyžadovat' d'alší výskum ich výkonu. Klíčová slova: databázové systémy|výkon|benchmark|statická analýza|experimentální analýza; database management systems|performance|benchmark|static analysis|experimental analysis Plné texty jsou dostupné v digitálním repozitáři NUŠL
Experimentální analýza dotazovacích jazyků v moderních databázových systémech

The rise of Big Data has highlighted the limitations of relational databases while handling large datasets, leading to the growth of NoSQL databases. This has made DBMS benchmarking crucial for ...

Čorovčák, Martin; Koupil, Pavel; Holubová, Irena
Univerzita Karlova, 2024

O službě

NUŠL poskytuje centrální přístup k informacím o šedé literatuře vznikající v ČR v oblastech vědy, výzkumu a vzdělávání. Více informací o šedé literatuře a NUŠL najdete na webu služby.

Vaše náměty a připomínky posílejte na email nusl@techlib.cz

Provozovatel

http://www.techlib.cz

Facebook

Zahraniční báze