Approximace přesnosti modelu v optimalizaci hyper-parametru
Borovička Tomáš; Jůzlová Markéta; Vašata Daniel
2018 - English
Cílem automatické optimalizace hyper-parametrů je najít nastavení hyper-parameterů učícího algorithm bez lidské pomoci. Protože k vyhodnocení jednoho nastavení je potřeba natrénovat daný model, optimalizační metody které se snaží redukovat počet vyhodnocení jsou třeba. Užitečná technika jsou takzvané náhradní modely, které aproximují přesnost modelu s danou konfigurací. Tato práce zkoumá některé postupy optimalizace hyper-parameterů. Mezi popsané metody patří dvě tradiční methody: mřížková optimalizace a náhodná optimalizace, a dvě nejpokročilejší metody: sekvenční optimalizace založená na náhradním modelu (Bayesovská optimalizace) a Hyperband. Dále je popsáno několik náhradních modelů, které mohou být použity ke zlepšení optimalizace. Efektivita optimalizace a přesnost náhradních modelů je porovnána na dvou datasetech s různým stupněm obtížnosti a algoritmu dopředných umělých neuronových sítí. Výsledky ukazují, že Hyperband dosahuje nejlepších výsledků na obouch datasetech. Analýza výsledků také potvrzuje, že náhradní modely směřují hledání do slibných oblastí a tím urychlují optimalizaci.Automatic hyper-parameter optimization aims to tune hyper-parameters of machine learning algorithms without human effort. Due to necessity to learn a model to evaluate a configuration, optimization methods that avoid excessive amount of evaluations are desired for the task. A useful technique is to employ a surrogate model which approximates performance of the trained model with given configuration. This thesis reviews some of the approaches that are being used for the hyper-parameter optimization. The described methods include two traditional methods: grid search and random search as a baseline, and two state-of-the-art techniques: sequential model-based optimization (Bayesian optimization) and Hyperband. Several surrogate models that can be used to improve the optimization are described. The performance of the methods and the surrogate models is compared using two datasets of different complexity and a feed-forward artificial neural network as the machine learning algorithm. On both tasks, Hyperband outperforms the other methods. The analysis also confirms that the surrogate models positively bias the search to promising regions and, thus, speed up the optimization.
Keywords:
optimalizace hyper-parametrů,náhradní modely,approximace přesnosti modelů,optimalizace s náhradním modelem,Bayesovská optimalizace,Hyperband; hyper-parameter optimization,surrogate modeling,performance approximation,model-based optimization,Bayesian optimization,Hyperband
Available at various departments of the ČVUT.
Approximace přesnosti modelu v optimalizaci hyper-parametru
Cílem automatické optimalizace hyper-parametrů je najít nastavení hyper-parameterů učícího algorithm bez lidské pomoci. Protože k vyhodnocení jednoho nastavení je potřeba natrénovat daný model, ...
Proces strojového učení pro spektroskopická data
Borovička Tomáš; Zvolský Grant; Maldonado Lopez Juan Pablo
2018 - English
Data ze spektroskopických senzorů často vyžadují zpracování specifické pro daný problém. Cílem této práce je navrhnout framework strojového učení pro analýzu spektroskopických dat. Práce představuje běžné metody zpracování spektroskopických dat a kombinuje je do tzv. pipelines. Framework je navržen s důrazem na jednoduchost a expresivitu. Na závěr je framework testován na praktickém zadání, které je úspěšně splněno. Navržený framework má potenciál pro budoucí využití.Data from spectroscopic sensors often require problem-specific methods of processing. This thesis aims to design a machine learning framework for the analysis of spectroscopic data. Common spectroscopic data processing methods are introduced and combined into so-called pipelines. The framework is designed with a focus on simplicity and expressivity. It is then successfully tested on a practical problem and the framework does have a potential for future use.
Keywords:
analýza spektroskopických dat,prediktivní modelování,framework pro strojové učení; spectroscopic data analysis,predictive modelling,machine learning framework
Available at various departments of the ČVUT.
Proces strojového učení pro spektroskopická data
Data ze spektroskopických senzorů často vyžadují zpracování specifické pro daný problém. Cílem této práce je navrhnout framework strojového učení pro analýzu spektroskopických dat. Práce představuje ...
Diagnostika laserem urychlených protonů s využitím radiochromických filmů
Giuffrida Lorenzo; Odložilík Boris; Krása Josef
2018 - English
Urychlování iontů s využitím laseru je, díky svým možným aplikacím v mnoha oborech (produkce izotopů, radioterapie, radiografie, atd.), v současné době důležitou a perspektivní oblastí vědeckého výzkumu. V rámci snahy vysvětlit mechanismy zodpovědné za urychlení iontů pomocí laseru byla v průběhu posledních desetiletí provedena celá řada simulací a experimentů. V roce 2017 byl proveden experiment v Rutherford Appleton Laboratory (s použitím PW laserového systému VULCAN), kde byl využit inovativní kryogenický vodíkový terč. Tento experiment je zde prezentován, spolu s daty naměřenými s využitím radiochromických filmů (RCF) a jejich interpretací. Tato práce byla vypracována v ELI Beamlines (Fyzikální ústav, AV ČR, v.v.i.) v rámci skupiny ELIMAIA (výzkumný program 3) a klade si za cíl rozvíjet využití diagnostiky (např. postupy zpracování naměřených dat a simulace), která využívá štosové RCF detektory. Způsob vytváření RCF štosů je prezentován spolu s několika názornými příklady. Zařízení umožňující spolehlivou manipulaci se štosovými RCF detektory bylo navrženo pro práci ve vakuové komoře ELIMAIA.Research of the laser driven ion acceleration is an important and promising field of study because of its many possible applications in different scientific areas (isotope production, radiotherapy, radiography, etc.). Many simulations and experiments were performed in last decades to explain the laser-driven ion acceleration mechanisms in different laser regimes. In 2017 an experiment using an innovative cryogenic H-target was performed at the Rutherford Appleton Laboratory (PW VULCAN laser system) and is discussed in this thesis, together with radiochromic film (RCF) diagnostics results. This thesis was completed at the ELI Beamlines facility (Institute of Physics, AS CR, v.v.i.) in Prague within the ELIMAIA team (research program 3) and aims to develop a tool useful for modeling and analyzing irradiated RCF stack results. RCF stack building process is presented as well as several stack design examples. Moreover, RCF holder for convenient and reliable manipulation with RCF stacks in the ELIMAIA beamline has been designed.
Keywords:
Radiochromické filmy,stopový detektor CR39,dávka,laserové urychlování,diagnostika iontových svazků,Fluka software,SRIM software,metoda Monte Carlo; Radiochromic films,nuclear track detector CR39,dose,laser acceleration,ion beam diagnostics,Fluka software,SRIM software,Monte Carlo method
Available at various departments of the ČVUT.
Diagnostika laserem urychlených protonů s využitím radiochromických filmů
Urychlování iontů s využitím laseru je, díky svým možným aplikacím v mnoha oborech (produkce izotopů, radioterapie, radiografie, atd.), v současné době důležitou a perspektivní oblastí vědeckého ...
Aktivní semi-supervizované shlukování
Borovička Tomáš; Švehla Jakub; Klouda Karel
2018 - English
Shlukování dat je velice náročný problém, protože v mnoha případech existuje mnoho možných způsobů rozdělení daného datasetu. Shlukování je proto výrazně subjektivní a závislé na daném problému. Aktivní semi-supervisované shlukovací metody aktivně získávají znalost o daném datasetu tak, aby docílily co nejlepšího shlukování pro daný problém. V této práci analyzujeme několik aktivních semi-supervizovaných shlukovacích metod s důrazem na metody, které využívají informace o omezeních dvojic bodů. Dále analyzujeme tři metody pro aktivní učení těchto omezení. Se všemi metodami byly provedeny experimenty na několika různých datasetech. Výsledky experimentů ukazují, že aktivní semi-supervizované metody výrazně zlepšují kvalitu shlukování oproti běžným shlukovacím metodám. Nicméně, žádná ze zkoumaných metod není lepší než ostatní metody na všech datasetech. V této práci navrhujeme další směry pro vylepšení zkoumaných metod.Clustering is a challenging problem since there usually exist multiple possible clusterings. This makes it strongly problem dependent and subjective. Active semi-supervised clustering methods are designed to actively ask for background knowledge in order to provide the best clustering for a given problem. This thesis reviews several state of the art semi-supervised clustering methods with emphasis on methods utilizing pairwise constraints and three schemes for active learning of pairwise constraints. Experiments are conducted to empirically evaluate all reviewed methods on various data sets. Results of the experiments show that active semi-supervised clustering significantly outperforms unsupervised clustering in terms of agreement with a reference clustering. However, none of the methods is superior to the other reviewed methods on all data sets. In the thesis, further directions for extending the current methods are proposed.
Keywords:
shlukování,semi-supervizované učení,aktivní učení,pairwise constraints; clustering,semi-supervised learning,active learning,pairwise constraints
Available at various departments of the ČVUT.
Aktivní semi-supervizované shlukování
Shlukování dat je velice náročný problém, protože v mnoha případech existuje mnoho možných způsobů rozdělení daného datasetu. Shlukování je proto výrazně subjektivní a závislé na daném problému. ...
Online detekce anomálií v časových řadách
Borovička Tomáš; Pajurek Tomáš; Vašata Daniel
2018 - English
Metody pro online detekci anomálií jsou navrženy pro odhalování anomalií ve spojitém proudu dat namísto ve statickém datasetu. Tyto metody jsou schopné se adaptovat na změny v charakteristice datového proudu, který může v čase nastávat (concept drift). Tato práce analyzuje čtyři metody vhodné pro online detekci anomálií v časových řadách (klouzavý průměr, local outlier factor, isolation forest, hierarchical temporal memory) a několik metod detekce concept driftu včetně některých nových přístupů. Je navrženo obecné schéma, které umožňuje kombinovat různé metody pro detekci anomálií a concept driftu. Pro všechny analyzované metody jsou provedeny experimenty na pěti realných datasetech a jednom umělém. Během experimentů byly zkoumány vlastnosti jednotlivých metod a porovnáván jejich výkon s ostatními metodami. Výsledky experimentů ukazují, že žádná metoda není lepší než ostatní na všech datasetech z hlediska F1 skóre upraveného pro úlohu detekce anomalií (harmonický průměr specificity a míry falešné pozitivních detekcí) a AUC. Ve většině případů bylo nalezeno optimální nastavení methody s F1 skóre >85% a AUC >90%.Methods for online anomaly detection are designed to reveal anomalies in a continuous stream of data rather than in a static dataset. These methods are able to adapt to the changes of underlying characteristics of the stream that might occur in time (concept drift). This thesis reviews four methods suitable for online anomaly detection in time-series (moving average, local outlier factor, isolation forest, hierarchical temporal memory) and several concept drift detection methods including some novel approaches. A general framework that allows to orthogonally combine various anomaly detection methods and concept drift detection methods is proposed. Experiments were executed for all reviewed methods on five real-world datasets and one artificial dataset. During the experiments, the properties of individual methods were examined as well as their performance compared to the other methods. Results of the experiments show that none of the methods is superior to the others on all datasets in terms of F1 score adapted for anomaly detection (harmonic mean of recall and false positive rate) and AUC. In the majority of cases, an optimal method settings with F1 score >85% and AUC >90% was found.
Keywords:
detekce anomálií,online,streaming,časové řady,klouzavý průměr,local outlier factor,isolation forest,hierarchical temporal memory; anomaly detection,online,streaming,time-series,moving average,local outlier factor,isolation forest,hierarchical temporal memory
Available at various departments of the ČVUT.
Online detekce anomálií v časových řadách
Metody pro online detekci anomálií jsou navrženy pro odhalování anomalií ve spojitém proudu dat namísto ve statickém datasetu. Tyto metody jsou schopné se adaptovat na změny v charakteristice datového ...
Analýza bezpečnosti USB paměti
Buček Jiří; Jagoš David; Kokeš Josef
2018 - English
Tato práce shrnuje bezpečnost flash disků s hardwarovou podporou šifrování a poskytuje bezpečnostní analýzu disku Kingston DataTraveler Vault Privacy.This thesis provides an overview of the security of flash drives with hardware encryption support and a security analysis of Kingston DataTraveler Vault Privacy.
Keywords:
šifrování flash disků,Kingston,DataTraveler Vault Privacy,DTVP,Phison,PS2251-63,PS2263; flash drive encryption,Kingston,DataTraveler Vault Privacy,DTVP,Phison,PS2251-63,PS2263
Available at various departments of the ČVUT.
Analýza bezpečnosti USB paměti
Tato práce shrnuje bezpečnost flash disků s hardwarovou podporou šifrování a poskytuje bezpečnostní analýzu disku Kingston DataTraveler Vault Privacy.This thesis provides an overview of the security ...
DeepRCar: Autonomní model auta
Buk Zdeněk; Ungurean David; Štepanovský Michal
2018 - English
Tato práce se zabývá stavbou modelu autonomního vozu na dálkové ovládání a jeho kontrolou pomocí hlubokých neuronových sítí. Vozidlo je schopno zatáčet samo pouze na základě vizuálního vstupu z přední kamery. Text práce popisuje jeho kompletní vývoj od výběru hardwarových komponent, návrhu kontrolního systému, až po selekci a učení konvoluční neuronové sítě, která ovládá nastavení kol. Model se naučil rozeznat okraje jízdního pruhu, přestože měl během učení přístup pouze ke dvojicím vstupní obrázek a příslušný úhel kol pro danou situaci. Finální systém operuje při 20 snímcích za sekundu na jednodeskovém počítači Raspberry Pi 3.I present DeepRCar, a simplified self-driving radio controlled car platform that is controlled by deep neural networks. This car takes images from a front facing camera as its only input and produces steering commands as output. This thesis describes the entire process of its creation from hardware requirements, through the design of the control system, up to the selection and training of a convolutional neural network that manages its driving decisions. The network was trained in an end-to-end manner and learned to recognize useful road features, such as lane markings, when only camera images and corresponding steering angles were presented during training. The final system is capable of running at 20 frames per second on a Raspberry Pi 3.
Keywords:
neuronové sítě,deep learning,konvoluce,autonomní vozidlo,Raspberry Pi,učení s učitelem,strojové vidění; neural network,deep learning,convolution,self-driving car,Rasp- berry Pi,end-to-end,supervised learning,computer vision
Available at various departments of the ČVUT.
DeepRCar: Autonomní model auta
Tato práce se zabývá stavbou modelu autonomního vozu na dálkové ovládání a jeho kontrolou pomocí hlubokých neuronových sítí. Vozidlo je schopno zatáčet samo pouze na základě vizuálního vstupu z přední ...
Zacházení s datovými strukturami na haldě ve zpětné symbolické exekuci
Ratschan Stefan; Husák Robert; Tvrdík Pavel
2018 - English
Cílem této práce je významně rozšířit AskTheCode, dříve vytvořený doplněk nástroje Microsoft Visual Studio, který využívá zpětnou symbolickou exekuci pro verifikaci asercí v kódu C#. Jedno z největších omezení našeho doplňku byla neschopnost analyzovat objekty na haldě a operace na nich. Pro doplnění této funkcionality jsme nejdříve začali rešerší existujících postupů, ze kterých jsme vybrali tři nejzajímavější: línou inicializaci, symbolickou inicializaci a využití teorie polí. Tyto techniky jsme důkladně analyzovali s přihlédnutím na specifické požadavky našeho nástroje. Díky jejím očekáváným výkonnostním charakteristikám jsme vybrali použití teorie polí. Tuto techniku jsme transformovali, aby ji bylo možné využít ve zpětné symbolické exekuci, včetně efektivního využití zásobníků podmínek v SMT řešičích. Na řadě příkladů v jazyce C# jsme následně ukázali korektnost této implementace.This thesis enhances AskTheCode, a previously created extension of Microsoft Visual Studio which uses backward symbolic execution to verify assertions in C# code. One of the biggest AskTheCode limitations was the inability to reason about heap objects and operations. In order to implement this feature, we started by surveying existing techniques. As the most promising ones were selected lazy initialization, symbolic initialization and the utilization of the theory of arrays. After an analysis driven by the specific requirements of our tool, we decided to utilize the theory of arrays, mainly due to its expected performance benefits. We transformed the technique to be usable for backward symbolic execution, utilizing assertion stacks of SMT solvers as efficiently as possible. Our solution was proven to be correct by an evaluation on several C# examples.
Keywords:
zpětná symbolická exekuce,symbolická halda,líná inicializace,symbolická inicializace,teorie polí; backward symbolic execution,symbolic heap,lazy initialization,symbolic initialization,theory of arrays
Available at various departments of the ČVUT.
Zacházení s datovými strukturami na haldě ve zpětné symbolické exekuci
Cílem této práce je významně rozšířit AskTheCode, dříve vytvořený doplněk nástroje Microsoft Visual Studio, který využívá zpětnou symbolickou exekuci pro verifikaci asercí v kódu C#. Jedno z ...
Vývoj nástroje pro konceptuální modelování Normalizovaných systémů
Pergl Robert; Uhnák Peter; Verelst Jan
2018 - English
Tato práce se zaměřuje na tvorbu modelovacího a diagramovacího nástroje v platformě OpenPonk pro potřeby Normalizovaných Systémů a meta-systému Prime Radiant. Stručně je představena teorie Normalizovaných Systémů, platformy OpenPonk a dalších nástrojů použitých při tvorbě modeláře. Pro potřebu integrace mezi systémem Prime Radiant a implementovaným modelářem jsou analyzovány soubory XML obsahující deskripce Normalizovaných Systémů. Z analýzy je následně zkonstruován vhodný metamodel. Jak proces analýzy, tak i výstupný metamodel je detailně rozebrán. Současná notace používaná pro Normalizované Systémy je obohacena, a mimo jiné čerpá z myšlenek notací jako je diagram databází, UML diagramy tříd či stavových strojů. Jsou probrány různé možnosti, návrhy a přístupy k diagramové tvorbě modelů Normalizovaných Systémů. Dále je představena série validačních pravidel pro modely Normalizovaných Systémů. Téma samotného popisu takových pravidel je probrána, stejně jako i aktuální způsob implementace. Neboť tato práce popisuje softwarový projekt, je modelář zanalyzován a zhodnocen z hlediska testování a testovatelnosti, stejně jako i dlouhodobé údřzby. Na závěr jsou shrunty přínosy této a práce a je navřžena série kroků vhodných k budoucímu prozkoumání.This thesis explores the topic of providing modeling and diagramming support for Normalized Systems constructed in the Prime Radiant tool using the OpenPonk modeling platform. The current state of the art of defining NS systems is summarized. The Normalized Systems theory, Prime Radiant, OpenPonk, and other framework used in the making of the modeler are introduced. The thesis then continues by analyzing the artifacts produced by the Prime Radiant that hold the definitions of NS systems. These artifacts are reverse engineered and a metamodel is constructed; both the process, and the result is discussed. Inspired by existing notations, such as Entity-Relationship diagrams, UML class diagrams, State Machine diagrams, and Flow diagrams, the existing NS diagramming notation is extended. It discusses various aspects not just of the notation itself, but also of the process of diagramming as a natural way to create the models. Several possibilities of forthcoming exploration are introduced. Modeling rules and validations are introduced and explored as a way to guide a user through possible pitfalls, and to raise the quality of the defined models. The implemented rules, the current state, and an approach relevent from mid- and long-term perspective is explored and discussed at length. As the main artifact of this thesis is a software project, testing, error tracking, and operations utilized in construction of the modeler are described. Finally, the achievements of this project are evaluated, and the path forward summarized.
Keywords:
Normalizované Systémy,Prime Radiant,OpenPonk,modelování,diagramování,vizualizace,Pharo,Smalltalk; Normalized Systems,Prime Radiant,OpenPonk,modeling,diagramming,visualizations,Pharo,Smalltalk
Available at various departments of the ČVUT.
Vývoj nástroje pro konceptuální modelování Normalizovaných systémů
Tato práce se zaměřuje na tvorbu modelovacího a diagramovacího nástroje v platformě OpenPonk pro potřeby Normalizovaných Systémů a meta-systému Prime Radiant. Stručně je představena teorie ...
Framework pro mobilní aplikace využívající Linked Data a registr RÚIAN
Klímek Jakub; Melka Martin; Dojčinovski Milan
2018 - English
Tato diplomová práce se zabývá návrhem a tvorbou frameworku, jenž umožní efektivní vizualizaci a vyhledávání v datech, která jsou propojena s existující sadou lokačních dat za využití principů propojených dat (Linked Data). Pro ověření a demonstraci funkcionality frameworku bude použit český Registr územní identifikace, adres a nemovitostí (RÚIAN). Navrhovaný framework definuje flexibilní způsob propojování entit bez lokačních údajů s městy, domy a jinými objekty z RÚIAN nebo jakéhokoliv jiného vyhovujícího zdroje propojených dat. Práce nejprve definuje RDF slovník, kterým lze popsat metainformace o propojovaných datech. Následně je vytvořena knihovna pro zpracování definic strukturovaných podle tohoto slovníku. Dále je navržen a implementován indexovací server, který zefektivní vyhledávání propojených objektů na základě jejich lokace. Nakonec je vytvořena klientská Android aplikace, využívající tento framework k zobrazování propojených dat na mapě.The aim of this thesis is to design and implement a framework which will allow for effective search and visualization of data linked to an existing geospatial dataset using the Linked Data principles. The functionality of the framework will be validated and demonstrated using geospatial data provided by the Czech registry of territorial identification, addresses and real estate (RÚIAN). The data is publicly accessible and large enough to assess the performance of the framework. The proposed framework defines a flexible mechanism of linking entities with no spatial information to cities, houses and other objects located in RÚIAN or any other Linked Data source. Firstly, an RDF vocabulary used to provide metadata about the data to be linked is defined in the thesis. Then, a parsing library is created that converts data structured according to the vocabulary into Java objects. After that, an indexing server is designed and implemented to speed up spatial queries. Finally, an Android client application leveraging this framework is created.
Keywords:
Propojená data,RÚIAN,Framework,RDF,Android,mapa; Linked Data,RÚIAN,Framework,RDF,Android,map
Available at various departments of the ČVUT.
Framework pro mobilní aplikace využívající Linked Data a registr RÚIAN
Tato diplomová práce se zabývá návrhem a tvorbou frameworku, jenž umožní efektivní vizualizaci a vyhledávání v datech, která jsou propojena s existující sadou lokačních dat za využití principů ...
NRGL provides central access to information on grey literature produced in the Czech Republic in the fields of science, research and education. You can find more information about grey literature and NRGL at service web
Send your suggestions and comments to nusl@techlib.cz
Provider
Other bases