Paralelní implementace dynamického naivního Bayesovského klasifikátoru
Šabata Tomáš; Lučivňák Pavel; Šimeček Ivan
2018 - anglický
Dynamický naivni Bayesovský klasifikátor (DNBC) nacházi využiti v mnoha oblastech, napřiklad při rozpoznáváni hlasu, pisma, nebo při předpovidáni počasi. DNBC je rozšiřenim skrytého Markovského modelu tim, že pod-poruje vice pozorovaných proměnných. Předpokládá se, že tyto proměnné jsou vzájemně statisticky nezávislé. Tento předpoklad značně zjednodušuje výpočty a nedocházi tak k jevu, který je znamý jako prokleti dimenzionatily. Klasifikátor byl naimplementován v programovacim jazyce Scala, nad platfor-mou Apache Spark. Diky technologii Apache Spark je možné implementaci paralelizovat pomoci Map Reduce paradigmatu. S touto paralelni implemen-taci se mi podařilo dosáhnout dvojnásobného zrychleni při využiti 15 pro-cesorových jader. Demonstroval jsem, že zrychleni lze dosáhnout nejenom vyššim počtem jader, ale i vyššim počtem výpočetnich uzlů v clusteru.Dynamic naive Bayesian classifier (DNBC) has many applications, such as in speech recognition, handwriting recognition or weather prediction. DNBC viiextends a hidden Markov model by supporting multiple observed variables. It is assumed that these variables are mutually statistically independent. This assumption greatly simplifies computations and a phenomenon called curse of dimensionality does not occur. I have implemented the classifier in Scala language on top of Apache Spark. The implementation can be parallelized by using Map Reduce paradigm. I have managed to double the speed up when using 15 processor cores. I have further demonstrated, that the speed up can be achieved not only by increasing the number of cores, but also by increasing the number of machines in a cluster.
Klíčová slova:
dynamický naivni Bayesovský klasifikátor,skrytý Markovův model,metoda maximálni věrohodnosti,Scala,Apache Spark; dynamic naive Bayesian classifier,hidden Markov model,maximum likelihood estimation,Scala,Apache Spark
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Paralelní implementace dynamického naivního Bayesovského klasifikátoru
Dynamický naivni Bayesovský klasifikátor (DNBC) nacházi využiti v mnoha oblastech, napřiklad při rozpoznáváni hlasu, pisma, nebo při předpovidáni počasi. DNBC je rozšiřenim skrytého Markovského modelu ...
Kompresní metoda LZFSE
Baier Jan; Hron Martin; Polách Radomír
2018 - anglický
Tato práce se zabývá kompresní metodou LZFSE, která kombinuje slovníkovou kompresi s technikou založenou na ANS (asymmetric numeral systems). Práce popisuje principy, na kterých tato metoda funguje, a analyzuje referenční implementaci, jejíž autorem je Eric Bainville. V rámci této práce je metoda LZFSE přidána jako nový modul do knihovny ExCom a porovnána s ostatními implementovanými metodami na datech Pražského Korpusu. Dále je prozkoumán vliv nastavitelných parametrů metody LZFSE.This thesis focuses on LZFSE compression method, which combines a dictionary compression scheme with a technique based on ANS (asymmetric numeral systems). It describes the principles on which the method works and analyses the reference implementation of LZFSE by Eric Bainville. As part of this thesis, the LZFSE method is added as a new module into the ExCom library and compared with other implemented compression methods using the files from the Prague Corpus. The impacts that different settings of adjustable LZFSE parameters have are also examined.
Klíčová slova:
LZFSE,knihovna ExCom,komprese dat,slovníkové kompresní metody,bezeztrátová komprese,finite state entropy,asymmetric numeral systems; LZFSE,ExCom library,data compression,dictionary compression methods,lossless compression,finite state entropy,asymmetric numeral systems
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Kompresní metoda LZFSE
Tato práce se zabývá kompresní metodou LZFSE, která kombinuje slovníkovou kompresi s technikou založenou na ANS (asymmetric numeral systems). Práce popisuje principy, na kterých tato metoda funguje, a ...
Rezervační systém pro fotbalové utkání
Pavlíčková Petra; Kosariev Nikolai; Vynikarová Dana
2018 - anglický
Tato bakalarska prace je zamerena na reseni problemu organizace fotbalovych utkani. Cilem prace je zanalyzovat soucasna reseni teto problematiky, navrhnout jejich vylepseni, prozkoumat pozadavky uzivatelu a na zaklade predchozich setreni navrhnout nejoptimalnejsi reseni a nasledne implementovat a otestovat prototyp rezervacniho systemu. Samotny rezervacni system bude realizovan jako webova aplikace postavena na Java frameworku Spring. Prototyp aplikace bude jakozto hlavni vystup teto prace podporovat autentizaci jednotlivych uzivatelu, vytvoreni novych utkani, vyhledavani jiz existujicich utkani a jejich zucastneni.This thesis is focusing on solving the problem of organizing football matches. The aim of the work is to analyze existing solutions of this problem, propose improvements, analyze user needs and, on the basis of previous studies, design the most optimal solution and subsequently implement and test the prototype of reservation system. This booking system is implemented using Java framework Spring. As the main result of this thesis, the prototype of the application will support the authentication of individual users, the creation of new matches, the search for existing ones and further participation in them.
Klíčová slova:
rezervacni system,koncept,fotbalove utkani pro amatery,management fotbalovych zapasu,web,Java,Spring Framework; Reservation system,concept,football matches for amateurs,management of football matches,website,Java,Spring Framework
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Rezervační systém pro fotbalové utkání
Tato bakalarska prace je zamerena na reseni problemu organizace fotbalovych utkani. Cilem prace je zanalyzovat soucasna reseni teto problematiky, navrhnout jejich vylepseni, prozkoumat pozadavky ...
Aplikace Fourierovy a Waveletové transformace ve vibrační a akustické analýze mechanických zařízení
Borovička Tomáš; Lukány Jan; Kalvoda Tomáš
2018 - anglický
Většina mechanických zařízení vydává vibrační a akustické signály. Tyto signály mnohdy obsahují informace o oscilačním pohybu těchto zařízení, které mohou pomoci odhalit jejich aktuální stav, jakožto například že trpí závadou. Fourierova a Vlnková transformace jsou metody spektrální analýzy, jež dokážou reprezentovat signály pomocí oscilací a tedy jsou běžně používány pro zjišťování aktuálního stavu mechanických zařízení. Tato práce popisuje Fourierovu a Vlnkovou transformaci a demonstruje jejich aplikaci ve vibrační a akustické analýze mechanických zařízení pomocí experimentů provedených na reálných datech. Výsledky experimentů potvrzují, že obě metody dokáží detekovat závadný stav mechanických zařízení. Přesněji, Furierova transformace může identifikovat přítomnost závady, kdežto Vlnková transformace dokáže i lokalizovat specifické vadné chování v čase.Majority of industrial machinery emits vibration and acoustic signals. These signals often contain information about the oscillatory movement of the machinery that could reveal its condition, such as a defective state. Fourier and Wavelet transforms are spectral analysis methods which decompose signals into a representation by oscillatory functions. Thus, those methods are often used for condition monitoring of machinery. This Thesis describes Fourier and Wavelet transforms and demonstrates their application for vibration and acoustic analysis of machinery on experiments conducted upon real-world data sets. The results of the experiments verify that both of the methods can distinguish different conditions of a machinery. Specifically, the experiments show that Fourier transform can identify a defective condition while Wavelet transform can even localize specific defective behavior in time.
Klíčová slova:
Fourierova transformace,Vlnková transformace,spektrální analýza,vibrační a akustická analýza mechanických zařízení; Fourier transform,Wavelet transform,spectral analysis,vibration and acoustic analysis of machinery
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Aplikace Fourierovy a Waveletové transformace ve vibrační a akustické analýze mechanických zařízení
Většina mechanických zařízení vydává vibrační a akustické signály. Tyto signály mnohdy obsahují informace o oscilačním pohybu těchto zařízení, které mohou pomoci odhalit jejich aktuální stav, jakožto ...
OpenPonk: implementace parseru a interpretu OCL
Pergl Robert; Svoboda Jakub; Suchánek Marek
2018 - anglický
Tato bakalářská práce se zabývá návrhem a implementací syntaktické analýzy a interpreta OCL jazyka pro OpenPonk modelovací platformu v prostředí Pharo. Nejdříve se v práci popisuje OCL jazyk, algoritmy syntaktické analýzy, nástroje pro syntaktickou analýzu, které jsou dostupné ve Pharo prostředí (PetitParser, SmaCC). Dále se práce zabývá analýzou problémů a řešení, které vedly k výsledné implementaci OCL interpreta. Nakonec se funkčnost OCL interpreta ukáže na dodržování OntoUML modelových omezení.This bachelor thesis covers the creation of an OCL parser and interpreter for OpenPonk modeling platform in the Pharo environment. We describe the OCL language, parsing algorithms and parsing frameworks avaiable in Pharo (PetitParser, SmaCC). We then analyze problems and approaches that led to the final implementation of the OCL interpreter. In the end we show the interpreter functionality on OntoUML metamodel constraints.
Klíčová slova:
OCL,parser,interpret,Pharo,Openponk,OntoUML,SmaCC,PetitParser; OCL,parser,interpreter,Pharo,Openponk,OntoUML,SmaCC,PetitParser
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
OpenPonk: implementace parseru a interpretu OCL
Tato bakalářská práce se zabývá návrhem a implementací syntaktické analýzy a interpreta OCL jazyka pro OpenPonk modelovací platformu v prostředí Pharo. Nejdříve se v práci popisuje OCL jazyk, ...
Zlepšování algoritmů pro učení se řadit
Kordík Pavel; Vu Huy Hoang; Maldonado Lopez Juan Pablo
2018 - anglický
V této práci se zabývám existujícími algoritmy pro úlohu přeřazení URL podle relevance na základě uživatelského dotazu do vyhledávače a metodami kolaborativního filtrování, které uvádím v rešerši. Vybrané algoritmy, což jsou ES-Rank a maticová faktorizace, pak implementuji a použiji na dataset poskytnutý společností Yandex v rámci soutěže Personalized Web Search Challenge na Kaggle.com. Poté porovnávám přesnost řazení s ostatními řešeními na Kaggle.com. Následně testuji, jestli kolaborativní filtrování metodou maticové faktorizace významně zvyšuje přesnost řazení. Nakonec analyzuji časovou složitost svého řešení.In this thesis I explore existing approaches to the learning to rank problem and collaborative filtering methods, and apply them to Yandex's dataset provided in the Personalized Web Search Challenge competition on Kaggle.com. I build on the existing submissions by replicating the top competitor's feature extraction from the dataset. Then I implement and apply ES-Rank and matrix factorization on these features and test if matrix factorization based collaborative filtering significantly increases the overall performance of the algorithm. Then I compare the performance of the implemented algorithms to other submissions on Kaggle. Lastly I analyze the time complexity of my solution.
Klíčová slova:
získávání informací,učení se řadit,kolaborativní filtrování,maticová faktorizace,evoluční strategie; information retrieval,learning to rank,collaborative filtering,matrix factorization,evolutional strategy
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Zlepšování algoritmů pro učení se řadit
V této práci se zabývám existujícími algoritmy pro úlohu přeřazení URL podle relevance na základě uživatelského dotazu do vyhledávače a metodami kolaborativního filtrování, které uvádím v rešerši. ...
Atributový doporučovací model trénovaný s využitím interakční podobnosti
Řehořek Tomáš; Kasalický Petr; Kordík Pavel
2018 - anglický
Tato bakalářská práce se zabývá doporučovacimi systémy a jejich základnimi přistupy: Kolaborativni filtrováni a Atributové doporučováni. Je představen nový hybridni přistup, který kombinuje tyto dva přistupy. Tato metoda zvyšuje recall atributového doporučováni až o 216% a umožňuje přesnějši doporučováni pro nově přidané věci, které trpi cold-start problémem. Tento navržený a implementovaný přistup využivá metod strojového učeni jako je embedding nebo umělé neuronové sitě, které budou taktéž stručně představeny, spolu se způsobem vyhodnocováni kvality doporučováni.This bachelor's thesis describes the recommendation system and two major approaches, Collaborative filtering and Content-based recommendation. The new hybrid approach, which combines these two methods, is proposed. This method increases recall of content-based recommendation by up to 216% and allows more precise recommendation for newly added items, which suffers from the cold-start problem. This designed and implemented approach uses machine learning methods such as embedding or artificial neural networks, which will also be briefly introduced along with a way of evaluating the quality of the recommendation.
Klíčová slova:
doporučovaci systém,embedding,hluboké učeni,umělé neuronové sitě,Python; recommendation system,embedding,deep learning,artifical neural network,Python
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Atributový doporučovací model trénovaný s využitím interakční podobnosti
Tato bakalářská práce se zabývá doporučovacimi systémy a jejich základnimi přistupy: Kolaborativni filtrováni a Atributové doporučováni. Je představen nový hybridni přistup, který kombinuje tyto dva ...
SQL databáze v oblasti Big Data Analytics jejich porovnání a využití v komerčním světě
Valenta Michal; Agapova Elena; Friedjungová Magda
2018 - anglický
Díky rostoucím objemům dat generovaným v dnešní době, jejich vývoji a změnám, koncept velkých dat (big data) se stal objektem velkého zájmu. Tento koncept popisuje sadu technik a metod pro efektivní práci s velkými soubory dat. V moderním světě informace je jedním z nejdůležitějších prostředků, který může přispívat k optimalizaci podnikových procesů a rozhodování. Nicméně, pro získání přehledu a využití potenciálu dat je nutné je zpracovat a zjistit jaká informace se skrývá uvnitř, k čemuž slouží analýza dat. Platformy pro analýzu dat umožňují manipulovat s datami pro zjištění jejich přesného ob-sahu. Podobné systémy jsou velmi komplexní a obsahují více jednotlivých komponentů a proto jejich návrh vyžaduje rozsáhlý průzkum dostupných možností. Tato bakalářská práce má za cíl popsat jak analýza dat funguje pro velká data a jejich společné využití v praxi. Zaměřuje se na popis existujících tech-nologií a přístupů k realizaci infrastruktur pro datovou analýzu. Práce se také zabývá definicí faktorů které by měly být vzaté v úvahu při výběru ne-jvhodnějšího softwarového řešení pro konkrétní případy užití. Výzkum je proveden pomocí studia architektonických základů systémů pro zpracování velkých dat a průzkumů trhu softwaru pro analýzu dat. Výsledkem prací je zpráva porovnávající vybrané technologie a popisující jednotlivé kritéria, které byly vzaté v úvahu při porovnání. Tato zpráva může být použita jako návod k výběru vhodného softwarového řešení pro implementaci analytického systému v různých podnicích.With a growing amount of data generated, their changing and evolving, the concept of big data has become incredibly popular in last years. It provides a set of new approaches and techniques allowing to work efficiently with huge volumes of records. Nowadays, information is one of the most important resources; it can help with decision making and business processes optimization. However, to get actual insights and unlock a potential of data, it is necessary to process them and discover the information hidden inside it which is a goal of data analytics. Data analytic platforms allow to manipulate with raw data in order to find out what exactly they contain. These systems are complex and includes multiple components therefore their designing requires comprehensive analysis of available options. This thesis aims to describe how data analytics works for big data and how they are used in business. It gives an overview of existing technologies and approaches to building data analytics infrastructures. It also defines points that should be taken into consideration while choosing the most suitable software solution for a particular use case. The research is done by studying architectural principles of big data systems and investigating the market of data analytics software. The result of this work is a composite report including comparison of several technologies and a list of criteria considered. The final report can be used as a guideline for choosing the most suitable technology for implementing an analytical platform in a broad variety of organizations.
Klíčová slova:
Big data,analýza velkých dat,databázové stroje,platformy pro analýzu dat,porovnání technologií; Big data,big data analytics,SQL engine,data analytics platform,technologies comparison
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
SQL databáze v oblasti Big Data Analytics jejich porovnání a využití v komerčním světě
Díky rostoucím objemům dat generovaným v dnešní době, jejich vývoji a změnám, koncept velkých dat (big data) se stal objektem velkého zájmu. Tento koncept popisuje sadu technik a metod pro efektivní ...
Předpovídání výsledků hry Dota 2
Surynek Pavel; Beskyd Filip; Klouda Karel
2018 - anglický
Teoretická část této práce se zabývá stručným vysvětlením teorií rozhodovacího stromu a umělých neuronových sítí a vysvětlením základních faktorů které mají významný dopad na výsledek hry. Praktická část se zaměřuje na experimentování s parametry použitých technik strojového učení, rozšiřování vstupních dat o informace týkajících se složení hrdinů, porovnávání a vyhodnocení výkonu těchto rozšíření. Toto vše končí implementací experimentálního programu, který vytváří prediktivní ANN model. Tento model může být později použit pro predikci výsledku hry podle počáteční kompozice hrdinů v týmu.Theoretical part of this thesis will focus on briefly clarifying decision tree and artificial neural network theory and explain basic factors that have significant impact on game result. In practical part, focus is set on experimenting with used machine learning technique's parameters, extending input data by information regarding hero compositions, compare and evaluate performance of these extensions. All of this resulting in implementation of experimental program which will produce predictive ANN model. This model can be used later to predict the outcome of the game based on knowing initial team's hero compositions.
Klíčová slova:
predikce výsledků hry Dota 2,strojové učení,rozhodovací strom,umělá neuronová síť,Python,scikit-learn; predicting Dota 2 game result,machine learning,decision tree,artificial neural network,Python,scikit-learn
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Předpovídání výsledků hry Dota 2
Teoretická část této práce se zabývá stručným vysvětlením teorií rozhodovacího stromu a umělých neuronových sítí a vysvětlením základních faktorů které mají významný dopad na výsledek hry. Praktická ...
Vývoj mobilní aplikace a její uvedení na trh
Šebek Jiří; Vítek Marek; Náplava Pavel
2018 - anglický
Bakalářská práce se zabývá analýzou, návrhem a implementací mobilní aplikace, která se zaměřuje na zobrazení programu kin. Tato aplikace je založena na potřebách uživatele a soustředí se zejména na jednoduchost. Výsledkem této práce bude prototyp mobilní aplikace pro platformu iOS, jež bude zobrazovat program kin v Praze.The bachelor thesis deals with analyzing, designing and implementing a mobile application focused on displaying cinema schedules. The application is designed based on user needs and focuses on simplicity for the user. The result of this thesis is a prototype of a mobile application for iOS platform that displays program for films in cinemas in Prague.
Klíčová slova:
Mobilní aplikace,iOS,kina,filmy,hledání; Mobile application,iOS,cinema,film,searchin
Plné texty jsou dostupné na jednotlivých katedrách ČVUT.
Vývoj mobilní aplikace a její uvedení na trh
Bakalářská práce se zabývá analýzou, návrhem a implementací mobilní aplikace, která se zaměřuje na zobrazení programu kin. Tato aplikace je založena na potřebách uživatele a soustředí se zejména na ...
NUŠL poskytuje centrální přístup k informacím o šedé literatuře vznikající v ČR v oblastech vědy, výzkumu a vzdělávání. Více informací o šedé literatuře a NUŠL najdete na webu služby.
Vaše náměty a připomínky posílejte na email nusl@techlib.cz
Provozovatel
Zahraniční báze