Počet nalezených dokumentů: 38
Publikováno od do

Usage, frequency, and grammaticality
Štícha, František
2008 - anglický
Explanation of the concepts usage, frequency, and grammaticality; frequency and grammaticality in morphology of Czech and German. Vysvětlení pojmů úzus, frekvence, gramatičnost; frekvence a gramatičnost v čes. a něm. morfologii. Klíčová slova: grammar; usage; frequency; grammaticality; morphology Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
Usage, frequency, and grammaticality

Explanation of the concepts usage, frequency, and grammaticality; frequency and grammaticality in morphology of Czech and German....

Štícha, František
Ústav pro jazyk český, 2008

Phenomena-oriented corpora: a manifesto
Oliva jr., Karel
2008 - anglický
Shortcommings of the present corpora for grammatical descriptions; propositions to improvement. Nedostatky současných korpusů pro gramatické popisy; návrhy na zlepšení. Klíčová slova: corpus linguistics; grammar; tagging Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
Phenomena-oriented corpora: a manifesto

Shortcommings of the present corpora for grammatical descriptions; propositions to improvement.


Nedostatky současných korpusů pro gramatické popisy; návrhy na zlepšení.

Oliva jr., Karel
Ústav pro jazyk český, 2008

The dictionary of the minor place-names in Bohemia
Harvalík, Milan
2007 - anglický
On the history and development of the dictionary of minor place names. Historie a vývoj slovníku pomístních jmen. Klíčová slova: onomastics; minor place names; toponymy Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
The dictionary of the minor place-names in Bohemia

On the history and development of the dictionary of minor place names.


Historie a vývoj slovníku pomístních jmen.

Harvalík, Milan
Ústav pro jazyk český, 2007

From the corpus as an open source for investigation to commercial products
Šimandl, Josef
2007 - anglický
The development of corpora is sketched, from large collections of texts without tagging through tagged corpora to machines that operate above tagged corpora and produce data presented as data about language, such as Word Sketches (TM). The article remarks that every corpus is merely a representation of texts and that the quality of representation is to be examined. The unavoidable question in research is how is the corpus built and how, under what principles, the service software operates. Both in case we explore a corpus with distortions, where texts appear in a way nobody has written them so (digits and their environment uses to be phenomena of that sort), and in case we are not allowed to have an insight "below the bonnet" or to change working parameters, we hardly may speak about doing scholarly research. Článek nastiňuje vývoj korpusů od velkých souborů neznačkovaných textů přes značkované korpusy k nástrojům, které operují nad značkovanými korpusy a produkují data prezentovaná jako data o jazyku, jako jsou např. Word Sketches (TM). Článek připomíná, že každý korpus je jen reprezentací textů a že se musíme ptát po kvalitě reprezentace. Nezbytná otázka při výzkumu je, jak je korpus vybudován a jak, na základě jakých principů, pracuje obslužný program. Tam, kde zkoumáme korpus s deformacemi, kde se texty objevují v podobě, jak je nikdo nenapsal (číslice a jejich okolí jsou často jevy takového druhu), stejně jako tam, kde nemáme dovoleno dívat se "pod kapotu" nebo měnit pracovní parametry, sotva můžeme mluvit o tom, že bychom dělali vědecký výzkum. Klíčová slova: corpus linguistics; linguistic corpus; tagging Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
From the corpus as an open source for investigation to commercial products

The development of corpora is sketched, from large collections of texts without tagging through tagged corpora to machines that operate above tagged corpora and produce data presented as data about ...

Šimandl, Josef
Ústav pro jazyk český, 2007

The best of two worlds: cooperation of statistical and rule-based taggers for Czech
Spoustová, D.; Hajič, J.; Votrubec, J.; Krbec, P.; Květoň, Pavel
2007 - anglický
Description of several hybrid disambiguation methods combining the strength of hand-written disambiguation rules and statistical taggers. Three different statistical (HMM, Maximum-Entropy and Averaged Perceptron)taggers are used in a tagging experiment using Prague Dependency Treebank. The results of the hybrid systems are better than any other method tried for Czech tagging so far. Popis hybridních disambiguačních metod; použití tří různých statistických taggerů (HMM, Maximum-Entropy, Averaged Perceptron), zhodnocení výsledků. Klíčová slova: tagging; linguistic corpus; disambiguation; corpus lingustics Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
The best of two worlds: cooperation of statistical and rule-based taggers for Czech

Description of several hybrid disambiguation methods combining the strength of hand-written disambiguation rules and statistical taggers. Three different statistical (HMM, Maximum-Entropy and Averaged ...

Spoustová, D.; Hajič, J.; Votrubec, J.; Krbec, P.; Květoň, Pavel
Ústav pro jazyk český, 2007

Toponymical collections of the Czech Language Institute of the Academy of Sciences of the Czech Republic in Prague and Brno
Harvalík, Milan
2003 - anglický
Characterization of the collections. Klíčová slova: toponymy; onomastics Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
Toponymical collections of the Czech Language Institute of the Academy of Sciences of the Czech Republic in Prague and Brno

Characterization of the collections.

Harvalík, Milan
Ústav pro jazyk český, 2003

Exonyms vs. endonyms - a linguiustic view of the determination of the boundaries between them
Harvalík, Milan
2003 - anglický
Analysis. Klíčová slova: exonym; endonym; onomastics Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
Exonyms vs. endonyms - a linguiustic view of the determination of the boundaries between them

Analysis.

Harvalík, Milan
Ústav pro jazyk český, 2003

Language is neither all chaos nor all order
Daneš, František
1995 - anglický
Plné texty jsou dostupné na jednotlivých ústavech Akademie věd ČR.
Language is neither all chaos nor all order

Daneš, František
Ústav pro jazyk český, 1995

O službě

NUŠL poskytuje centrální přístup k informacím o šedé literatuře vznikající v ČR v oblastech vědy, výzkumu a vzdělávání. Více informací o šedé literatuře a NUŠL najdete na webu služby.

Vaše náměty a připomínky posílejte na email nusl@techlib.cz

Provozovatel

http://www.techlib.cz

Facebook

Zahraniční báze