Příloha č. 1

Seznam iniciálních prétur v mluveném korpusu ORAL2013 spolu s jejich frekvenčními charakteristikami.

Jednoduché prétury Prétury CC Prétury CCC Prétury CCCC

typ prétura abs_frek (tokeny) rel_frek (tokeny) IPM (tokeny) abs_frek (typy) rel_frek (typy)
C 26 prétur 1 861 878 100,00% 585 449,80 8 353 100,00%
C t 444 976 23,90% 135 435,98 480 5,75%
C j 278 208 14,94% 84 677,32 329 3,94%
C n 245 419 13,18% 74 697,43 1 148 13,74%
C s 134 046 7,20% 50 042,49 324 3,88%
C m 92 930 4,99% 28 284,82 551 6,60%
C v 88 727 4,77% 27 005,57 846 10,13%
C d 82 248 4,42% 25 033,57 494 5,91%
C b 78 775 4,23% 23 976,51 357 4,27%
C p 72 240 3,88% 21 987,47 944 11,30%
C ž 62 060 3,33% 18 889,01 81 0,97%
C ň 46 613 2,50% 14 187,46 132 1,58%
C z 33 971 1,82% 10 339,65 409 4,90%
C k 27 736 1,49% 9 832,57 530 6,35%
C c 27 058 1,45% 8 235,56 115 1,38%
C ť 22 806 1,22% 6 941,39 61 0,73%
C ř 22 328 1,20% 6 795,90 116 1,39%
C h 22 049 1,18% 6 710,99 234 2,80%
C r 15 568 0,84% 4 738,38 296 3,54%
C l 14 451 0,78% 4 398,41 274 3,28%
C ď 14 212 0,76% 4 325,66 132 1,58%
C f 12 353 0,66% 11 881,57 110 1,32%
C č 9 443 0,51% 2 874,14 167 2,00%
C x 6 755 0,36% 2 056,00 104 1,25%
C š 6 127 0,33% 1 864,86 91 1,09%
C g 734 0,04% 223,41 25 0,30%
C d͡ž 45 0,00% 13,70 3 0,04%
typ prétura abs_frek (tokeny) rel_frek (tokeny) IPM (tokeny) abs_frek (typy) rel_frek (typy)
CC 126 prétur 279 454 100,00% 85 056,56 2 835 100,00%
CC pr 46 774 16,74% 14 236,46 247 8,71%
CC 25 900 9,27% 7 883,10 41 1,45%
CC 19 698 7,05% 5 995,42 301 10,62%
CC st 14 505 5,19% 4 414,84 194 6,84%
CC 14 212 5,09% 4 325,66 36 1,27%
CC gd 12 424 4,45% 3 781,45 23 0,81%
CC sm 12 113 4,33% 3 686,80 29 1,02%
CC 8 816 3,15% 2 683,30 35 1,23%
CC dv 6 720 2,40% 2 045,35 42 1,48%
CC vl 6 428 2,30% 1 956,47 37 1,31%
CC sp 6 282 2,25% 1 912,03 113 3,99%
CC hr 5 408 1,94% 1 646,02 66 2,33%
CC vj 5 164 1,85% 1 571,75 62 2,19%
CC pj 4 242 1,52% 1 291,12 30 1,06%
CC 3 694 1,32% 1 124,33 12 0,42%
CC tr 3 482 1,25% 1 059,81 65 2,29%
CC kt 3 447 1,23% 1 049,15 17 0,60%
CC hl 3 442 1,23% 1 047,63 51 1,80%
CC xc 3 398 1,22% 1 034,24 11 0,39%
CC sk 3 172 1,14% 965,45 60 2,12%
CC dr 3 079 1,10% 937,15 41 1,45%
CC sl 2 964 1,06% 902,14 96 3,39%
CC kl 2 888 1,03% 879,01 57 2,01%
CC kr 2 778 0,99% 845,53 79 2,79%
CC zm 2 467 0,88% 750,87 11 0,39%
CC šl 2 419 0,87% 736,26 8 0,28%
CC pl 2 412 0,86% 734,13 71 2,50%
CC sv 2 377 0,85% 723,48 50 1,76%
CC št 2 377 0,85% 723,48 19 0,67%
CC zn 2 351 0,84% 715,57 37 1,31%
CC ml 2 153 0,77% 655,30 39 1,38%
CC šk 2 041 0,73% 621,21 21 0,74%
CC br 1 979 0,71% 602,34 58 2,05%
CC dn 1 815 0,65% 552,43 12 0,42%
CC vz 1 782 0,64% 542,38 12 0,42%
CC hn 1 768 0,63% 538,12 12 0,42%
CC sn 1 625 0,58% 494,60 15 0,53%
CC dl 1 554 0,56% 472,99 15 0,53%
CC ps 1 459 0,52% 444,07 25 0,88%
CC 1 413 0,51% 430,07 10 0,35%
CC šp 1 368 0,49% 416,37 30 1,06%
CC xv 1 222 0,44% 371,94 12 0,42%
CC čl 1 201 0,43% 365,54 10 0,35%
CC xl 1 174 0,42% 357,33 28 0,99%
CC zr 1 055 0,38% 321,11 6 0,21%
CC 1 047 0,37% 318,67 12 0,42%
CC 950 0,34% 289,15 22 0,78%
CC tv 911 0,33% 277,28 27 0,95%
CC zv 904 0,32% 275,15 37 1,31%
CC mn 833 0,30% 253,54 6 0,21%
CC zb 791 0,28% 240,75 26 0,92%
CC sx 777 0,28% 236,49 26 0,92%
CC čt 775 0,28% 235,88 13 0,46%
CC bj 761 0,27% 231,62 18 0,63%
CC vr 731 0,26% 222,49 22 0,78%
CC sr 704 0,25% 214,27 18 0,63%
CC 678 0,24% 206,36 16 0,56%
CC pt 670 0,24% 203,93 10 0,35%
CC bl 658 0,24% 200,27 22 0,78%
CC zd 628 0,22% 191,14 18 0,63%
CC 583 0,21% 177,45 17 0,60%
CC zj 528 0,19% 160,71 10 0,35%
CC fr 514 0,18% 156,44 19 0,67%
CC 506 0,18% 154,01 3 0,11%
CC zl 495 0,18% 150,66 22 0,78%
CC kv 479 0,17% 145,79 13 0,46%
CC 462 0,17% 140,62 1 0,04%
CC šť 370 0,13% 112,62 17 0,60%
CC tl 282 0,10% 85,83 9 0,32%
CC 272 0,10% 82,79 15 0,53%
CC fl 256 0,09% 77,92 10 0,35%
CC 216 0,08% 65,74 8 0,28%
CC vd 214 0,08% 65,13 5 0,18%
CC cv 203 0,07% 61,79 6 0,21%
CC 196 0,07% 59,66 5 0,18%
CC tm 179 0,06% 54,48 8 0,28%
CC mr 172 0,06% 52,35 7 0,25%
CC řv 172 0,06% 52,35 6 0,21%
CC žl 165 0,06% 50,22 5 0,18%
CC 155 0,06% 47,18 6 0,21%
CC 151 0,05% 45,96 3 0,11%
CC 129 0,05% 39,26 1 0,04%
CC 122 0,04% 37,13 4 0,14%
CC žd 109 0,04% 33,18 1 0,04%
CC sc 96 0,03% 29,22 5 0,18%
CC šv 90 0,03% 27,39 5 0,18%
CC gr 87 0,03% 26,48 6 0,21%
CC sj 83 0,03% 25,26 5 0,18%
CC kn 73 0,03% 22,22 3 0,11%
CC 68 0,02% 20,70 4 0,14%
CC 68 0,02% 20,70 3 0,11%
CC ňh 67 0,02% 20,39 1 0,04%
CC zh 66 0,02% 20,09 6 0,21%
CC čk 65 0,02% 19,78 1 0,04%
CC ft 54 0,02% 16,44 2 0,07%
CC šr 53 0,02% 16,13 3 0,11%
CC gv 49 0,02% 14,91 2 0,07%
CC 46 0,02% 14,00 2 0,07%
CC cp 44 0,02% 13,39 4 0,14%
CC ks 44 0,02% 13,39 2 0,07%
CC žr 44 0,02% 13,39 2 0,07%
CC fx 40 0,01% 12,17 2 0,07%
CC 40 0,01% 12,17 2 0,07%
CC xr 38 0,01% 11,57 3 0,11%
CC vn 36 0,01% 10,96 3 0,11%
CC lh 35 0,01% 10,65 2 0,07%
CC tx 31 0,01% 9,44 2 0,07%
CC fk 28 0,01% 8,52 2 0,07%
CC žď 26 0,01% 7,91 2 0,07%
CC 25 0,01% 7,61 2 0,07%
CC fs 23 0,01% 7,00 2 0,07%
CC hm 23 0,01% 7,00 2 0,07%
CC vh 22 0,01% 6,70 2 0,07%
CC jm 22 0,01% 6,70 1 0,04%
CC fc 21 0,01% 6,39 1 0,04%
CC gl 18 0,01% 5,48 1 0,04%
CC jd 18 0,01% 5,48 1 0,04%
CC šň 18 0,01% 5,48 1 0,04%
CC bz 17 0,01% 5,17 1 0,04%
CC js 15 0,01% 4,57 1 0,04%
CC xm 15 0,01% 4,57 1 0,04%
CC pn 13 0,00% 3,96 1 0,04%
CC lz 12 0,00% 3,65 1 0,04%
CC 11 0,00% 3,35 1 0,04%
CC 10 0,00% 3,04 1 0,04%
CC 10 0,00% 3,04 1 0,04%
typ prétura abs_frek (tokeny) rel_frek (tokeny) IPM (tokeny) abs_frek (typy) rel_frek (typy)
CCC 40 prétur 16 088 100,00% 4 896,66 303 100,00%
CCC str 4 684 29,11% 1 425,65 60 19,80%
CCC dvj 2 576 16,01% 784,05 2 0,66%
CCC vžd 963 5,99% 293,11 3 0,99%
CCC stř 884 5,49% 269,06 25 8,25%
CCC štv 870 5,41% 264,80 16 5,28%
CCC skl 597 3,71% 181,71 21 6,93%
CCC spr 578 3,59% 175,92 21 6,93%
CCC zvl 561 3,49% 170,75 13 4,29%
CCC svj 494 3,07% 150,36 13 4,29%
CCC fst 437 2,72% 133,01 18 5,94%
CCC zdr 364 2,26% 110,79 11 3,63%
CCC zmň 283 1,76% 86,14 10 3,30%
CCC smň 273 1,70% 83,09 10 3,30%
CCC zvj 273 1,70% 83,09 6 1,98%
CCC fsp 201 1,25% 61,18 6 1,98%
CCC kvj 200 1,24% 60,87 7 2,31%
CCC sml 186 1,16% 56,61 5 1,65%
CCC skr 184 1,14% 56,00 4 1,32%
CCC skř 175 1,09% 53,26 5 1,65%
CCC zhr 160 0,99% 48,70 1 0,33%
CCC čtv 140 0,87% 42,61 4 1,32%
CCC sxv 134 0,83% 40,79 1 0,33%
CCC vzd 105 0,65% 31,96 4 1,32%
CCC spj 95 0,59% 28,91 5 1,65%
CCC hřb 94 0,58% 28,61 4 1,32%
CCC spl 72 0,45% 21,91 4 1,32%
CCC vzň 65 0,40% 19,78 4 1,32%
CCC fpr 54 0,34% 16,44 1 0,33%
CCC vzď 53 0,33% 16,13 2 0,66%
CCC zbl 52 0,32% 15,83 3 0,99%
CCC zbr 51 0,32% 15,52 2 0,66%
CCC hvj 47 0,29% 14,31 3 0,99%
CCC vzb 33 0,21% 10,04 2 0,66%
CCC smr 33 0,21% 10,04 1 0,33%
CCC vzh 30 0,19% 9,13 1 0,33%
CCC štr 25 0,16% 7,61 1 0,33%
CCC fpř 21 0,13% 6,39 1 0,33%
CCC fsk 15 0,09% 4,57 1 0,33%
CCC zbj 14 0,09% 4,26 1 0,33%
CCC zvr 12 0,07% 3,65 1 0,33%

CClic2    © 2016 Filozofická Fakulta Univerzity Karlovy v Praze / Pavel Šturm, David Lukeš