2023-09-08 00:12:39 ERROR root 12A036N:Wrong use of # in 'to#'.
2023-09-08 00:12:39 ERROR root 12A036N:Wrong use of # in 'to#'.
2023-09-08 00:12:44 ERROR root 12A038N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'jakə'
| ORT | FON |
|------------+------------|
| jo | jó |
| ? | jakə |
| jako | ? |
| má | má |
| peníze | peňíze |
| tak | tak |
| si | si |
| hraje | hraje |
| na | na |
| producenta | producenta |
| jakože | jakože |
| nemusí | nemusí |
| shánět | scháňet |
| prachy | prachi |
| protože | pře |
| má | má |
| ty | ti |
| vlastní | vlasňí |
| a | a |
| to | to |
ort: ['jo', '?', 'jako', 'má', 'peníze', 'tak', 'si', 'hraje', 'na', 'producenta', 'jakože', 'nemusí', 'shánět', 'prachy', 'protože', 'má', 'ty', 'vlastní', 'a', 'to']
fon: ['jó|jakə', '?', 'má|peňíze', 'tak|si', 'hraje', 'na|producenta', 'jakože', 'nemusí', 'scháňet', 'prachi', 'pře|má', 'ti|vlasňí', 'a|to']
2023-09-08 00:12:46 ERROR root 12A039N:Wrong use of # in 'to#'.
2023-09-08 00:12:46 ERROR root 12A039N:Wrong use of # in 'to#'.
2023-09-08 00:12:47 ERROR root 12H003N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'dem'
| ORT | FON |
|----------+----------|
| [ | [ |
| už | až |
| budem | buem |
| ] | ] |
| jak | jak |
| starej | starej |
| NP | NP |
| viď | vi_ |
| ? | dem |
| budem | ? |
| chodit | choďid |
| a | a |
| buž* | bu |
| buch | bu |
| buch | bu |
| . | . |
| ale | ale |
| tu | tu |
| sílu | sílu |
| já | já |
| to | to |
| ještě | ešťe |
| přehodím | přehoďim |
| . | . |
ort: ['[', 'už', 'budem', ']', 'jak', 'starej', 'NP', 'viď', '?', 'budem', 'chodit', 'a', 'buž*', 'buch', 'buch', '.', 'ale', 'tu', 'sílu', 'já', 'to', 'ještě', 'přehodím', '.']
fon: ['[', 'až|buem', ']', 'jak|starej', 'NP', 'vi_|dem', '?', 'choďid|a', 'bu|bu|bu', '.', 'ale', 'tu|sílu', 'já|to', 'ešťe', 'přehoďim', '.']
2023-09-08 00:12:47 ERROR root 12H003N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|--------+--------|
| [ | [ |
| nebə | nebə |
| jedině | jeďiňe |
| Prahu | prahu |
| dát | dát |
| ] | ] |
| no | nó |
| a | a |
| + | + |
ort: ['[', 'nebə', 'jedině', 'Prahu', 'dát', ']', 'no', 'a', '+']
fon: ['[', 'nebə', 'jeďiňe', 'prahu', 'dát', ']', 'nó|a', '+']
2023-09-08 00:12:47 ERROR root 12H003N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'ti'
| ORT | FON |
|-----------+-----------|
| + | + |
| von | von |
| má | má |
| @ | @ |
| věci | vjeci |
| který | kterí |
| jsou | sou |
| @ | @ |
| těsně | ťesňe |
| před | přet |
| @ | @ |
| vypršením | vipršeňím |
| tý | ti |
| .. | .. |
| jo | jó |
| ? | ? |
| tý | tí |
| šarže | šarže |
| tý | ti |
| .. | .. |
| jo | jó |
| ? | ti |
| tý | ? |
| prostě | prosťe |
| .. | .. |
| [ | [ |
| lhůty | lhuti |
| ] | ] |
ort: ['+', 'von', 'má', '@', 'věci', 'který', 'jsou', '@', 'těsně', 'před', '@', 'vypršením', 'tý', '..', 'jo', '?', 'tý', 'šarže', 'tý', '..', 'jo', '?', 'tý', 'prostě', '..', '[', 'lhůty', ']']
fon: ['+', 'von|má', '@', 'vjeci', 'kterí|sou', '@', 'ťesňe', 'přet', '@', 'vipršeňím', 'ti', '..', 'jó', '?', 'tí|šarže', 'ti', '..', 'jó|ti', '?', 'prosťe', '..', '[', 'lhuti', ']']
2023-09-08 00:12:50 ERROR root 12O003N:Wrong use of # in 'to#'.
2023-09-08 00:13:08 ERROR root 13A006N:Wrong use of # in 's#'.
2023-09-08 00:13:17 ERROR root 13A010N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'jako', ftok: '('
| ORT | FON |
|---------+--------|
| jako | ( |
| aj | 1 |
| pěkný | ) |
| je | aj |
| úplně | pjekní |
| jenom | je |
| ten | upəňe |
| rožek | jenəm |
| když | ten |
| jdeš | rožeg |
| z | diž |
| toho | deš |
| .. | s |
| z | tohó |
| chodby | .. |
| . | s |
| prvního | chodbi |
| patra | . |
| navrch | prvňío |
| na | patra |
| půdu | navrɣ |
| .. | na |
| → | púdu |
ort: ['jako', 'aj', 'pěkný', 'je', 'úplně', 'jenom', 'ten', 'rožek', 'když', 'jdeš', 'z', 'toho', '..', 'z', 'chodby', '.', 'prvního', 'patra', 'navrch', 'na', 'půdu', '..']
fon: ['(', '1', ')', 'aj', 'pjekní|je', 'upəňe', 'jenəm|ten', 'rožeg', 'diž|deš', 's|tohó', '..', 's|chodbi', '.', 'prvňío', 'patra', 'navrɣ', 'na|púdu']
2023-09-08 00:13:17 ERROR root 13A010N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'stejňe'
| ORT | FON |
|---------+---------|
| a | a |
| tam | tam |
| je | je |
| vlastně | vasňe |
| pak | pak |
| taky | taki |
| na | na |
| chodbě | chodbje |
| je | je |
| tam | taɱ |
| vlastně | vasňe |
| záchod | záchod |
| a | a |
| ta | ta |
| špajzka | špajska |
| že | že |
| ? | stejňe |
| stejně | ? |
| jako | jag |
| dole | dəle |
ort: ['a', 'tam', 'je', 'vlastně', 'pak', 'taky', 'na', 'chodbě', 'je', 'tam', 'vlastně', 'záchod', 'a', 'ta', 'špajzka', 'že', '?', 'stejně', 'jako', 'dole']
fon: ['a|tam|je', 'vasňe|pak', 'taki', 'na|chodbje', 'je|taɱ', 'vasňe', 'záchod', 'a|ta', 'špajska', 'že|stejňe', '?', 'jag|dəle']
2023-09-08 00:13:18 ERROR root 13A010N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'jakə'
| ORT | FON |
|---------+--------|
| tak | tag |
| jak | jak |
| my | mi |
| jako | jako |
| sebe | sebe |
| to | to |
| ne | né |
| že | žə |
| .. | .. |
| tak | tak |
| protože | počé |
| rozdíl | rozďíl |
| byl | bil |
| u | u |
| vás | vás |
| trochu | trochu |
| větší | vječí |
| že | že |
| ? | jakə |
| jako | ? |
| + | + |
ort: ['tak', 'jak', 'my', 'jako', 'sebe', 'to', 'ne', 'že', '..', 'tak', 'protože', 'rozdíl', 'byl', 'u', 'vás', 'trochu', 'větší', 'že', '?', 'jako', '+']
fon: ['tag|jak', 'mi|jako', 'sebe', 'to|né', 'žə', '..', 'tak|počé', 'rozďíl|bil', 'u|vás', 'trochu', 'vječí', 'že|jakə', '?', '+']
2023-09-08 00:13:48 ERROR root 13A024N:Wrong use of # in 's#'.
2023-09-08 00:14:11 ERROR root 13A035N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'jako', ftok: '('
| ORT | FON |
|-------------+-------------|
| [ | [ |
| no | nó |
| tak | tak |
| ] | ] |
| jo | jə |
| jo | jó |
| [ | [ |
| jakoby | jakobi |
| nastřídačku | nastřídačku |
| ] | ] |
| víš | víš |
| ? | ? |
| jako | ( |
| že | akə |
| ( | že |
| 2 | ) |
| ) | ( |
ort: ['[', 'no', 'tak', ']', 'jo', 'jo', '[', 'jakoby', 'nastřídačku', ']', 'víš', '?', 'jako', 'že', '(', '2', ')']
fon: ['[', 'nó|tak', ']', 'jə|jó', '[', 'jakobi', 'nastřídačku', ']', 'víš', '?', '(', 'akə|že', ')', '(']
2023-09-08 00:14:21 ERROR root 13A040N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
<PP <PP
no nə
tak tak
. .
jako jako
na na
toho toho
.. ..
+ +
[ [
( pavlova
Pavlova .
. pavlova
Pavlova taťíŋka
) ]
tatínka >
] None
> None
2023-09-08 00:14:21 ERROR root 13A040N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
[ [
( tomu
tomu ]
) rozumi
] ale
rozumím [
ale prož
[ bi
proč se
by oňi
se ]
oni mňeli
] rozváďe_
měli [
rozvádět diď
? oňi
[ s
vždyť ťim
oni ?
s taťíŋkem
tím ]
tatínkem -
] None
- None
2023-09-08 00:14:23 ERROR root 13A040N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'ale'
| ORT | FON |
|----------+----------|
| k | k |
| těm | ťem |
| cizím | cizím |
| to | to |
| se | se |
| může | múže |
| p* | p |
| jako | jakó |
| . | . |
| [ | [ |
| přelomit | přelomi_ |
| ] | ] |
| že | ǯe |
| ? | ? |
| . | . |
| [ | [ |
| to | tó |
| jako | jako |
| ťu | ťu |
| ťu | ťu |
| ťu | ťu |
| ] | ] |
| ňu | ňu |
| ňu | ňu |
| ňu | ňu |
| .. | .. |
| svatej | svatej |
| za | za |
| dědinó | ďeďinó |
| [ | [ |
| jo | jó |
| ? | ale |
| ale | ? |
| ] | ] |
| to | to |
| jako | jako |
| .. | .. |
ort: ['k', 'těm', 'cizím', 'to', 'se', 'může', 'p*', 'jako', '.', '[', 'přelomit', ']', 'že', '?', '.', '[', 'to', 'jako', 'ťu', 'ťu', 'ťu', ']', 'ňu', 'ňu', 'ňu', '..', 'svatej', 'za', 'dědinó', '[', 'jo', '?', 'ale', ']', 'to', 'jako', '..']
fon: ['k|ťem|cizím', 'to|se', 'múže|p', 'jakó', '.', '[', 'přelomi_', ']', 'ǯe', '?', '.', '[', 'tó|jako', 'ťu|ťu|ťu', ']', 'ňu|ňu|ňu', '..', 'svatej', 'za|ďeďinó', '[', 'jó|ale', '?', ']', 'to|jako', '..']
2023-09-08 00:14:25 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'doma', ftok: '('
| ORT | FON |
|--------------+--------------|
| vidíš | íž |
| a | a |
| ten | ten |
| mikropočítač | mikropočítač |
| to | to |
| je | je |
| ta | ta |
| věc | vec |
| co | co |
| #s | s |
| měl | mňel |
| [ | [ |
| doma | ( |
| nějak | dəma |
| přes | ) |
| ty | ňak |
| Vánoce | přes |
| nebo | ti |
| tak | vánoce |
| ] | nebə |
| ? | ? |
ort: ['vidíš', 'a', 'ten', 'mikropočítač', 'to', 'je', 'ta', 'věc', 'co', '#s', 'měl', '[', 'doma', 'nějak', 'přes', 'ty', 'Vánoce', 'nebo', 'tak', ']', '?']
fon: ['íž|a', 'ten|mikropočítač', 'to|je', 'ta|vec', 'co|s|mňel', '[', '(', 'dəma', ')', 'ňak', 'přes|ti', 'vánoce', 'nebə', '?']
2023-09-08 00:14:26 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
no no
a a
je je
to tə
jakože jakože
to tó
to to
je je
vono vono
no nó
akorát akorá_
ten ten
už uš
jsem sem
taky taki
vyřadil viřaďil
protože prəǯe
ten tən
taky taki
( ne
1 f
) tom
v nejel
tom .
nejel None
. None
2023-09-08 00:14:26 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '[', ftok: ''
| ORT | FON |
|------------+------------|
| [ | [ |
| to | to |
| jo | jə |
| ale | ale |
| ( | ( |
| 1 | 1 |
| ) | ) |
| ná* | na |
| náho* | nahə |
| náhodou | náhodəu |
| ] | ] |
| se | se |
| ale | ale |
| se | se |
| oteplilo | oteplilo |
| jako | jakə |
| teď | teď |
| na | na |
| [ | ← |
| vodpoledne | [ |
| mně | votpoledne |
| přišlo | mňe |
| ] | přišlo |
| .. | ] |
ort: ['[', 'to', 'jo', 'ale', '(', '1', ')', 'ná*', 'náho*', 'náhodou', ']', 'se', 'ale', 'se', 'oteplilo', 'jako', 'teď', 'na', '[', 'vodpoledne', 'mně', 'přišlo', ']', '..']
fon: ['[', 'to', 'jə', 'ale', '(', '1', ')', 'na', 'nahə', 'náhodəu', ']', 'se|ale', 'se|oteplilo', 'jakə', 'teď|na|', '[', 'votpoledne', 'mňe|přišlo', ']']
2023-09-08 00:14:26 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: ')', ftok: 'nou'
| ORT | FON |
|---------+---------|
| no | nə |
| tak | tak |
| jo | jə |
| že | še |
| jo | ó |
| protože | protože |
| tam | ta_ |
| má | má |
| byt | bit |
| .. | .. |
| [ | [ |
| a | a |
| on | o_ |
| měl | ňel |
| práci | práci |
| ] | ] |
| jako | jako |
| tím | ťím |
| směrem | smňerem |
| ( | ( |
| teďka | ska |
| když | iš |
| má | má |
| ) | nou |
| novou | ) |
| <SM | <SM |
| v | f |
| Komíně | komíňe |
| > | > |
ort: ['no', 'tak', 'jo', 'že', 'jo', 'protože', 'tam', 'má', 'byt', '..', '[', 'a', 'on', 'měl', 'práci', ']', 'jako', 'tím', 'směrem', '(', 'teďka', 'když', 'má', ')', 'novou', '<SM', 'v', 'Komíně', '>']
fon: ['nə|tak', 'jə', 'še|ó', 'protože', 'ta_|má', 'bit', '..', '[', 'a|o_|ňel', 'práci', ']', 'jako', 'ťím|smňerem', '(', 'ska', 'iš|má', 'nou', ')', '<SM', 'f|komíňe', '>']
2023-09-08 00:14:27 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'a'
| ORT | FON |
|---------+---------|
| k | k |
| ní | ňí |
| do | do |
| práce | práce |
| nebo | bo |
| k | k |
| práci | práci |
| a | a |
| že | že |
| vona | vona |
| vezme | vezme |
| auto | auto |
| víš | víš |
| ? | a |
| a | ? |
| .. | .. |
| [ | [ |
| otočíme | otočíme |
| se | se |
| ( | ( |
| 2 | 2 |
| ) | ) |
| ] | ] |
| . | . |
ort: ['k', 'ní', 'do', 'práce', 'nebo', 'k', 'práci', 'a', 'že', 'vona', 'vezme', 'auto', 'víš', '?', 'a', '..', '[', 'otočíme', 'se', '(', '2', ')', ']', '.']
fon: ['k|ňí|do|práce', 'bo', 'k|práci', 'a|že', 'vona', 'vezme', 'auto', 'víš|a', '?', '..', '[', 'otočíme|se', '(', '2', ')', ']', '.']
2023-09-08 00:14:28 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'že'
| ORT | FON |
|---------+---------|
| + | + |
| a | a |
| že | že |
| měl | mel |
| sálovky | sálofki |
| .. | .. |
| ale | a |
| jestli | jesi |
| jsem | sem |
| si | si |
| neměla | nemňea |
| víš | ví_ |
| ? | že |
| že | ? |
| kou* | kou |
| .. | .. |
| ale | a |
| voni | voňi |
| žádný | žání |
| tyhlety | tileti |
| . | . |
ort: ['+', 'a', 'že', 'měl', 'sálovky', '..', 'ale', 'jestli', 'jsem', 'si', 'neměla', 'víš', '?', 'že', 'kou*', '..', 'ale', 'voni', 'žádný', 'tyhlety', '.']
fon: ['+', 'a|že|mel', 'sálofki', '..', 'a|jesi|sem|si', 'nemňea', 'ví_|že', '?', 'kou', '..', 'a|voňi', 'žání', 'tileti', '.']
2023-09-08 00:14:28 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '[', ftok: ''
| ORT | FON |
|------------+------------|
| [ | [ |
| no | nó |
| ] | ] |
| vona | vona |
| se | se |
| [ | [ |
| drolí | drólí |
| no | no |
| vždyť | diť |
| ] | ] |
| .. | .. |
| @ | @ |
| vždyť | diť |
| i | i |
| papí* | papí |
| @ | @ |
| ty | ti |
| ty | ti |
| tescový | teskəí |
| tašky | taški |
| jsou | sou |
| [ | ← |
| ekologický | [ |
| ty | ekologickí |
| ] | ti |
| ti | ] |
| po | ťi |
| čase | po |
| [ | čase |
| prostě | [ |
| ] | prosťe |
ort: ['[', 'no', ']', 'vona', 'se', '[', 'drolí', 'no', 'vždyť', ']', '..', '@', 'vždyť', 'i', 'papí*', '@', 'ty', 'ty', 'tescový', 'tašky', 'jsou', '[', 'ekologický', 'ty', ']', 'ti', 'po', 'čase', '[', 'prostě', ']']
fon: ['[', 'nó', ']', 'vona|se', '[', 'drólí', 'no|diť', ']', '..', '@', 'diť|i', 'papí', '@', 'ti|ti', 'teskəí', 'taški', 'sou|', '[', 'ekologickí', 'ti', ']', 'ťi|po|čase', '[', 'prosťe']
2023-09-08 00:14:28 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'ňák'
| ORT | FON |
|---------+---------|
| [ | [ |
| vy | vi |
| jste | se |
| měli | mňeli |
| vevni* | vevi |
| vevnitř | vevňitř |
| díry | ďíri |
| viď | viť |
| ? | ňák |
| nějak | ? |
| vevnitř | vevňitř |
| díry | ďíri |
| ] | ] |
ort: ['[', 'vy', 'jste', 'měli', 'vevni*', 'vevnitř', 'díry', 'viď', '?', 'nějak', 'vevnitř', 'díry', ']']
fon: ['[', 'vi|se', 'mňeli', 'vevi', 'vevňitř', 'ďíri', 'viť|ňák', '?', 'vevňitř', 'ďíri', ']']
2023-09-08 00:14:29 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'jak'
| ORT | FON |
|----------+----------|
| takhle | tagle |
| čl* | čə |
| člověk | čəjek |
| tam | tam |
| najede | najede |
| .. | .. |
| i | i |
| když | diš |
| tuhle | tudle |
| taky | taki |
| jsem | sem |
| tam | tam |
| takhle | takle |
| najížděl | najížďel |
| .. | .. |
| a | á |
| . | . |
| si | si |
| představ | přestav |
| jo | jó |
| ? | jak |
| jak | ? |
| jak | jak |
| jak | jak |
| se | se |
| . | . |
| jede | jede |
| do | do |
| díry | ďíri |
| + | + |
ort: ['takhle', 'čl*', 'člověk', 'tam', 'najede', '..', 'i', 'když', 'tuhle', 'taky', 'jsem', 'tam', 'takhle', 'najížděl', '..', 'a', '.', 'si', 'představ', 'jo', '?', 'jak', 'jak', 'jak', 'se', '.', 'jede', 'do', 'díry', '+']
fon: ['tagle', 'čə', 'čəjek|tam', 'najede', '..', 'i|diš', 'tudle', 'taki|sem|tam', 'takle', 'najížďel', '..', 'á', '.', 'si|přestav', 'jó|jak', '?', 'jak', 'jak|se', '.', 'jede', 'do|ďíri', '+']
2023-09-08 00:15:05 ERROR root 13A058N:Wrong use of # in 'to#'.
2023-09-08 00:15:06 ERROR root 13A060N:Wrong use of # in 'to#'.
2023-09-08 00:15:06 ERROR root 13A060N:Wrong use of # in 'to#'.
2023-09-08 00:15:07 ERROR root 13A060N:Wrong use of # in 'to#'.
2023-09-08 00:15:10 ERROR root 13A060N:Wrong use of # in 'to#'.
2023-09-08 00:15:11 ERROR root 13A060N:Wrong use of # in 'to#'.
2023-09-08 00:15:11 ERROR root 13A060N:Wrong use of # in 'to#'.
2023-09-08 00:15:23 ERROR root 13A067N:Wrong use of # in 'sebral#'.
2023-09-08 00:15:23 ERROR root 13A067N:Wrong use of # in 'dal#'.
2023-09-08 00:15:34 ERROR root 13A070N:Wrong use of # in 'vyto#'.
2023-09-08 00:15:34 ERROR root 13A070N:Wrong use of # in 'toto#'.
2023-09-08 00:15:36 ERROR root 13A070N:Wrong use of # in 'to#'.
2023-09-08 00:15:37 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'furt'
| ORT | FON |
|--------+--------|
| že | je |
| tam | tam |
| kvílel | kvílel |
| jo | jó |
| ? | furt |
| furt | ? |
ort: ['že', 'tam', 'kvílel', 'jo', '?', 'furt']
fon: ['je|tam', 'kvílel', 'jó|furt', '?']
2023-09-08 00:15:38 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
[ [
( trošku
trošku diz
desi* ]
) dizajnovje
] jako
designově [
jako ə
[ ]
jo None
] None
? None
2023-09-08 00:15:38 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: ']', ftok: ')'
| ORT | FON |
|---------------+---------------|
| taková | takəvá |
| st* | st |
| startrekovská | stártrekəfská |
| jakoby | jakobi |
| jo | jo |
| ? | ? |
| .. | .. |
| [ | [ |
| ( | ( |
| tak | tak |
| . | . |
| takhle | take |
| do | do |
| m* | m |
| ] | ) |
| ) | ] |
| do | do |
| modra | modra |
| to | to |
| bylo | biló |
| že | že |
| jo | jó |
| ? | ? |
| takhle | take |
| ty | ti |
| .. | .. |
| v | f |
| tom | to_ |
| meníčku | meňíčku |
| takhle | ake |
| .. | .. |
| po | po |
| levý | leví |
| [ | [ |
| straně | straňé |
| ] | ] |
ort: ['taková', 'st*', 'startrekovská', 'jakoby', 'jo', '?', '..', '[', '(', 'tak', '.', 'takhle', 'do', 'm*', ']', ')', 'do', 'modra', 'to', 'bylo', 'že', 'jo', '?', 'takhle', 'ty', '..', 'v', 'tom', 'meníčku', 'takhle', '..', 'po', 'levý', '[', 'straně', ']']
fon: ['takəvá', 'st', 'stártrekəfská', 'jakobi', 'jo', '?', '..', '[', '(', 'tak', '.', 'take', 'do|m', ')', ']', 'do|modra', 'to|biló', 'že|jó', '?', 'take|ti', '..', 'f|to_|meňíčku', 'ake', '..', 'po|leví', '[', 'straňé', ']']
2023-09-08 00:15:38 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'hoďňe'
| ORT | FON |
|---------+---------|
| to | to |
| bylo | bio |
| asi | asi |
| ho* | ho |
| .. | .. |
| <PR | <PR |
| ježdění | ježďeňí |
| > | > |
| ježděný | ježďení |
| ne | ne |
| ? | hoďňe |
| hodně | ? |
ort: ['to', 'bylo', 'asi', 'ho*', '..', '<PR', 'ježdění', '>', 'ježděný', 'ne', '?', 'hodně']
fon: ['to|bio', 'asi|ho', '..', '<PR', 'ježďeňí', '>', 'ježďení', 'ne|hoďňe', '?']
2023-09-08 00:15:39 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'ale'
| ORT | FON |
|---------+---------|
| @ | @ |
| jakoby | jakobi |
| .. | .. |
| podlaha | podlahu |
| už | uš |
| je | jé |
| de | de |
| facto | fakto |
| jakoby | jakobi |
| čistá | čistá |
| jo | jó |
| ? | ale |
| ale | ? |
| jakoby | jakobi |
| v | f |
| těch | ťech |
| . | . |
| třeba | třeba |
| v | f |
| těch | ťeh |
| bocích | bocích |
| a | a |
| takhle | taklé |
| [ | [ |
| že | že |
| jo | ə |
| ] | ] |
| ? | ? |
| .. | .. |
| v | f |
| tom | tom |
| .. | .. |
ort: ['@', 'jakoby', '..', 'podlaha', 'už', 'je', 'de', 'facto', 'jakoby', 'čistá', 'jo', '?', 'ale', 'jakoby', 'v', 'těch', '.', 'třeba', 'v', 'těch', 'bocích', 'a', 'takhle', '[', 'že', 'jo', ']', '?', '..', 'v', 'tom', '..']
fon: ['@', 'jakobi', '..', 'podlahu', 'uš|jé', 'de|fakto', 'jakobi', 'čistá', 'jó|ale', '?', 'jakobi|f|ťech', '.', 'třeba', 'f|ťeh|bocích', 'a|taklé', '[', 'že|ə', ']', '?', '..', 'f|tom', '..']
2023-09-08 00:15:52 ERROR root 13A079N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'kurva', ftok: '('
| ORT | FON |
|----------+----------|
| taky | taki |
| židák | židák |
| .. | .. |
| kurva | ( |
| z | kurva |
| výkopu | s |
| .. | víkopu |
| a | ) |
| .. | .. |
| ale | á |
| dobrej | .. |
| režisér | ale |
| jako | dobrej |
| vopravdu | režizér |
| eso | jakó |
| .. | vopravdu |
| on | eso |
| miluje | .. |
| Řecko | o_ |
| .. | miluje |
ort: ['taky', 'židák', '..', 'kurva', 'z', 'výkopu', '..', 'a', '..', 'ale', 'dobrej', 'režisér', 'jako', 'vopravdu', 'eso', '..', 'on', 'miluje', 'Řecko', '..']
fon: ['taki', 'židák', '..', '(', 'kurva', 's|víkopu', ')', '..', 'á', '..', 'ale', 'dobrej', 'režizér', 'jakó', 'vopravdu', 'eso', '..', 'o_|miluje']
2023-09-08 00:15:52 ERROR root 13A079N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'to', ftok: '('
| ORT | FON |
|---------+---------|
| říkám | řikam |
| když | diš |
| to | to |
| říkáš | řikáš |
| ty | ti |
| který | terí |
| jako | jako |
| máš | maš |
| i | i |
| jako | jako |
| režisér | režizər |
| na | na |
| to | ( |
| .. | 1 |
| na | ) |
| to | .. |
| náhled | na |
| tak | to |
| asi | náhle_ |
| jo | tak |
| .. | asi |
ort: ['říkám', 'když', 'to', 'říkáš', 'ty', 'který', 'jako', 'máš', 'i', 'jako', 'režisér', 'na', 'to', '..', 'na', 'to', 'náhled', 'tak', 'asi', 'jo', '..']
fon: ['řikam', 'diš|to', 'řikáš|ti', 'terí', 'jako', 'maš|i', 'jako', 'režizər', 'na', '(', '1', ')', '..', 'na|to', 'náhle_', 'tak|asi']
2023-09-08 00:15:58 ERROR root 13A083N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<PR', ftok: ''
| ORT | FON |
|---------+---------|
| no | nə |
| jo | jó |
| tak | tag |
| Dejvice | dejvice |
| to | to |
| byla | bila |
| klasika | klasika |
| chápeš | chápeš |
| ale | aə |
| to | to |
| bylo | bio |
| už | uš |
| už | uš |
| <PR | ← |
| zma | <PR |
| > | zma |
| za | > |
| mýho | za |
| dětství | mího |
| to | ďectví |
| už | to |
| [ | už |
| bylo | [ |
| ] | bió |
ort: ['no', 'jo', 'tak', 'Dejvice', 'to', 'byla', 'klasika', 'chápeš', 'ale', 'to', 'bylo', 'už', 'už', '<PR', 'zma', '>', 'za', 'mýho', 'dětství', 'to', 'už', '[', 'bylo', ']']
fon: ['nə|jó', 'tag|dejvice', 'to|bila', 'klasika', 'chápeš', 'aə', 'to|bio|uš', 'uš|', '<PR', 'zma', '>', 'za|mího', 'ďectví', 'to|už', '[', 'bió']
2023-09-08 00:16:00 ERROR root 13A085N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
[ [
( eg
eg* ]
) @
] ezistuje
@ [
existuje ťeškí
[ taŋk
těžký ]
tank None
] None
2023-09-08 00:16:14 ERROR root 13A091N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
"_end": ts2,
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
@functools.cache
^^^^^^^^^
InvalidGraphemeCluster: ń is not allowed on the fon layer
| ORT | FON |
|----------+---------|
| [ | [ |
| s* | s |
| .. | .. |
| ( | ( |
| v | f |
| s* | s |
| ) | ) |
| v | f |
| sedmičce | sedmice |
| já | ja |
| si | si |
| já | já |
| si | si |
| ( | ( |
| myslím | misəm |
| ) | ) |
| že | že |
| tady | tak |
| je | ńá |
| ] | ] |
ort: ['[', 's*', '..', '(', 'v', 's*', ')', 'v', 'sedmičce', 'já', 'si', 'já', 'si', '(', 'myslím', ')', 'že', 'tady', 'je', ']']
fon: ['[', 's', '..', '(', 'f|s', ')', 'f|sedmice', 'ja|si', 'já|si', '(', 'misəm', ')', 'že|tak|ńá', ']']
2023-09-08 00:16:15 ERROR root 13A091N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
logging.error(f"{LABEL}:{e}")
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
except StopIteration:
^^^^^^^^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
ftok
TokenMismatch:
otok: '<PR', ftok: ''
| ORT | FON |
|------------+------------|
| [ | [ |
| pásku | páskú |
| ] | ] |
| jo | jo |
| .. | .. |
| no | nó |
| . | . |
| a | a |
| . | . |
| že | že |
| máme | máme |
| nachystáno | nachistáno |
| na | na |
| <PR | ← |
| keně | <PR |
| > | keňe |
| na | > |
| koně | na |
| že | koňe |
| jo | že |
| tak | ó |
| . | ta |
ort: ['[', 'pásku', ']', 'jo', '..', 'no', '.', 'a', '.', 'že', 'máme', 'nachystáno', 'na', '<PR', 'keně', '>', 'na', 'koně', 'že', 'jo', 'tak', '.']
fon: ['[', 'páskú', ']', 'jo', '..', 'nó', '.', 'a', '.', 'že|máme', 'nachistáno', 'na|', '<PR', 'keňe', '>', 'na|koňe', 'že|ó', 'ta']
2023-09-08 00:16:18 ERROR root 13A094N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
logging.error(f"{LABEL}:{e}")
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
except StopIteration:
^^^^^^^^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
ftok
TokenMismatch:
otok: 'něco', ftok: '('
| ORT | FON |
|--------+--------|
| jo | jo |
| . | . |
| no | no |
| .. | .. |
| tak | k |
| ještě | ešťe |
| řekneš | řekneš |
| něco | ( |
| ? | ? |
| a | ecə |
| neměj | ) |
| ty | a |
| ( | nemňej |
| 1 | ti |
| ) | ( |
| ruce | 1 |
| ( | ) |
| v | ruce |
| těch | ( |
| ) | f |
| .. | ťech |
ort: ['jo', '.', 'no', '..', 'tak', 'ještě', 'řekneš', 'něco', '?', 'a', 'neměj', 'ty', '(', '1', ')', 'ruce', '(', 'v', 'těch', ')', '..']
fon: ['jo', '.', 'no', '..', 'k|ešťe', 'řekneš', '(', '?', 'ecə', ')', 'a|nemňej|ti', '(', '1', ')', 'ruce', '(', 'f|ťech']
2023-09-08 00:16:19 ERROR root 13A094N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
"_end": ts2,
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
@functools.cache
^^^^^^^^^
InvalidGraphemeCluster: ń is not allowed on the fon layer
| ORT | FON |
|-----------+-----------|
| takže | tagže |
| takhle | takle |
| no | nó |
| já | já |
| v | f |
| pondělí | pońďeli |
| nastupuju | nastupuju |
| ve | ve |
| Vindě | viňďé |
| víš | víš |
| + | + |
ort: ['takže', 'takhle', 'no', 'já', 'v', 'pondělí', 'nastupuju', 've', 'Vindě', 'víš', '+']
fon: ['tagže', 'takle', 'nó', 'já|f|pońďeli', 'nastupuju', 've|viňďé', 'víš', '+']
2023-09-08 00:16:50 ERROR root 13D006N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'dva', ftok: '('
| ORT | FON |
|----------+---------|
| kdyby | dibi |
| to | to |
| nebyli | nebili |
| dva | ( |
| na | dva |
| je* | na |
| kdyby | e |
| to | ) |
| nebylo | dibi |
| v | to |
| podstatě | nebilo |
| dva | ← |
| na | poctaťe |
| jednoho | dva |
| → | na |
| → | jednoho |
ort: ['kdyby', 'to', 'nebyli', 'dva', 'na', 'je*', 'kdyby', 'to', 'nebylo', 'v', 'podstatě', 'dva', 'na', 'jednoho']
fon: ['dibi|to', 'nebili', '(', 'dva|na|e', ')', 'dibi|to', 'nebilo', '|poctaťe', 'dva|na|jednoho']
2023-09-08 00:17:36 ERROR root 13O008N:Wrong use of # in 'přeto#'.
2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
pochůzky {pochúski}
no nó
tak tək
.. ..
budeš bueš
schovaná schovaná
. bueš
budeš choďit
chodit f
v potchodech
podchodech jenom
jenom a
a ..
.. pod
pod deštňíkem
deštníkem None
2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
jo jo
myslíš məsí_
si si
že žə
mě mňe
baví baví
chodit choďi
pod pod
deštníkem dešňíkem
.. ..
[ [
já á
chci chci
] ]
aby abi
svítilo svíťio
sluníčko sluňíčko
. mňe
mně se
se zase
zase takle
takhle líbí
líbí ten
ten podʒim
podzim diš
když je
je barevnej
barevnej ..
.. None
2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '.', ftok: 'barevní'
| ORT | FON |
|------------+--------------|
| stromy | stromi |
| . | barevní |
| barevný | lístečki |
| lístečky | fšude |
| všude | .. |
| .. | oə |
| ale | takoví |
| takový | ti |
| ty | {plískaňice} |
| plískanice | jako |
| jako | bəla |
| byla | neska |
| dneska | ráno |
| ráno | .. |
| .. | no |
| no | to |
| to | e |
| je | hroznə |
| hrozný | .. |
ort: ['stromy', '.', 'barevný', 'lístečky', 'všude', '..', 'ale', 'takový', 'ty', 'plískanice', 'jako', 'byla', 'dneska', 'ráno', '..', 'no', 'to', 'je', 'hrozný']
fon: ['stromi', 'barevní', 'lístečki', 'fšude', '..', 'oə', 'takoví|ti', '{plískaňice}', 'jako', 'bəla', 'neska', 'ráno', '..', 'no', 'to|e', 'hroznə', '..']
2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1063, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '-', ftok: '..'
| ORT | FON |
|-----------+-----------|
| musíš | əpsíš |
| jezdit | jezďi |
| pomalu | pomalu |
| to | to |
| víš | víž |
| ty | ti |
| jezdíš | ezďíž |
| jako | ago |
| závodnice | závoďňicé |
| a | a |
| - | .. |
ort: ['musíš', 'jezdit', 'pomalu', 'to', 'víš', 'ty', 'jezdíš', 'jako', 'závodnice', 'a', '-']
fon: ['əpsíš', 'jezďi', 'pomalu', 'to|víž', 'ti|ezďíž', 'ago', 'závoďňicé', 'a', '..']
2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1006, in print
otok = next(ort)
^^^^^^^^^
StopIteration
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1008, in print
raise OrtTooShort(self)
OrtTooShort:
| ORT | FON |
|---------+---------|
| + | + |
| ( | ( |
| ale | ááə |
| ) | ) |
| [ | [ |
| všude | šude |
| chceš | chcež |
| bejt | bej |
| první | prvňí |
| ] | ] |
| .. | .. |
| fakt | ə |
| závodíš | ag |
| prosím | závoďíž |
| tě | prəsiň |
| → | ťe |
ort: ['+', '(', 'ale', ')', '[', 'všude', 'chceš', 'bejt', 'první', ']', '..', 'fakt', 'závodíš', 'prosím', 'tě']
fon: ['+', '(', 'ááə', ')', '[', 'šude', 'chcež|bej', 'prvňí', ']', '..', 'ə|ag', 'závoďíž', 'prəsiň|ťe']
2023-09-08 00:18:37 ERROR root 13T017N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: ')', ftok: 'upəňe'
| ORT | FON |
|---------+---------|
| [ | [ |
| ( | ( |
| to | to |
| bylo | bolo |
| ) | upəňe |
| úplně | ) |
| odporné | otporné |
| ] | ] |
ort: ['[', '(', 'to', 'bylo', ')', 'úplně', 'odporné', ']']
fon: ['[', '(', 'to|bolo', 'upəňe', ')', 'otporné', ']']
2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'ty#'.
2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'kdy#'.
2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'myslela#'.
2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'co#'.
2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'ty#'.
2023-09-08 00:19:21 ERROR root 13T026N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
( (
ses ses
předtím přeťím
) )
s z
mamkou mamkou
bavil bavil
něco ňecə
nebo nebo
tak tak
. .
( jak
jak s
) tam
#s šel
tam za
šel ňí
za None
ní None
? None
2023-09-08 00:20:49 ERROR root 14C015N:Wrong use of # in 's#'.
2023-09-08 00:21:17 ERROR root 14O002N:Wrong use of # in '#to'.
2023-09-08 00:21:18 ERROR root 14O004N:Wrong use of # in '#to'.
2023-09-08 00:21:19 ERROR root 14O004N:Wrong use of # in '#to'.
2023-09-08 00:21:19 ERROR root 14O004N:Wrong use of # in '#to'.
2023-09-08 00:22:16 ERROR root 14T015N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'dost', ftok: '('
| ORT | FON |
|------------+------------|
| ( | ( |
| střední | třeďňe |
| ) | ) |
| musíš | musíš |
| . | . |
| hele | hele |
| .. | .. |
| aby | abi |
| to | to |
| nevypadalo | nevipadalo |
| dost | ( |
| že | dozd |
| seš | ) |
| totální | že |
| debil | seš |
| .. | totálňí |
| vystudovat | debil |
| v | .. |
| určitém | vistudovad |
| věku | ← |
| že | určitéɱ |
| jo | vjeku |
| .. | že |
| → | jə |
ort: ['(', 'střední', ')', 'musíš', '.', 'hele', '..', 'aby', 'to', 'nevypadalo', 'dost', 'že', 'seš', 'totální', 'debil', '..', 'vystudovat', 'v', 'určitém', 'věku', 'že', 'jo', '..']
fon: ['(', 'třeďňe', ')', 'musíš', '.', 'hele', '..', 'abi|to', 'nevipadalo', '(', 'dozd', ')', 'že|seš', 'totálňí', 'debil', '..', 'vistudovad', '|určitéɱ', 'vjeku', 'že|jə']
2023-09-08 00:22:26 ERROR root 14T022N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<CP', ftok: '<SP'
| ORT | FON |
|-------------+-------------|
| jmenuje | menuje |
| se | se |
| to | to |
| .. | .. |
| <CP | <SP |
| Orange | oránč |
| bonpar | bompar |
| > | > |
| nebo | nebo |
| nějak | ňák |
| tak | tag |
| jako | jako |
| [ | [ |
| pomerančový | pomerančovi |
| bonpar | bəmpar |
| ] | ] |
| .. | .. |
ort: ['jmenuje', 'se', 'to', '..', '<CP', 'Orange', 'bonpar', '>', 'nebo', 'nějak', 'tak', 'jako', '[', 'pomerančový', 'bonpar', ']', '..']
fon: ['menuje|se|to', '..', '<SP', 'oránč', 'bompar', '>', 'nebo|ňák', 'tag', 'jako', '[', 'pomerančovi', 'bəmpar', ']', '..']
2023-09-08 00:23:08 ERROR root 14X014N:Wrong use of # in 'to#'.
2023-09-08 00:23:10 ERROR root 14X015N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'ale', ftok: '('
| ORT | FON |
|--------+--------|
| tak | ta_ |
| hrozná | grozná |
| [ | [ |
| není | neňi |
| ale | ( |
| ] | 1 |
| [ | ) |
| ( | ] |
| 4 | [ |
| ) | ( |
| my | 4 |
| jsme | ) |
| to | mi |
| tady | ze |
| měli | to |
| ] | tai |
| [ | mňeli |
| taky | ] |
| už | [ |
| ] | taki |
| → | uš |
ort: ['tak', 'hrozná', '[', 'není', 'ale', ']', '[', '(', '4', ')', 'my', 'jsme', 'to', 'tady', 'měli', ']', '[', 'taky', 'už', ']']
fon: ['ta_|grozná', '[', 'neňi', '(', '1', ')', ']', '[', '(', '4', ')', 'mi|ze|to', 'tai', 'mňeli', ']', '[', 'taki|uš']
2023-09-08 00:23:12 ERROR root 14X015N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'učeňiství'
| ORT | FON |
|------------+-----------|
| @ | @ |
| co | co |
| ? | učeňiství |
| učetnictví | ? |
| @ | @ |
| nemají | nemaj |
| ze | zə |
| zákona | zákona |
| . | . |
ort: ['@', 'co', '?', 'učetnictví', '@', 'nemají', 'ze', 'zákona', '.']
fon: ['@', 'co|učeňiství', '?', '@', 'nemaj', 'zə|zákona', '.']
2023-09-08 00:23:14 ERROR root 14X015N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'teda', ftok: '('
| ORT | FON |
|------------+------------|
| + | + |
| [ | [ |
| takovej | takovej |
| hnus | hnus |
| ] | ] |
| .. | .. |
| takovej | takovej |
| [ | [ |
| studenější | studeňejší |
| ] | ] |
| [ | [ |
| fouká | fouka |
| teda | ( |
| ještě | 1 |
| ] | ) |
| [ | ešťə |
| ( | ] |
| 2 | [ |
| ) | ( |
| seš | 2 |
| pěšky | ) |
| ] | seš |
| ? | ? |
ort: ['+', '[', 'takovej', 'hnus', ']', '..', 'takovej', '[', 'studenější', ']', '[', 'fouká', 'teda', 'ještě', ']', '[', '(', '2', ')', 'seš', 'pěšky', ']', '?']
fon: ['+', '[', 'takovej', 'hnus', ']', '..', 'takovej', '[', 'studeňejší', ']', '[', 'fouka', '(', '1', ')', 'ešťə', ']', '[', '(', '2', ')', 'seš', '?']
2023-09-08 00:23:40 ERROR root 15A004N:Wrong use of # in 'to#'.
2023-09-08 00:23:49 ERROR root 15A004N:Wrong use of # in 'to#'.
2023-09-08 00:24:34 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'hej', ftok: '('
| ORT | FON |
|-----------+-----------|
| plyšáka | plišáka |
| . | . |
| hej | ( |
| já | 1 |
| žádného | ) |
| nemám | jə |
| .. | žádnéə |
| no | nemám |
| dobře | .. |
| mám | no |
| .. | dəbře |
| dostal | mam |
| jsem | .. |
| nikdy | dostal |
| jsem | sem |
| si | ňigdi |
| žádného | sem |
| nekoupil | si |
| . | žádnéo |
| nenávidím | nekoupil |
| plyšáky | . |
| .. | nenáviďim |
| čistý | plišáki |
| [ | .. |
| hate | čistí |
| ] | [ |
ort: ['plyšáka', '.', 'hej', 'já', 'žádného', 'nemám', '..', 'no', 'dobře', 'mám', '..', 'dostal', 'jsem', 'nikdy', 'jsem', 'si', 'žádného', 'nekoupil', '.', 'nenávidím', 'plyšáky', '..', 'čistý', '[', 'hate', ']']
fon: ['plišáka', '.', '(', '1', ')', 'jə', 'žádnéə', 'nemám', '..', 'no|dəbře', 'mam', '..', 'dostal|sem', 'ňigdi|sem|si', 'žádnéo', 'nekoupil', '.', 'nenáviďim', 'plišáki', '..', 'čistí', '[']
2023-09-08 00:24:34 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ć is not allowed on the ort layer
| ORT | FON |
|-----------+-----------|
| i | i |
| jako | jako |
| na | na |
| Z* | z |
| na | na |
| to | tó |
| na | na |
| Zrće | zəče |
| ? | .. |
| .. | nakupəval |
| nakupoval | ← |
ort: ['i', 'jako', 'na', 'Z*', 'na', 'to', 'na', 'Zrće', '?', '..', 'nakupoval']
fon: ['i|jako', 'na|z', 'na|tó', 'na', 'zəče', '..', 'nakupəval']
2023-09-08 00:24:34 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ć is not allowed on the ort layer
| ORT | FON |
|----------+----------|
| hej | héj |
| .. | .. |
| ale | a |
| jako | jakə |
| .. | .. |
| ale | ale |
| u | u |
| toho | toho |
| Zrće | zrče |
| jsme | sme |
| nečetli | nečetli |
| jako | jako |
| že | že |
| by | bi |
| tam | ta_ |
| měly | mňeli |
| být | bí |
| nějaké | ňáké |
| hřiště | hřišťe |
| nebo | nebə |
| něco | ňeco |
| takového | takového |
ort: ['hej', '..', 'ale', 'jako', '..', 'ale', 'u', 'toho', 'Zrće', 'jsme', 'nečetli', 'jako', 'že', 'by', 'tam', 'měly', 'být', 'nějaké', 'hřiště', 'nebo', 'něco', 'takového']
fon: ['héj', '..', 'a|jakə', '..', 'ale', 'u|toho', 'zrče', 'sme|nečetli', 'jako', 'že|bi|ta_', 'mňeli|bí', 'ňáké', 'hřišťe', 'nebə', 'ňeco', 'takového']
2023-09-08 00:24:35 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ć is not allowed on the ort layer
| ORT | FON |
|------------+------------|
| hej | hej |
| a | a |
| to | to |
| .. | .. |
| to | to |
| Zrće | zrči |
| .. | .. |
| to | to |
| je | jé |
| .. | .. |
| i | i |
| normálně | normáňe |
| přístupné | přístupné |
| .. | .. |
| jako | jakə |
| [ | [ |
| veřejnosti | veřejnosťi |
| ] | ] |
| nebo | nebo |
| jenom | enom |
| podle | podle |
| těchto | ťechto |
| zájezdů | zájezdú |
| ? | ← |
ort: ['hej', 'a', 'to', '..', 'to', 'Zrće', '..', 'to', 'je', '..', 'i', 'normálně', 'přístupné', '..', 'jako', '[', 'veřejnosti', ']', 'nebo', 'jenom', 'podle', 'těchto', 'zájezdů', '?']
fon: ['hej|a|to', '..', 'to|zrči', '..', 'to|jé', '..', 'i|normáňe', 'přístupné', '..', 'jakə', '[', 'veřejnosťi', ']', 'nebo', 'enom', 'podle', 'ťechto', 'zájezdú']
2023-09-08 00:24:35 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ć is not allowed on the ort layer
| ORT | FON |
|------+------|
| a | a |
| pláž | pláž |
| je | je |
| .. | .. |
| Zrće | zrče |
ort: ['a', 'pláž', 'je', '..', 'Zrće']
fon: ['a|pláž|je', '..', 'zrče']
2023-09-08 00:27:10 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
ne ne
a a
úplně úpəe
říkám řikam
buď bu_
ticho ťichó
a a
( jó
já upəe
) ..
úplně né
.. a
ne pak
a (
pak 1
( )
1 <SP
) hej
<SP kačo
hej póď
Kačo dem
pojď kecat
jdem >
kecat ..
> None
.. None
2023-09-08 00:27:11 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<CP', ftok: '<SP'
| ORT | FON |
|---------+---------|
| [ | [ |
| a | a |
| jak | jak |
| se | se |
| to | tə |
| jmenuje | jmenuje |
| ] | ] |
| ? | ? |
| <CP | <SP |
| geok* | ǯeok |
| > | > |
ort: ['[', 'a', 'jak', 'se', 'to', 'jmenuje', ']', '?', '<CP', 'geok*', '>']
fon: ['[', 'a|jak|se|tə', 'jmenuje', ']', '?', '<SP', 'ǯeok', '>']
2023-09-08 00:27:12 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'to', ftok: '('
| ORT | FON |
|---------+---------|
| @ | @ |
| v | v |
| @ | @ |
| to | ( |
| ( | to |
| máš | máš |
| ) | ) |
| ( | ( |
| 1 | 1 |
| ) | ) |
| pak | pag |
| mořskou | mořskou |
| nemoc | némoc |
| bo | bo |
| úplně | upəe |
| slyšíš | slišíš |
| ( | ( |
| 1 | 1 |
| ) | ) |
| f* | f |
| úplně | upəe |
| & | & |
| [ | [ |
| furt | fur |
| a | a |
| úplně | upəé |
| ] | ] |
| hej | ej |
| to | to |
| úplně | upə |
| nejde | nejde |
| hej | hej |
ort: ['@', 'v', '@', 'to', '(', 'máš', ')', '(', '1', ')', 'pak', 'mořskou', 'nemoc', 'bo', 'úplně', 'slyšíš', '(', '1', ')', 'f*', 'úplně', '&', '[', 'furt', 'a', 'úplně', ']', 'hej', 'to', 'úplně', 'nejde', 'hej']
fon: ['@', 'v', '@', '(', 'to|máš', ')', '(', '1', ')', 'pag|mořskou', 'némoc', 'bo|upəe', 'slišíš', '(', '1', ')', 'f', 'upəe', '&', '[', 'fur', 'a|upəé', ']', 'ej', 'to|upə', 'nejde', 'hej']
2023-09-08 00:27:13 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
a a
na na
jak* jak
a á
na na
těch ťeh
jiných jiní_
horách horách
jsi si
byla bila
taky taki
s s
ní ňi
? ?
[ [
nebo nebo
s s
.. ..
( jiníma
jinýma ]
) None
] None
2023-09-08 00:27:34 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'bych', ftok: '('
| ORT | FON |
|----------+----------|
| já | já |
| teda | təra |
| ne | ne |
| .. | .. |
| to | to |
| bych | bich |
| radši | rači |
| fakt | fak |
| si | si |
| to | to |
| d* | d |
| nějak | ňák |
| . | . |
| namyslel | namislel |
| abych | abich |
| mohl | moch |
| makat | makat |
| jak | jag |
| bych | ( |
| třeba | 1 |
| vosm | ) |
| .. | třea |
ort: ['já', 'teda', 'ne', '..', 'to', 'bych', 'radši', 'fakt', 'si', 'to', 'd*', 'nějak', '.', 'namyslel', 'abych', 'mohl', 'makat', 'jak', 'bych', 'třeba', 'vosm', '..']
fon: ['já|təra', 'ne', '..', 'to|bich', 'rači', 'fak|si|to', 'd|ňák', '.', 'namislel', 'abich|moch', 'makat', 'jag', '(', '1', ')', 'třea']
2023-09-08 00:27:34 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|-----------+-----------|
| jo | jo |
| prəstě | prəse |
| . | . |
| že | že |
| jo | jo |
| klasický | klasickí |
| jsou | sou |
| frézovaný | frézovaní |
| . | . |
| [ | [ |
| že | že |
| to | to |
| ] | ] |
| frézuje | frézujé |
| céencéčko | cenzéčko |
| .. | .. |
ort: ['jo', 'prəstě', '.', 'že', 'jo', 'klasický', 'jsou', 'frézovaný', '.', '[', 'že', 'to', ']', 'frézuje', 'céencéčko', '..']
fon: ['jo|prəse', '.', 'že|jo', 'klasickí|sou', 'frézovaní', '.', '[', 'že|to', ']', 'frézujé', 'cenzéčko', '..']
2023-09-08 00:27:34 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'když', ftok: '('
| ORT | FON |
|---------+---------|
| a | a |
| teď | teť |
| když | ( |
| když | 1 |
| půjdeš | ) |
| do | diš |
| kravína | pudež |
| .. | do |
| tak | kravína |
| tam | .. |
| ti | tak |
| to | tam |
| bude | ťi |
| utíkat | to |
| .. | bude |
ort: ['a', 'teď', 'když', 'když', 'půjdeš', 'do', 'kravína', '..', 'tak', 'tam', 'ti', 'to', 'bude', 'utíkat', '..']
fon: ['a|teť', '(', '1', ')', 'diš|pudež', 'do|kravína', '..', 'tak', 'tam|ťi|to', 'bude']
2023-09-08 00:27:35 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'protože', ftok: '('
| ORT | FON |
|---------------+--------------|
| dělali | ďeali |
| jsme | sme |
| kalibry | kalibri |
| .. | .. |
| protože | ( |
| . | bže |
| už | ) |
| je | . |
| začíná | už |
| vyrábět | je |
| Čína | začíná |
| .. | virábje_ |
| úplně | čína |
| neskutečnejch | .. |
| věcí | úplňe |
| .. | neskutečnejh |
ort: ['dělali', 'jsme', 'kalibry', '..', 'protože', '.', 'už', 'je', 'začíná', 'vyrábět', 'Čína', '..', 'úplně', 'neskutečnejch', 'věcí', '..']
fon: ['ďeali|sme', 'kalibri', '..', '(', 'bže', ')', '.', 'už|je', 'začíná', 'virábje_', 'čína', '..', 'úplňe', 'neskutečnejh']
2023-09-08 00:27:35 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'to', ftok: '('
| ORT | FON |
|------------+------------|
| borec | borez |
| říkal | řikal |
| že | že |
| to | tə |
| že | že |
| to | ( |
| bylo | 1 |
| neskutečný | ) |
| a | bilə |
| tu | neskuteční |
| vodu | a |
| prej | tu |
| měnili | vodu |
| jednou | prej |
| za | mňeňili |
| den | jednou |
| že | za |
| tam | den |
| někdo | že |
| přišel | tam |
| .. | ňegdo |
ort: ['borec', 'říkal', 'že', 'to', 'že', 'to', 'bylo', 'neskutečný', 'a', 'tu', 'vodu', 'prej', 'měnili', 'jednou', 'za', 'den', 'že', 'tam', 'někdo', 'přišel', '..']
fon: ['borez', 'řikal', 'že|tə', 'že', '(', '1', ')', 'bilə', 'neskuteční', 'a', 'tu|vodu', 'prej|mňeňili', 'jednou', 'za|den', 'že|tam', 'ňegdo']
2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
intuitivní intuitivňí
která která
prostě prəsťe
funguje fuŋguje
vždycky vždicki
a á
nemůžeš nemužeš
ji jí
jako jako
[ [
( vipnout
1 pətəžə
) ]
protože .
] None
. None
2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|-----+-----|
| [ | [ |
| ( | ( |
| anə | anə |
| ) | ) |
| ] | ] |
ort: ['[', '(', 'anə', ')', ']']
fon: ['[', '(', 'anə', ')', ']']
2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|-----+-----|
| [ | [ |
| ( | ( |
| anə | anə |
| ) | ) |
| ] | ] |
ort: ['[', '(', 'anə', ')', ']']
fon: ['[', '(', 'anə', ')', ']']
2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: = is not allowed on the ort layer
| ORT | FON |
|----------+---------|
| neo* | neo |
| . | . |
| <PR | <PR |
| neo=lid | neo=lid |
| *loberti | liberti |
| > | > |
| @ | @ |
| jak | jak |
| jim | jim |
| říkaj | řikaj |
| ? | . |
| . | ← |
ort: ['neo*', '.', '<PR', 'neo=lid', '*loberti', '>', '@', 'jak', 'jim', 'říkaj', '?', '.']
fon: ['neo', '.', '<PR', 'neo=lid', 'liberti', '>', '@', 'jak|jim', 'řikaj', '.']
2023-09-08 00:28:02 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
no nó
. .
a a
to to
je je
podle podle
mě mňe
právě právje
ten ten
výkyv víkif
. .
výkyv víkif
. .
jakoby jakobi
von von
to to
( samořeme
psaní hoďňe
) zobecňí
hodně alə
zobecní třeba
ale ..
třeba None
.. None
2023-09-08 00:28:02 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'vlastně', ftok: '('
| ORT | FON |
|------------+-------------|
| to | to |
| co | co |
| nám | nám |
| oni | oňi |
| říkaj | řikaj |
| to | to |
| jak | jak |
| s* | s |
| . | . |
| jak | jak |
| se | se |
| to | to |
| bude | bude |
| chovat | chovat |
| vlastně | ( |
| dlouhodobě | 1 |
| ( | ) |
| 1 | dlouhodobje |
| ) | ( |
| se | 1 |
| chovat | ) |
| nebude | se |
| ( | chovat |
| 5 | nebude |
| ) | ( |
| .. | 5 |
ort: ['to', 'co', 'nám', 'oni', 'říkaj', 'to', 'jak', 's*', '.', 'jak', 'se', 'to', 'bude', 'chovat', 'vlastně', 'dlouhodobě', '(', '1', ')', 'se', 'chovat', 'nebude', '(', '5', ')', '..']
fon: ['to|co|nám', 'oňi', 'řikaj', 'to|jak|s', '.', 'jak|se|to', 'bude', 'chovat', '(', '1', ')', 'dlouhodobje', '(', '1', ')', 'se|chovat', 'nebude', '(', '5']
2023-09-08 00:28:02 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: à is not allowed on the ort layer
| ORT | FON |
|----------+---------|
| možná | možná |
| tenkou | teŋkou |
| knížku | kňíšku |
| à | a |
| la | lá |
| ten | ten |
| Malcolm | malkəlm |
| Gladwell | gledvel |
| .. | .. |
ort: ['možná', 'tenkou', 'knížku', 'à', 'la', 'ten', 'Malcolm', 'Gladwell', '..']
fon: ['možná', 'teŋkou', 'kňíšku', 'a|lá', 'ten|malkəlm', 'gledvel', '..']
2023-09-08 00:28:04 ERROR root 15X037N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'protože', ftok: '('
| ORT | FON |
|-----------+-----------|
| já | a |
| jim | jim |
| nezávidím | nezáviďim |
| teda | teda |
| vůbec | vúbes |
| nic | ňiz |
| jako | jako |
| jo | jó |
| .. | .. |
| jako | jako |
| vůbec | vúbes |
| nic | ňiz |
| jim | jim |
| nezávidím | nezáviďiɱ |
| vůbec | vúbec |
| nic | ňic |
| prostě | prosťə |
| t* | t |
| jakože | akəžé |
| . | . |
| protože | ( |
| z | prəče |
| toho | ) |
| co | s |
| maj | too |
| nemaj | co |
| jo | maj |
| .. | nema_ |
ort: ['já', 'jim', 'nezávidím', 'teda', 'vůbec', 'nic', 'jako', 'jo', '..', 'jako', 'vůbec', 'nic', 'jim', 'nezávidím', 'vůbec', 'nic', 'prostě', 't*', 'jakože', '.', 'protože', 'z', 'toho', 'co', 'maj', 'nemaj', 'jo', '..']
fon: ['a|jim', 'nezáviďim', 'teda', 'vúbes', 'ňiz', 'jako|jó', '..', 'jako', 'vúbes|ňiz', 'jim|nezáviďiɱ', 'vúbec|ňic', 'prosťə', 't|akəžé', '.', '(', 'prəče', ')', 's|too', 'co|maj', 'nema_']
2023-09-08 00:28:05 ERROR root 15X037N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
pro tak
tebe f
. tom
pro přípaďe
klienta to
.. e
tak prohra
v pro
tom ňe
případě jo
to .
je None
prohra None
pro None
ně None
jo None
. None
2023-09-08 00:28:05 ERROR root 15X037N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
šel šel
( zem
jsem .
) pišel
. s
přišel im
s za
tým mnou
za ..
mnou None
.. None
2023-09-08 00:28:11 ERROR root 15X040N:Wrong use of # in 'to#'.
2023-09-08 00:28:46 ERROR root 16A006N:Wrong use of # in '#si'.
2023-09-08 00:28:49 ERROR root 16A008N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'v', ftok: '('
| ORT | FON |
|------+------|
| [ | [ |
| v | ( |
| sedm | ← |
| ] | sedu |
ort: ['[', 'v', 'sedm', ']']
fon: ['[', '(', '|sedu']
2023-09-08 00:28:50 ERROR root 16A008N:Wrong use of # in 'to#'.
2023-09-08 00:28:51 ERROR root 16A008N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|------------------+-------------------|
| @ | @ |
| by | bi |
| sis | sis |
| nə | nə |
| jako | jako |
| čtyřhvězdičkovej | štiřhvjezďičkovej |
| hotel | hotel |
| v | və |
| Bulharsku | bulharsku |
| [ | [ |
| by | bi |
| sis | sis |
| neřekla | neřekla |
| ] | ] |
| + | + |
ort: ['@', 'by', 'sis', 'nə', 'jako', 'čtyřhvězdičkovej', 'hotel', 'v', 'Bulharsku', '[', 'by', 'sis', 'neřekla', ']', '+']
fon: ['@', 'bi|sis', 'nə', 'jako', 'štiřhvjezďičkovej', 'hotel', 'və', 'bulharsku', '[', 'bi|sis', 'neřekla', ']', '+']
2023-09-08 00:30:56 ERROR root 16X040N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'teda', ftok: '('
| ORT | FON |
|-------+-------|
| nebo | nebo |
| aspoň | aspoň |
| ne | né |
| moc | moc |
| asi | asi |
| <SP | <SP |
| teda | ( |
| > | 1 |
| .. | ) |
ort: ['nebo', 'aspoň', 'ne', 'moc', 'asi', '<SP', 'teda', '>', '..']
fon: ['nebo', 'aspoň', 'né|moc', 'asi', '<SP', '(', '1', ')']
2023-09-08 00:31:06 ERROR root 16X042N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|-------+-------|
| [ | [ |
| ( | ( |
| to | ← |
| je | je |
| taky | aki |
| məžný | možní |
| ) | ) |
| .. | .. |
| jo | jə |
| jo | jə |
| jo | jo |
| ] | ] |
ort: ['[', '(', 'to', 'je', 'taky', 'məžný', ')', '..', 'jo', 'jo', 'jo', ']']
fon: ['[', '(', '|je', 'aki', 'možní', ')', '..', 'jə|jə|jo', ']']
2023-09-08 00:31:25 ERROR root 16X046N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
on on
si ci
on on
si si
sklo sklo
( zaďňí
zadní vibil
vybil ne
) ..
ne jə
.. máš
jak to
máš .
to to
. və
to viklápjecí
v* nebo
vyklápěcí co
nebo None
co None
2023-09-08 00:31:36 ERROR root 16X056N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'pěkně', ftok: '('
| ORT | FON |
|--------+--------|
| no | nə |
| jo | jó |
| vždyť | diť |
| pršelo | pršelo |
| [ | [ |
| vždyť | diť |
| pršelo | pršelo |
| pěkně | ( |
| . | 1 |
| no | ) |
| ] | . |
| . | nó |
| no | ] |
| . | . |
ort: ['no', 'jo', 'vždyť', 'pršelo', '[', 'vždyť', 'pršelo', 'pěkně', '.', 'no', ']', '.', 'no', '.']
fon: ['nə|jó|diť', 'pršelo', '[', 'diť|pršelo', '(', '1', ')', '.', 'nó', ']', '.']
2023-09-08 00:32:31 ERROR root 17X005N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
( (
1 1
) )
( nebili
nebyli líní
) ..
líný páce
.. je
práce furt
je no
furt .
no a
. mraki
a ..
mraky None
.. None
2023-09-08 00:32:32 ERROR root 17X005N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'věci', ftok: '('
| ORT | FON |
|----------+----------|
| věci | ( |
| .. | vjeci |
| však | ) |
| mám | .. |
| ty | fšak |
| zimní | mam |
| přípravy | ti |
| a | zimňí |
| tak | přípravi |
| jak | a |
| to | tag |
| .. | jak |
| → | tə |
ort: ['věci', '..', 'však', 'mám', 'ty', 'zimní', 'přípravy', 'a', 'tak', 'jak', 'to', '..']
fon: ['(', 'vjeci', ')', '..', 'fšak|mam|ti', 'zimňí', 'přípravi', 'a|tag|jak|tə']
2023-09-08 00:32:41 ERROR root 17X011N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'někoho', ftok: '('
| ORT | FON |
|--------+--------|
| [ | [ |
| jak | jak |
| ty | ti |
| nejsou | nejsou |
| ] | ] |
| no | nó |
| [ | [ |
| tak | tak |
| to | to |
| je | je |
| někoho | ( |
| jiného | ňekoo |
| ] | jinéo |
ort: ['[', 'jak', 'ty', 'nejsou', ']', 'no', '[', 'tak', 'to', 'je', 'někoho', 'jiného', ']']
fon: ['[', 'jak|ti|nejsou', ']', 'nó', '[', 'tak|to|je', '(', 'ňekoo', 'jinéo']
2023-09-08 00:32:43 ERROR root 17X011N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ' is not allowed on the ort layer
| ORT | FON |
|------+-------|
| <CP | DUMMY |
| it's | DUMMY |
| ok | DUMMY |
| > | DUMMY |
ort: ['<CP', "it's", 'ok', '>']
fon: None
2023-09-08 00:32:48 ERROR root 17X011N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'jako', ftok: '('
| ORT | FON |
|------+------|
| [ | [ |
| jako | ( |
| jo | jako |
| no | ó |
| ] | nə |
ort: ['[', 'jako', 'jo', 'no', ']']
fon: ['[', '(', 'jako', 'ó', 'nə']
2023-09-08 00:32:55 ERROR root 17X014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
ježiš ježiš
teď téť
jsem em
ti ťi
málem málem
hodila hoďila
tu tu
klobásu klobásu
do do
toho toho
( já
já se_
) mislea
jsem že
myslela mám
že ten
mám talíř
ten ..
talíř vedle
.. təhə
vedle None
toho None
2023-09-08 00:34:25 ERROR root 18A023N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<CP', ftok: '<SP'
| ORT | FON |
|----------+----------|
| tak | tag |
| mně | mňe |
| to | to |
| úplně | úpəe |
| [ | [ |
| potěšilo | poťešilo |
| že | žé |
| jako | jako |
| ] | ] |
| je | je |
| takovej | takovej |
| nějakej | ňákej |
| <CP | <SP |
| soulmate | soulmejt |
| > | > |
| u | u |
| nás | nás |
| taky | taki |
ort: ['tak', 'mně', 'to', 'úplně', '[', 'potěšilo', 'že', 'jako', ']', 'je', 'takovej', 'nějakej', '<CP', 'soulmate', '>', 'u', 'nás', 'taky']
fon: ['tag|mňe|to', 'úpəe', '[', 'poťešilo', 'žé|jako', ']', 'je|takovej', 'ňákej', '<SP', 'soulmejt', '>', 'u|nás', 'taki']
2023-09-08 00:34:25 ERROR root 18A023N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: ')', ftok: 'se'
| ORT | FON |
|------------+------------|
| ( | ( |
| takže | aže |
| ) | se |
| se | ) |
| trochu | trochu |
| podle | podle |
| mě | mňe |
| přikalili | přikalili |
| protože | prətəže |
| mi | mi |
| psal | psal |
| asi | asi |
| tak | tak |
| ve | ve |
| dvě | dvje |
| ráno | ráno |
| tak | tak |
| si | si |
| myslím | misim |
| že | že |
| to | to |
| bylo | bio |
| nějaký | akí |
| vydatnější | vidaťňejší |
| .. | .. |
ort: ['(', 'takže', ')', 'se', 'trochu', 'podle', 'mě', 'přikalili', 'protože', 'mi', 'psal', 'asi', 'tak', 've', 'dvě', 'ráno', 'tak', 'si', 'myslím', 'že', 'to', 'bylo', 'nějaký', 'vydatnější', '..']
fon: ['(', 'aže|se', ')', 'trochu', 'podle|mňe', 'přikalili', 'prətəže|mi|psal', 'asi|tak', 've|dvje', 'ráno', 'tak|si', 'misim', 'že|to', 'bio', 'akí', 'vidaťňejší', '..']
2023-09-08 00:34:29 ERROR root 18A023N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'taky', ftok: ')'
| ORT | FON |
|---------+---------|
| no | nó |
| tak | tak |
| to | to |
| můžete | mužete |
| bydlet | bidlet |
| spolu | spolu |
| ale | ale |
| to | to |
| mu | mu |
| taky | taki |
| <SM | <SM |
| nemůžeš | nemúžeš |
| udělat | uďelat |
| > | > |
| [ | [ |
| ( | ( |
| 1 | 1 |
| ) | ) |
| .. | .. |
| ( | ( |
| to | tə |
| je | ə |
| taky | ) |
| sranda | ( |
| ) | taki |
| ] | srana |
| .. | ) |
ort: ['no', 'tak', 'to', 'můžete', 'bydlet', 'spolu', 'ale', 'to', 'mu', 'taky', '<SM', 'nemůžeš', 'udělat', '>', '[', '(', '1', ')', '..', '(', 'to', 'je', 'taky', 'sranda', ')', ']', '..']
fon: ['nó', 'tak|to', 'mužete', 'bidlet', 'spolu', 'ale', 'to|mu', 'taki', '<SM', 'nemúžeš', 'uďelat', '>', '[', '(', '1', ')', '..', '(', 'tə|ə', ')', '(', 'taki', 'srana', ')']
2023-09-08 00:34:39 ERROR root 18A032N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|------------+------------|
| je | je |
| to | to |
| úplně | uple |
| cool | kúl |
| je | je |
| to | to |
| hr* | hr |
| . | . |
| o | o |
| tom | tom |
| jsem | sem |
| psala | psala |
| də | də |
| . | . |
| úkol | úkol |
| na | na |
| sociologii | sociologii |
ort: ['je', 'to', 'úplně', 'cool', 'je', 'to', 'hr*', '.', 'o', 'tom', 'jsem', 'psala', 'də', '.', 'úkol', 'na', 'sociologii']
fon: ['je|to', 'uple', 'kúl', 'je|to', 'hr', '.', 'o|tom|sem', 'psala', 'də', '.', 'úkol', 'na|sociologii']
2023-09-08 00:34:43 ERROR root 18A032N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'Luci', ftok: '('
| ORT | FON |
|-------+------|
| & | & |
| Luci | ( |
| .. | luci |
| ó | ) |
| můj | .. |
| bože | ó |
| . | múj |
| kde | božé |
| #s | . |
| to | gde |
| to | s |
| je | to |
| z | to |
| Tiger | e |
| ? | ? |
ort: ['&', 'Luci', '..', 'ó', 'můj', 'bože', '.', 'kde', '#s', 'to', 'to', 'je', 'z', 'Tiger', '?']
fon: ['&', '(', 'luci', ')', '..', 'ó', 'múj', 'božé', '.', 'gde|s|to', 'to|e', '?']
2023-09-08 00:34:54 ERROR root 18E004N:Wrong use of # in '#kám'.
2023-09-08 00:35:06 ERROR root 18E009N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'prostě', ftok: '('
| ORT | FON |
|-----------+-----------|
| prostě | ( |
| jako | sťé |
| to | jako |
| auto | ) |
| se | to |
| mi | auto |
| absolutně | se |
| od | mi |
| toho | apsoluťňe |
| kolegy | o_ |
| nelíbilo | toho |
| .. | kolegi |
ort: ['prostě', 'jako', 'to', 'auto', 'se', 'mi', 'absolutně', 'od', 'toho', 'kolegy', 'nelíbilo', '..']
fon: ['(', 'sťé|jako', ')', 'to|auto', 'se|mi', 'apsoluťňe', 'o_|toho', 'kolegi']
2023-09-08 00:35:07 ERROR root 18E009N:Wrong use of # in 'kde#'.
2023-09-08 00:35:07 ERROR root 18E009N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
a a
@ @
já ja
říkám řikam
. .
co co
blbneš blbnež
( esi
jestli se
) pořežež
se víž
pořežeš nebə
víš že
nebo ťi
že to
ti škubne
to ..
škubne None
.. None
2023-09-08 00:35:07 ERROR root 18E009N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
jako jako
ty ti
( akučki
akučky to
) je
to neska
je úpəe
dneska jinde
úplně None
jinde None
2023-09-08 00:35:12 ERROR root 18T002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ' is not allowed on the ort layer
| ORT | FON |
|---------+--------|
| @ | @ |
| Gamer's | gejmrs |
| Pub | pap |
| se | se |
| stěhuje | sťehue |
ort: ['@', "Gamer's", 'Pub', 'se', 'stěhuje']
fon: ['@', 'gejmrs|pap', 'se|sťehue']
2023-09-08 00:35:16 ERROR root 18T002N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
práci neo
nebo pra
pra* nə
no nó
no ne
ne praksi
praxi asi
asi ne
ne spíš
spíš práci
práci ..
.. None
2023-09-08 00:35:19 ERROR root 18T003N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'hlavou', ftok: '('
| ORT | FON |
|------------+------------|
| [ | [ |
| tak | tag |
| vnímala | vňímaa |
| že | že |
| odpovídala | otpovídala |
| ] | ] |
| hlavou | ( |
| [ | 1 |
| kývala | ) |
| ] | [ |
ort: ['[', 'tak', 'vnímala', 'že', 'odpovídala', ']', 'hlavou', '[', 'kývala', ']']
fon: ['[', 'tag|vňímaa', 'že|otpovídala', ']', '(', '1', ')', '[']
2023-09-08 00:35:41 ERROR root 18T009N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
( husťe
hustě ..
) to
.. práve
to ..
právě tai
.. tadləncta
tady ázijé
tahleta a
Asie indijé
a tak
Indie vona
tak je
vona plná
je tai
plná təkəedlech
tady tech
takovejhlech trakú
tech ..
trucků None
.. None
2023-09-08 00:35:41 ERROR root 18T009N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
( hmm
hmm None
) None
2023-09-08 00:35:41 ERROR root 18T009N:Unexpected para code in <prosím / ['<prosím', '.', 'vy', 'si', 'dáte', 'něco', '>', '?'].
2023-09-08 00:35:49 ERROR root 18T011N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ĺ is not allowed on the ort layer
| ORT | FON |
|-------------+-------------|
| byl | bil |
| na | na |
| chodbě | chodbje |
| a | a |
| vo* | vol |
| . | . |
| a | a |
| volal | vəlal |
| .. | .. |
| a | a |
| telefonovaĺ | telefonovaĺ |
| prý | prí |
| plynně | pliňe |
| německy | ňemecki |
| a | a |
| že | že |
| si | si |
| říkala | řikaa |
| . | . |
ort: ['byl', 'na', 'chodbě', 'a', 'vo*', '.', 'a', 'volal', '..', 'a', 'telefonovaĺ', 'prý', 'plynně', 'německy', 'a', 'že', 'si', 'říkala', '.']
fon: ['bil|na|chodbje', 'a|vol', '.', 'a|vəlal', '..', 'a|telefonovaĺ', 'prí', 'pliňe', 'ňemecki', 'a|že|si', 'řikaa', '.']
2023-09-08 00:35:49 ERROR root 18T012N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|----+----|
| [ | [ |
| nə | nə |
| ] | ] |
| - | - |
ort: ['[', 'nə', ']', '-']
fon: ['[', 'nə', ']', '-']
2023-09-08 00:35:53 ERROR root 18T012N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'proč', ftok: '('
| ORT | FON |
|--------+-------|
| [ | [ |
| proč | ( |
| jí | 1 |
| dává | ) |
| ten | jí |
| řetěz | dává |
| ] | ten |
| ? | řeťez |
| on | ? |
| je | ] |
| prostě | on |
| → | je |
ort: ['[', 'proč', 'jí', 'dává', 'ten', 'řetěz', ']', '?', 'on', 'je', 'prostě']
fon: ['[', '(', '1', ')', 'jí|dává', 'ten|řeťez', '?', ']', 'on|je']
2023-09-08 00:35:53 ERROR root 18T012N:Misplaced _ in 'tagže|se|ta__'.
2023-09-08 00:35:57 ERROR root 18T014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'nadávaji'
| ORT | FON |
|----------+----------|
| [ | [ |
| proč | proč |
| ? | nadávaji |
| nadávají | ? |
| ] | ] |
| nebo | nebo |
| jako | jakə |
| - | - |
ort: ['[', 'proč', '?', 'nadávají', ']', 'nebo', 'jako', '-']
fon: ['[', 'proč|nadávaji', '?', ']', 'nebo', 'jakə', '-']
2023-09-08 00:35:58 ERROR root 18T014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'nebo', ftok: '('
| ORT | FON |
|----------+--------|
| ne | nə |
| jako | jako |
| že | že |
| to | to |
| nebude | nebude |
| dělat | ďeat |
| pět | pjet |
| nebo | ( |
| [ | 1 |
| taky | ) |
| těch | [ |
| vosm | daki |
| ] | tech |
| let | vosum |
| co | ] |
| dělala | le_ |
| toho | co |
| bakaláře | ďelalə |
| .. | təo |
ort: ['ne', 'jako', 'že', 'to', 'nebude', 'dělat', 'pět', 'nebo', '[', 'taky', 'těch', 'vosm', ']', 'let', 'co', 'dělala', 'toho', 'bakaláře', '..']
fon: ['nə|jako', 'že|to', 'nebude', 'ďeat', 'pjet', '(', '1', ')', '[', 'daki', 'tech|vosum', ']', 'le_', 'co|ďelalə', 'təo']
2023-09-08 00:36:01 ERROR root 18T015N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<PR', ftok: ''
| ORT | FON |
|----------------+--------------|
| tak | tak |
| . | . |
| jako | ja_ |
| kdyby | kdibi |
| . | . |
| já | ja |
| . | . |
| za | za |
| <PR | ← |
| teambuilgingem | <PR |
| > | tímbilgiŋgem |
| ve* | > |
| vidím | ve |
| [ | viďím |
| prostě | [ |
| ] | prəsťé |
| - | ] |
ort: ['tak', '.', 'jako', 'kdyby', '.', 'já', '.', 'za', '<PR', 'teambuilgingem', '>', 've*', 'vidím', '[', 'prostě', ']', '-']
fon: ['tak', '.', 'ja_|kdibi', '.', 'ja', '.', 'za|', '<PR', 'tímbilgiŋgem', '>', 've|viďím', '[', 'prəsťé', ']']
2023-09-08 00:36:02 ERROR root 18T015N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<PR', ftok: ''
| ORT | FON |
|------------+------------|
| a | a |
| podruhý | podruhí |
| ho | ho |
| taťka | taťka |
| přinesl | přines |
| z | s |
| <PR | ← |
| popradnice | <PR |
| > | popraďňicə |
| .. | > |
ort: ['a', 'podruhý', 'ho', 'taťka', 'přinesl', 'z', '<PR', 'popradnice', '>', '..']
fon: ['a|podruhí|ho', 'taťka', 'přines', 's|', '<PR', 'popraďňicə', '>']
2023-09-08 00:36:23 ERROR root 18X034N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '?', ftok: 'nebo'
| ORT | FON |
|--------+--------|
| a | a |
| first | frs |
| minute | minit |
| jsou | sou |
| do | o |
| konce | konce |
| března | března |
| ne | né |
| ? | nebo |
| nebo | ? |
| - | - |
ort: ['a', 'first', 'minute', 'jsou', 'do', 'konce', 'března', 'ne', '?', 'nebo', '-']
fon: ['a|frs|minit', 'sou|o|konce', 'března', 'né|nebo', '?', '-']
2023-09-08 00:37:00 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
[ [
on o_
nechce nechcé
a a
( říka
říká .
) prəpiska
. ale
propiska já
ale bi_
já chťel
bych ]
chtěl takové
] običejné
takové to
obyčejné None
to None
2023-09-08 00:37:02 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '[', ftok: ''
| ORT | FON |
|----------+----------|
| [ | [ |
| mašle | mašle |
| ] | ] |
| [ | [ |
| krabice | krabice |
| ] | ] |
| [ | [ |
| všecko | fšeckə |
| ] | ] |
| .. | .. |
| [ | [ |
| a | a |
| víc | víc |
| . | . |
| víc | víc |
| nemáte | nemáte |
| ] | ] |
| ? | ? |
| ona | ona |
| .. | .. |
| příští | přišťí |
| týden | tiden |
| se | se |
| [ | ← |
| zeptejte | [ |
| ] | zeptejte |
ort: ['[', 'mašle', ']', '[', 'krabice', ']', '[', 'všecko', ']', '..', '[', 'a', 'víc', '.', 'víc', 'nemáte', ']', '?', 'ona', '..', 'příští', 'týden', 'se', '[', 'zeptejte', ']']
fon: ['[', 'mašle', ']', '[', 'krabice', ']', '[', 'fšeckə', ']', '..', '[', 'a|víc', '.', 'víc|nemáte', ']', '?', 'ona', '..', 'přišťí', 'tiden', 'se|', '[', 'zeptejte']
2023-09-08 00:37:03 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
[ [
( jako
1 opchodú
) ]
obchodů [
] ale
[ (
a 1
( )
1 ]
) None
] None
2023-09-08 00:37:08 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
[ [
to to
dělá ďela
( náš
1 ]
) ..
] [
.. mi
[ to
my mame
to ]
máme [
] z
[ roďini
z ]
rodiny [
] (
[ brusa
( )
brusa ]
) None
] None
2023-09-08 00:37:18 ERROR root 18X100N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ń is not allowed on the fon layer
| ORT | FON |
|-------------+-------------|
| [ | [ |
| já | ja |
| jsem | sem |
| o | o |
| ní | ńí |
| ] | ] |
| taky | taki |
| přemejšlela | přemejšlela |
| .. | .. |
ort: ['[', 'já', 'jsem', 'o', 'ní', ']', 'taky', 'přemejšlela', '..']
fon: ['[', 'ja|sem|o|ńí', ']', 'taki', 'přemejšlela', '..']
2023-09-08 00:37:20 ERROR root 18X100N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<SM', ftok: '<PR'
| ORT | FON |
|---------+---------|
| samý | samí |
| chaty | chati |
| včera | fčera |
| mi | mi |
| máma | máma |
| řekla | řekla |
| kup | kup |
| si | si |
| zahradu | zahradu |
| nějakou | ňákou |
| já | já |
| říkám | řika_ |
| mami | mami |
| <SM | <PR |
| dej | dej |
| > | > |
| dej | dej |
| mi | mi |
| pokoj | poko_ |
| já | já |
| zahradu | zahradu |
| nechci | nechci |
| .. | .. |
ort: ['samý', 'chaty', 'včera', 'mi', 'máma', 'řekla', 'kup', 'si', 'zahradu', 'nějakou', 'já', 'říkám', 'mami', '<SM', 'dej', '>', 'dej', 'mi', 'pokoj', 'já', 'zahradu', 'nechci', '..']
fon: ['samí', 'chati', 'fčera|mi', 'máma', 'řekla', 'kup|si', 'zahradu', 'ňákou', 'já|řika_', 'mami', '<PR', 'dej', '>', 'dej|mi', 'poko_', 'já|zahradu', 'nechci', '..']
2023-09-08 00:37:41 ERROR root 18X105N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '<SP', ftok: '<SM'
| ORT | FON |
|---------+---------|
| něco | ňeco |
| [ | [ |
| lepšího | lepšího |
| vytvoří | vitvoří |
| no | no |
| ] | ] |
| .. | .. |
| [ | [ |
| <SP | <SM |
| hmm | hmm |
| hmm | hmm |
| > | > |
| ] | ] |
ort: ['něco', '[', 'lepšího', 'vytvoří', 'no', ']', '..', '[', '<SP', 'hmm', 'hmm', '>', ']']
fon: ['ňeco', '[', 'lepšího', 'vitvoří', 'no', ']', '..', '[', '<SM', 'hmm', 'hmm', '>', ']']
2023-09-08 00:37:57 ERROR root 18X132N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|----+----|
| [ | [ |
| nə | nə |
| ] | ] |
ort: ['[', 'nə', ']']
fon: ['[', 'nə', ']']
2023-09-08 00:37:58 ERROR root 18X132N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ń is not allowed on the fon layer
| ORT | FON |
|----------+----------|
| no | ńə |
| tak | tak |
| než | neš |
| . | . |
| přijedeš | přijedeš |
| k | k |
| nám | nám |
| tak | tak |
| vpravo | fprao |
| takhle | takle |
| .. | .. |
ort: ['no', 'tak', 'než', '.', 'přijedeš', 'k', 'nám', 'tak', 'vpravo', 'takhle', '..']
fon: ['ńə|tak', 'neš', '.', 'přijedeš', 'k|nám', 'tak', 'fprao', 'takle', '..']
2023-09-08 00:37:59 ERROR root 18X132N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'všechny', ftok: '('
| ORT | FON |
|---------+---------|
| [ | [ |
| <SM | <SM |
| že | še |
| je | bi |
| tam | tam |
| ] | ] |
| nechal | nechal |
| všechny | ( |
| peníze | fšechni |
| > | ) |
ort: ['[', '<SM', 'že', 'je', 'tam', ']', 'nechal', 'všechny', 'peníze', '>']
fon: ['[', '<SM', 'še|bi|tam', ']', 'nechal', '(', 'fšechni', ')']
2023-09-08 00:38:10 ERROR root 19A003N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
+ [
[ terí
který ma_
mají ]
] jiní
jiný koňíčki
koníčky ..
.. tak
tak to
to ə
je peklo
peklo jó
no s
s ňima
nima seš
jsi prosťe
prostě púl
půl oďini
hodiny f
v kabiňe
kabině a
a bolí
bolí ťe
tě uši
uši ..
.. None
2023-09-08 00:38:14 ERROR root 19A005N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'jako', ftok: ')'
| ORT | FON |
|----------+----------|
| dál | dál |
| to | to |
| vyřešit | viřešit |
| .. | .. |
| Míša | míša |
| mně | mňe |
| teda | teda |
| říkal | řikal |
| že | že |
| to | to |
| jsou | sou |
| nějaký | ňákí |
| zas | zas |
| takový | takoví |
| ty | ti |
| vývojový | vívojoví |
| prostě | pəsťe |
| vlny | vlni |
| .. | .. |
| že | že |
| se | se |
| to | to |
| ( | ( |
| jakoby | pakobi |
| jako | ) |
| ) | jakə |
| spraví | spraví |
ort: ['dál', 'to', 'vyřešit', '..', 'Míša', 'mně', 'teda', 'říkal', 'že', 'to', 'jsou', 'nějaký', 'zas', 'takový', 'ty', 'vývojový', 'prostě', 'vlny', '..', 'že', 'se', 'to', '(', 'jakoby', 'jako', ')', 'spraví']
fon: ['dál|to', 'viřešit', '..', 'míša|mňe', 'teda', 'řikal', 'že|to|sou', 'ňákí', 'zas|takoví|ti', 'vívojoví', 'pəsťe', 'vlni', '..', 'že|se|to', '(', 'pakobi', ')', 'jakə', 'spraví']
2023-09-08 00:38:15 ERROR root 19A005N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|----------+----------|
| von | von |
| právě | trae |
| Míša | míša |
| @ | @ |
| jako | jakə |
| Míša | míša |
| celkəvě | celkovje |
| neuznává | neuznává |
| tadyty | taiti |
| [ | [ |
| oslavy | oslavi |
| . | . |
| dětí | ďeťí |
| .. | .. |
| v | v |
| rámci | rámci |
| ] | ] |
| v | v |
| rámci | rámci |
| prostě | prəsťe |
| m* | me |
| jako | jakə |
| mezi | mezi |
| dětma | ďetma |
ort: ['von', 'právě', 'Míša', '@', 'jako', 'Míša', 'celkəvě', 'neuznává', 'tadyty', '[', 'oslavy', '.', 'dětí', '..', 'v', 'rámci', ']', 'v', 'rámci', 'prostě', 'm*', 'jako', 'mezi', 'dětma']
fon: ['von|trae', 'míša', '@', 'jakə', 'míša', 'celkovje', 'neuznává', 'taiti', '[', 'oslavi', '.', 'ďeťí', '..', 'v|rámci', ']', 'v|rámci', 'prəsťe', 'me', 'jakə', 'mezi', 'ďetma']
2023-09-08 00:38:24 ERROR root 19A010N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'pro', ftok: '('
| ORT | FON |
|--------+--------|
| prostě | prosťe |
| jo | jó |
| . | . |
| ( | ( |
| jsem | sem |
| se | řikaa |
| ) | ) |
| kdyby | dibi |
| .. | .. |
| kdyby | dibi |
| . | . |
| [ | [ |
| po | po |
| . | . |
| pro | ( |
| po | 1 |
| mně | ) |
| chtěli | po |
| peníze | mňe |
| ] | chťeli |
| .. | peňíze |
ort: ['prostě', 'jo', '.', '(', 'jsem', 'se', ')', 'kdyby', '..', 'kdyby', '.', '[', 'po', '.', 'pro', 'po', 'mně', 'chtěli', 'peníze', ']', '..']
fon: ['prosťe', 'jó', '.', '(', 'sem|řikaa', ')', 'dibi', '..', 'dibi', '.', '[', 'po', '.', '(', '1', ')', 'po|mňe', 'chťeli', 'peňíze']
2023-09-08 00:38:25 ERROR root 19A010N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
že že
( jesi
jestli tai
) si
ať tám
si sat
tam .
sad jakəbi
. uďelají
jakoby ..
udělají ale
.. žé
ale .
že že
. jim
že to
jim akəbi
to prənajmou
jakoby .
pronajmou ale
. kəbi
ale .
jakoby asi
. besplaťňe
asi None
bezplatně None
2023-09-08 00:38:28 ERROR root 19A013N:Wrong use of # in 's#'.
2023-09-08 00:38:29 ERROR root 19A013N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'ty', ftok: '('
| ORT | FON |
|-----------+-----------|
| no | nə |
| tak | ə |
| že | že |
| maj | maj |
| chvilku | chvilku |
| čas | času |
| jestli | jesi |
| nekoupíme | nekoupíme |
| motorky | motorki |
| a | a |
| já | já |
| říkám | igám |
| hoši | həši |
| ty | ( |
| jo | ti |
| . | ə |
ort: ['no', 'tak', 'že', 'maj', 'chvilku', 'čas', 'jestli', 'nekoupíme', 'motorky', 'a', 'já', 'říkám', 'hoši', 'ty', 'jo', '.']
fon: ['nə|ə', 'že|maj', 'chvilku', 'času', 'jesi', 'nekoupíme', 'motorki', 'a|já', 'igám', 'həši', '(', 'ti|ə']
2023-09-08 00:38:29 ERROR root 19A013N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
ale ale
teď te_
ten ten
( motokəs
motocross to
) é
to .
je celkəvje
. finančňe
celkově f
finančně prdeli
v a
prdeli ..
a None
.. None
2023-09-08 00:38:29 ERROR root 19A013N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'hele', ftok: '('
| ORT | FON |
|-----------+---------|
| tak | tak |
| v | ← |
| půl | púl |
| desáté | desate |
| jsem | sem |
| doma | dəma |
| se | ze |
| vším | fšiɱ |
| všudy | fšudi |
| hele | ( |
| na | 1 |
| motocross | ) |
| to | na |
| musíš | motokəs |
| jezdit | to |
| .. | musíž |
ort: ['tak', 'v', 'půl', 'desáté', 'jsem', 'doma', 'se', 'vším', 'všudy', 'hele', 'na', 'motocross', 'to', 'musíš', 'jezdit', '..']
fon: ['tak||púl', 'desate', 'sem|dəma', 'ze|fšiɱ', 'fšudi', '(', '1', ')', 'na|motokəs', 'to|musíž']
2023-09-08 00:38:41 ERROR root 19A031N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ə is not allowed on the ort layer
| ORT | FON |
|----+----|
| [ | [ |
| nə | nə |
| ] | ] |
ort: ['[', 'nə', ']']
fon: ['[', 'nə', ']']
2023-09-08 00:38:42 ERROR root 19A031N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'hmm', ftok: '('
| ORT | FON |
|-----+-----|
| [ | [ |
| hmm | ( |
| ] | hmm |
ort: ['[', 'hmm', ']']
fon: ['[', '(', 'hmm']
2023-09-08 00:38:56 ERROR root 19X028N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon
ftok = self.fon.pop(0)
^^^^^^^^^^^^^^^
IndexError: pop from empty list
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__
self.add_qmarks_on_fon()
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon
raise AddQMarksFailed(self.ort, new_fon)
AddQMarksFailed:
ORT FON
--- ---
když diš
( to
to tak
) podle
tak ňakích
podle obecních
nějakých statistik
obecných ..
statistik None
.. None
2023-09-08 00:38:56 ERROR root 19X028N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'jako', ftok: '('
| ORT | FON |
|---------+---------|
| + | + |
| [ | [ |
| člověk | človjek |
| a | a |
| když | diš |
| ] | ] |
| viděla | viďela |
| ještě | ešťe |
| ten | ten |
| scénář | scénář |
| jako | ( |
| že | jako |
| to | ) |
| je | že |
| fakt | to |
| úchylný | je |
| .. | fak |
| → | uchilní |
ort: ['+', '[', 'člověk', 'a', 'když', ']', 'viděla', 'ještě', 'ten', 'scénář', 'jako', 'že', 'to', 'je', 'fakt', 'úchylný', '..']
fon: ['+', '[', 'človjek', 'a|diš', ']', 'viďela', 'ešťe', 'ten|scénář', '(', 'jako', ')', 'že|to|je', 'fak|uchilní']
2023-09-08 00:38:57 ERROR root 19X028N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '(', ftok: 'já'
| ORT | FON |
|-------------+-------------|
| protože | pəče |
| ( | já |
| já | se_ |
| jsem | musela |
| ) | do |
| musela | šatni |
| do | a |
| šatny | ešťe |
| a | si |
| ještě | dát |
| si | <SM |
| dát | ( |
| <SM | jedni |
| aspoň | ) |
| kalhotky | kalhotki |
| a | a |
| oblíct | oblíct |
| podvlíkačky | podvlíkački |
| > | > |
| a | a |
| pak | pag |
| že | že |
| se | se |
| z | s |
| nich | ňich |
| nemohla | nemohla |
| vůbec | vúbez |
| dostat | dosta |
| ( | ( |
| 1 | 1 |
| ) | ) |
| .. | .. |
ort: ['protože', '(', 'já', 'jsem', ')', 'musela', 'do', 'šatny', 'a', 'ještě', 'si', 'dát', '<SM', 'aspoň', 'kalhotky', 'a', 'oblíct', 'podvlíkačky', '>', 'a', 'pak', 'že', 'se', 'z', 'nich', 'nemohla', 'vůbec', 'dostat', '(', '1', ')', '..']
fon: ['pəče', 'já|se_', 'musela', 'do|šatni', 'a|ešťe|si|dát', '<SM', '(', 'jedni', ')', 'kalhotki', 'a|oblíct', 'podvlíkački', '>', 'a|pag|že|se|s|ňich', 'nemohla', 'vúbez', 'dosta', '(', '1', ')', '..']
2023-09-08 00:38:57 ERROR root 19X028N:Unexpected para code in <příští / ['<příští', 'zastávka', 'Národní', 'třída', '>'].
2023-09-08 00:38:58 ERROR root 19X028N:Unexpected para code in <N / ['<N', 'árodní', 'třída', 'přestup', 'na', 'metro', 'příští', 'zastávka', 'Národní', 'divadlo', '>'].
2023-09-08 00:39:00 ERROR root 19X035N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: 'tímhle', ftok: '('
| ORT | FON |
|------------+------------|
| ( | ( |
| 1 | 1 |
| ) | ) |
| nevadí | nevaďí |
| dobrý | dobrí |
| .. | .. |
| mně | mňe |
| se | se |
| nechce | nechce |
| voblizovat | voblizovat |
| stůl | stúl |
| víš | víš |
| tak | tak |
| to | to |
| nechám | nechám |
| radši | rači |
| tady | tadi |
| tímhle | ( |
ort: ['(', '1', ')', 'nevadí', 'dobrý', '..', 'mně', 'se', 'nechce', 'voblizovat', 'stůl', 'víš', 'tak', 'to', 'nechám', 'radši', 'tady', 'tímhle']
fon: ['(', '1', ')', 'nevaďí', 'dobrí', '..', 'mňe|se', 'nechce', 'voblizovat', 'stúl', 'víš', 'tak|to', 'nechám', 'rači', 'tadi', '(']
2023-09-08 00:39:20 ERROR root 20A004N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '>', ftok: 'daa'
| ORT | FON |
|-------+-----|
| <SM | <SM |
| kam#s | kam |
| to | s |
| dala | tə |
| > | daa |
| ? | ? |
ort: ['<SM', 'kam#s', 'to', 'dala', '>', '?']
fon: ['<SM', 'kam|s|tə', 'daa', '?']
2023-09-08 00:39:20 ERROR root 20A004N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print
self.print_tok(otok, ftok, special)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok
raise TokenMismatch(self, otok, ftok)
TokenMismatch:
otok: '>', ftok: 'moje'
| ORT | FON |
|-------+-------|
| <SM | <SM |
| to | to |
| je | e |
| to | to |
| co | co |
| jíš | íš |
| teď | téť |
| . | . |
| jen | jen |
| ty#s | ti |
| někam | z |
| dala | ňekam |
| to | daa |
| moje | to |
| > | moje |
ort: ['<SM', 'to', 'je', 'to', 'co', 'jíš', 'teď', '.', 'jen', 'ty#s', 'někam', 'dala', 'to', 'moje', '>']
fon: ['<SM', 'to|e', 'to|co|íš', 'téť', '.', 'jen|ti|z', 'ňekam', 'daa', 'to|moje']
2023-09-08 00:39:21 ERROR root 20A004N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1006, in print
otok = next(ort)
^^^^^^^^^
StopIteration
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf
).print()
^^^^^^^
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1008, in print
raise OrtTooShort(self)
OrtTooShort:
| ORT | FON |
|-------+-------|
| ty#s | ti |
| řekla | z |
| že | řekla |
| je | že |
| pět | je |
| ale | pjet |
| už | ale |
| je | uš |
| čtvrt | je |
| na | štvrt |
| šest | na |
| → | šest |
ort: ['ty#s', 'řekla', 'že', 'je', 'pět', 'ale', 'už', 'je', 'čtvrt', 'na', 'šest']
fon: ['ti|z|řekla', 'že|je', 'pjet', 'ale|uš|je', 'štvrt|na|šest']
2023-09-08 00:39:22 ERROR root 20A007N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 841, in __init__
self._check_delimiters(ort)
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 947, in _check_delimiters
raise ValueError(f"Nested {d} in {trans!r}")
ValueError: Nested < in '<JO3 <PR bizi bizi bizi>'
2023-09-08 00:39:40 ERROR root 20X022N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ' is not allowed on the ort layer
| ORT | FON |
|----------+-------|
| ty | DUMMY |
| neznáš | DUMMY |
| .. | DUMMY |
| Ignácia | DUMMY |
| O'Reilly | DUMMY |
ort: ['ty', 'neznáš', '..', 'Ignácia', "O'Reilly"]
fon: None
2023-09-08 00:39:40 ERROR root 20X022N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ' is not allowed on the ort layer
| ORT | FON |
|---------+-------|
| John | DUMMY |
| Kennedy | DUMMY |
| O'Toole | DUMMY |
| to | DUMMY |
| napsal | DUMMY |
ort: ['John', 'Kennedy', "O'Toole", 'to', 'napsal']
fon: None
2023-09-08 00:39:53 ERROR root 21X014N:Corrupt segment -- Traceback (most recent call last):
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf
Segment(
File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__
raise InvalidGraphemeCluster(self)
InvalidGraphemeCluster: ' is not allowed on the ort layer
| ORT | FON |
|----------+-------|
| ono | DUMMY |
| se | DUMMY |
| to | DUMMY |
| jmenuje | DUMMY |
| Zack | DUMMY |
| Snyder's | DUMMY |
| . | DUMMY |
| to | DUMMY |
| je | DUMMY |
| fakt | DUMMY |
| jako | DUMMY |
| pro | DUMMY |
| něj | DUMMY |
| jenom | DUMMY |
| ten | DUMMY |
| film | DUMMY |
ort: ['ono', 'se', 'to', 'jmenuje', 'Zack', "Snyder's", '.', 'to', 'je', 'fakt', 'jako', 'pro', 'něj', 'jenom', 'ten', 'film']
fon: None