2023-09-08 00:12:39 ERROR root 12A036N:Wrong use of # in 'to#'. 2023-09-08 00:12:39 ERROR root 12A036N:Wrong use of # in 'to#'. 2023-09-08 00:12:44 ERROR root 12A038N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'jakə' | ORT | FON | |------------+------------| | jo | jó | | ? | jakə | | jako | ? | | má | má | | peníze | peňíze | | tak | tak | | si | si | | hraje | hraje | | na | na | | producenta | producenta | | jakože | jakože | | nemusí | nemusí | | shánět | scháňet | | prachy | prachi | | protože | pře | | má | má | | ty | ti | | vlastní | vlasňí | | a | a | | to | to | ort: ['jo', '?', 'jako', 'má', 'peníze', 'tak', 'si', 'hraje', 'na', 'producenta', 'jakože', 'nemusí', 'shánět', 'prachy', 'protože', 'má', 'ty', 'vlastní', 'a', 'to'] fon: ['jó|jakə', '?', 'má|peňíze', 'tak|si', 'hraje', 'na|producenta', 'jakože', 'nemusí', 'scháňet', 'prachi', 'pře|má', 'ti|vlasňí', 'a|to'] 2023-09-08 00:12:46 ERROR root 12A039N:Wrong use of # in 'to#'. 2023-09-08 00:12:46 ERROR root 12A039N:Wrong use of # in 'to#'. 2023-09-08 00:12:47 ERROR root 12H003N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'dem' | ORT | FON | |----------+----------| | [ | [ | | už | až | | budem | buem | | ] | ] | | jak | jak | | starej | starej | | NP | NP | | viď | vi_ | | ? | dem | | budem | ? | | chodit | choďid | | a | a | | buž* | bu | | buch | bu | | buch | bu | | . | . | | ale | ale | | tu | tu | | sílu | sílu | | já | já | | to | to | | ještě | ešťe | | přehodím | přehoďim | | . | . | ort: ['[', 'už', 'budem', ']', 'jak', 'starej', 'NP', 'viď', '?', 'budem', 'chodit', 'a', 'buž*', 'buch', 'buch', '.', 'ale', 'tu', 'sílu', 'já', 'to', 'ještě', 'přehodím', '.'] fon: ['[', 'až|buem', ']', 'jak|starej', 'NP', 'vi_|dem', '?', 'choďid|a', 'bu|bu|bu', '.', 'ale', 'tu|sílu', 'já|to', 'ešťe', 'přehoďim', '.'] 2023-09-08 00:12:47 ERROR root 12H003N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |--------+--------| | [ | [ | | nebə | nebə | | jedině | jeďiňe | | Prahu | prahu | | dát | dát | | ] | ] | | no | nó | | a | a | | + | + | ort: ['[', 'nebə', 'jedině', 'Prahu', 'dát', ']', 'no', 'a', '+'] fon: ['[', 'nebə', 'jeďiňe', 'prahu', 'dát', ']', 'nó|a', '+'] 2023-09-08 00:12:47 ERROR root 12H003N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'ti' | ORT | FON | |-----------+-----------| | + | + | | von | von | | má | má | | @ | @ | | věci | vjeci | | který | kterí | | jsou | sou | | @ | @ | | těsně | ťesňe | | před | přet | | @ | @ | | vypršením | vipršeňím | | tý | ti | | .. | .. | | jo | jó | | ? | ? | | tý | tí | | šarže | šarže | | tý | ti | | .. | .. | | jo | jó | | ? | ti | | tý | ? | | prostě | prosťe | | .. | .. | | [ | [ | | lhůty | lhuti | | ] | ] | ort: ['+', 'von', 'má', '@', 'věci', 'který', 'jsou', '@', 'těsně', 'před', '@', 'vypršením', 'tý', '..', 'jo', '?', 'tý', 'šarže', 'tý', '..', 'jo', '?', 'tý', 'prostě', '..', '[', 'lhůty', ']'] fon: ['+', 'von|má', '@', 'vjeci', 'kterí|sou', '@', 'ťesňe', 'přet', '@', 'vipršeňím', 'ti', '..', 'jó', '?', 'tí|šarže', 'ti', '..', 'jó|ti', '?', 'prosťe', '..', '[', 'lhuti', ']'] 2023-09-08 00:12:50 ERROR root 12O003N:Wrong use of # in 'to#'. 2023-09-08 00:13:08 ERROR root 13A006N:Wrong use of # in 's#'. 2023-09-08 00:13:17 ERROR root 13A010N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'jako', ftok: '(' | ORT | FON | |---------+--------| | jako | ( | | aj | 1 | | pěkný | ) | | je | aj | | úplně | pjekní | | jenom | je | | ten | upəňe | | rožek | jenəm | | když | ten | | jdeš | rožeg | | z | diž | | toho | deš | | .. | s | | z | tohó | | chodby | .. | | . | s | | prvního | chodbi | | patra | . | | navrch | prvňío | | na | patra | | půdu | navrɣ | | .. | na | | → | púdu | ort: ['jako', 'aj', 'pěkný', 'je', 'úplně', 'jenom', 'ten', 'rožek', 'když', 'jdeš', 'z', 'toho', '..', 'z', 'chodby', '.', 'prvního', 'patra', 'navrch', 'na', 'půdu', '..'] fon: ['(', '1', ')', 'aj', 'pjekní|je', 'upəňe', 'jenəm|ten', 'rožeg', 'diž|deš', 's|tohó', '..', 's|chodbi', '.', 'prvňío', 'patra', 'navrɣ', 'na|púdu'] 2023-09-08 00:13:17 ERROR root 13A010N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'stejňe' | ORT | FON | |---------+---------| | a | a | | tam | tam | | je | je | | vlastně | vasňe | | pak | pak | | taky | taki | | na | na | | chodbě | chodbje | | je | je | | tam | taɱ | | vlastně | vasňe | | záchod | záchod | | a | a | | ta | ta | | špajzka | špajska | | že | že | | ? | stejňe | | stejně | ? | | jako | jag | | dole | dəle | ort: ['a', 'tam', 'je', 'vlastně', 'pak', 'taky', 'na', 'chodbě', 'je', 'tam', 'vlastně', 'záchod', 'a', 'ta', 'špajzka', 'že', '?', 'stejně', 'jako', 'dole'] fon: ['a|tam|je', 'vasňe|pak', 'taki', 'na|chodbje', 'je|taɱ', 'vasňe', 'záchod', 'a|ta', 'špajska', 'že|stejňe', '?', 'jag|dəle'] 2023-09-08 00:13:18 ERROR root 13A010N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'jakə' | ORT | FON | |---------+--------| | tak | tag | | jak | jak | | my | mi | | jako | jako | | sebe | sebe | | to | to | | ne | né | | že | žə | | .. | .. | | tak | tak | | protože | počé | | rozdíl | rozďíl | | byl | bil | | u | u | | vás | vás | | trochu | trochu | | větší | vječí | | že | že | | ? | jakə | | jako | ? | | + | + | ort: ['tak', 'jak', 'my', 'jako', 'sebe', 'to', 'ne', 'že', '..', 'tak', 'protože', 'rozdíl', 'byl', 'u', 'vás', 'trochu', 'větší', 'že', '?', 'jako', '+'] fon: ['tag|jak', 'mi|jako', 'sebe', 'to|né', 'žə', '..', 'tak|počé', 'rozďíl|bil', 'u|vás', 'trochu', 'vječí', 'že|jakə', '?', '+'] 2023-09-08 00:13:48 ERROR root 13A024N:Wrong use of # in 's#'. 2023-09-08 00:14:11 ERROR root 13A035N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'jako', ftok: '(' | ORT | FON | |-------------+-------------| | [ | [ | | no | nó | | tak | tak | | ] | ] | | jo | jə | | jo | jó | | [ | [ | | jakoby | jakobi | | nastřídačku | nastřídačku | | ] | ] | | víš | víš | | ? | ? | | jako | ( | | že | akə | | ( | že | | 2 | ) | | ) | ( | ort: ['[', 'no', 'tak', ']', 'jo', 'jo', '[', 'jakoby', 'nastřídačku', ']', 'víš', '?', 'jako', 'že', '(', '2', ')'] fon: ['[', 'nó|tak', ']', 'jə|jó', '[', 'jakobi', 'nastřídačku', ']', 'víš', '?', '(', 'akə|že', ')', '('] 2023-09-08 00:14:21 ERROR root 13A040N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- <PP <PP no nə tak tak . . jako jako na na toho toho .. .. + + [ [ ( pavlova Pavlova . . pavlova Pavlova taťíŋka ) ] tatínka > ] None > None 2023-09-08 00:14:21 ERROR root 13A040N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- [ [ ( tomu tomu ] ) rozumi ] ale rozumím [ ale prož [ bi proč se by oňi se ] oni mňeli ] rozváďe_ měli [ rozvádět diď ? oňi [ s vždyť ťim oni ? s taťíŋkem tím ] tatínkem - ] None - None 2023-09-08 00:14:23 ERROR root 13A040N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'ale' | ORT | FON | |----------+----------| | k | k | | těm | ťem | | cizím | cizím | | to | to | | se | se | | může | múže | | p* | p | | jako | jakó | | . | . | | [ | [ | | přelomit | přelomi_ | | ] | ] | | že | ǯe | | ? | ? | | . | . | | [ | [ | | to | tó | | jako | jako | | ťu | ťu | | ťu | ťu | | ťu | ťu | | ] | ] | | ňu | ňu | | ňu | ňu | | ňu | ňu | | .. | .. | | svatej | svatej | | za | za | | dědinó | ďeďinó | | [ | [ | | jo | jó | | ? | ale | | ale | ? | | ] | ] | | to | to | | jako | jako | | .. | .. | ort: ['k', 'těm', 'cizím', 'to', 'se', 'může', 'p*', 'jako', '.', '[', 'přelomit', ']', 'že', '?', '.', '[', 'to', 'jako', 'ťu', 'ťu', 'ťu', ']', 'ňu', 'ňu', 'ňu', '..', 'svatej', 'za', 'dědinó', '[', 'jo', '?', 'ale', ']', 'to', 'jako', '..'] fon: ['k|ťem|cizím', 'to|se', 'múže|p', 'jakó', '.', '[', 'přelomi_', ']', 'ǯe', '?', '.', '[', 'tó|jako', 'ťu|ťu|ťu', ']', 'ňu|ňu|ňu', '..', 'svatej', 'za|ďeďinó', '[', 'jó|ale', '?', ']', 'to|jako', '..'] 2023-09-08 00:14:25 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'doma', ftok: '(' | ORT | FON | |--------------+--------------| | vidíš | íž | | a | a | | ten | ten | | mikropočítač | mikropočítač | | to | to | | je | je | | ta | ta | | věc | vec | | co | co | | #s | s | | měl | mňel | | [ | [ | | doma | ( | | nějak | dəma | | přes | ) | | ty | ňak | | Vánoce | přes | | nebo | ti | | tak | vánoce | | ] | nebə | | ? | ? | ort: ['vidíš', 'a', 'ten', 'mikropočítač', 'to', 'je', 'ta', 'věc', 'co', '#s', 'měl', '[', 'doma', 'nějak', 'přes', 'ty', 'Vánoce', 'nebo', 'tak', ']', '?'] fon: ['íž|a', 'ten|mikropočítač', 'to|je', 'ta|vec', 'co|s|mňel', '[', '(', 'dəma', ')', 'ňak', 'přes|ti', 'vánoce', 'nebə', '?'] 2023-09-08 00:14:26 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- no no a a je je to tə jakože jakože to tó to to je je vono vono no nó akorát akorá_ ten ten už uš jsem sem taky taki vyřadil viřaďil protože prəǯe ten tən taky taki ( ne 1 f ) tom v nejel tom . nejel None . None 2023-09-08 00:14:26 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '[', ftok: '' | ORT | FON | |------------+------------| | [ | [ | | to | to | | jo | jə | | ale | ale | | ( | ( | | 1 | 1 | | ) | ) | | ná* | na | | náho* | nahə | | náhodou | náhodəu | | ] | ] | | se | se | | ale | ale | | se | se | | oteplilo | oteplilo | | jako | jakə | | teď | teď | | na | na | | [ | ← | | vodpoledne | [ | | mně | votpoledne | | přišlo | mňe | | ] | přišlo | | .. | ] | ort: ['[', 'to', 'jo', 'ale', '(', '1', ')', 'ná*', 'náho*', 'náhodou', ']', 'se', 'ale', 'se', 'oteplilo', 'jako', 'teď', 'na', '[', 'vodpoledne', 'mně', 'přišlo', ']', '..'] fon: ['[', 'to', 'jə', 'ale', '(', '1', ')', 'na', 'nahə', 'náhodəu', ']', 'se|ale', 'se|oteplilo', 'jakə', 'teď|na|', '[', 'votpoledne', 'mňe|přišlo', ']'] 2023-09-08 00:14:26 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: ')', ftok: 'nou' | ORT | FON | |---------+---------| | no | nə | | tak | tak | | jo | jə | | že | še | | jo | ó | | protože | protože | | tam | ta_ | | má | má | | byt | bit | | .. | .. | | [ | [ | | a | a | | on | o_ | | měl | ňel | | práci | práci | | ] | ] | | jako | jako | | tím | ťím | | směrem | smňerem | | ( | ( | | teďka | ska | | když | iš | | má | má | | ) | nou | | novou | ) | | <SM | <SM | | v | f | | Komíně | komíňe | | > | > | ort: ['no', 'tak', 'jo', 'že', 'jo', 'protože', 'tam', 'má', 'byt', '..', '[', 'a', 'on', 'měl', 'práci', ']', 'jako', 'tím', 'směrem', '(', 'teďka', 'když', 'má', ')', 'novou', '<SM', 'v', 'Komíně', '>'] fon: ['nə|tak', 'jə', 'še|ó', 'protože', 'ta_|má', 'bit', '..', '[', 'a|o_|ňel', 'práci', ']', 'jako', 'ťím|smňerem', '(', 'ska', 'iš|má', 'nou', ')', '<SM', 'f|komíňe', '>'] 2023-09-08 00:14:27 ERROR root 13A042N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'a' | ORT | FON | |---------+---------| | k | k | | ní | ňí | | do | do | | práce | práce | | nebo | bo | | k | k | | práci | práci | | a | a | | že | že | | vona | vona | | vezme | vezme | | auto | auto | | víš | víš | | ? | a | | a | ? | | .. | .. | | [ | [ | | otočíme | otočíme | | se | se | | ( | ( | | 2 | 2 | | ) | ) | | ] | ] | | . | . | ort: ['k', 'ní', 'do', 'práce', 'nebo', 'k', 'práci', 'a', 'že', 'vona', 'vezme', 'auto', 'víš', '?', 'a', '..', '[', 'otočíme', 'se', '(', '2', ')', ']', '.'] fon: ['k|ňí|do|práce', 'bo', 'k|práci', 'a|že', 'vona', 'vezme', 'auto', 'víš|a', '?', '..', '[', 'otočíme|se', '(', '2', ')', ']', '.'] 2023-09-08 00:14:28 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'že' | ORT | FON | |---------+---------| | + | + | | a | a | | že | že | | měl | mel | | sálovky | sálofki | | .. | .. | | ale | a | | jestli | jesi | | jsem | sem | | si | si | | neměla | nemňea | | víš | ví_ | | ? | že | | že | ? | | kou* | kou | | .. | .. | | ale | a | | voni | voňi | | žádný | žání | | tyhlety | tileti | | . | . | ort: ['+', 'a', 'že', 'měl', 'sálovky', '..', 'ale', 'jestli', 'jsem', 'si', 'neměla', 'víš', '?', 'že', 'kou*', '..', 'ale', 'voni', 'žádný', 'tyhlety', '.'] fon: ['+', 'a|že|mel', 'sálofki', '..', 'a|jesi|sem|si', 'nemňea', 'ví_|že', '?', 'kou', '..', 'a|voňi', 'žání', 'tileti', '.'] 2023-09-08 00:14:28 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '[', ftok: '' | ORT | FON | |------------+------------| | [ | [ | | no | nó | | ] | ] | | vona | vona | | se | se | | [ | [ | | drolí | drólí | | no | no | | vždyť | diť | | ] | ] | | .. | .. | | @ | @ | | vždyť | diť | | i | i | | papí* | papí | | @ | @ | | ty | ti | | ty | ti | | tescový | teskəí | | tašky | taški | | jsou | sou | | [ | ← | | ekologický | [ | | ty | ekologickí | | ] | ti | | ti | ] | | po | ťi | | čase | po | | [ | čase | | prostě | [ | | ] | prosťe | ort: ['[', 'no', ']', 'vona', 'se', '[', 'drolí', 'no', 'vždyť', ']', '..', '@', 'vždyť', 'i', 'papí*', '@', 'ty', 'ty', 'tescový', 'tašky', 'jsou', '[', 'ekologický', 'ty', ']', 'ti', 'po', 'čase', '[', 'prostě', ']'] fon: ['[', 'nó', ']', 'vona|se', '[', 'drólí', 'no|diť', ']', '..', '@', 'diť|i', 'papí', '@', 'ti|ti', 'teskəí', 'taški', 'sou|', '[', 'ekologickí', 'ti', ']', 'ťi|po|čase', '[', 'prosťe'] 2023-09-08 00:14:28 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'ňák' | ORT | FON | |---------+---------| | [ | [ | | vy | vi | | jste | se | | měli | mňeli | | vevni* | vevi | | vevnitř | vevňitř | | díry | ďíri | | viď | viť | | ? | ňák | | nějak | ? | | vevnitř | vevňitř | | díry | ďíri | | ] | ] | ort: ['[', 'vy', 'jste', 'měli', 'vevni*', 'vevnitř', 'díry', 'viď', '?', 'nějak', 'vevnitř', 'díry', ']'] fon: ['[', 'vi|se', 'mňeli', 'vevi', 'vevňitř', 'ďíri', 'viť|ňák', '?', 'vevňitř', 'ďíri', ']'] 2023-09-08 00:14:29 ERROR root 13A043N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'jak' | ORT | FON | |----------+----------| | takhle | tagle | | čl* | čə | | člověk | čəjek | | tam | tam | | najede | najede | | .. | .. | | i | i | | když | diš | | tuhle | tudle | | taky | taki | | jsem | sem | | tam | tam | | takhle | takle | | najížděl | najížďel | | .. | .. | | a | á | | . | . | | si | si | | představ | přestav | | jo | jó | | ? | jak | | jak | ? | | jak | jak | | jak | jak | | se | se | | . | . | | jede | jede | | do | do | | díry | ďíri | | + | + | ort: ['takhle', 'čl*', 'člověk', 'tam', 'najede', '..', 'i', 'když', 'tuhle', 'taky', 'jsem', 'tam', 'takhle', 'najížděl', '..', 'a', '.', 'si', 'představ', 'jo', '?', 'jak', 'jak', 'jak', 'se', '.', 'jede', 'do', 'díry', '+'] fon: ['tagle', 'čə', 'čəjek|tam', 'najede', '..', 'i|diš', 'tudle', 'taki|sem|tam', 'takle', 'najížďel', '..', 'á', '.', 'si|přestav', 'jó|jak', '?', 'jak', 'jak|se', '.', 'jede', 'do|ďíri', '+'] 2023-09-08 00:15:05 ERROR root 13A058N:Wrong use of # in 'to#'. 2023-09-08 00:15:06 ERROR root 13A060N:Wrong use of # in 'to#'. 2023-09-08 00:15:06 ERROR root 13A060N:Wrong use of # in 'to#'. 2023-09-08 00:15:07 ERROR root 13A060N:Wrong use of # in 'to#'. 2023-09-08 00:15:10 ERROR root 13A060N:Wrong use of # in 'to#'. 2023-09-08 00:15:11 ERROR root 13A060N:Wrong use of # in 'to#'. 2023-09-08 00:15:11 ERROR root 13A060N:Wrong use of # in 'to#'. 2023-09-08 00:15:23 ERROR root 13A067N:Wrong use of # in 'sebral#'. 2023-09-08 00:15:23 ERROR root 13A067N:Wrong use of # in 'dal#'. 2023-09-08 00:15:34 ERROR root 13A070N:Wrong use of # in 'vyto#'. 2023-09-08 00:15:34 ERROR root 13A070N:Wrong use of # in 'toto#'. 2023-09-08 00:15:36 ERROR root 13A070N:Wrong use of # in 'to#'. 2023-09-08 00:15:37 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'furt' | ORT | FON | |--------+--------| | že | je | | tam | tam | | kvílel | kvílel | | jo | jó | | ? | furt | | furt | ? | ort: ['že', 'tam', 'kvílel', 'jo', '?', 'furt'] fon: ['je|tam', 'kvílel', 'jó|furt', '?'] 2023-09-08 00:15:38 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- [ [ ( trošku trošku diz desi* ] ) dizajnovje ] jako designově [ jako ə [ ] jo None ] None ? None 2023-09-08 00:15:38 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: ']', ftok: ')' | ORT | FON | |---------------+---------------| | taková | takəvá | | st* | st | | startrekovská | stártrekəfská | | jakoby | jakobi | | jo | jo | | ? | ? | | .. | .. | | [ | [ | | ( | ( | | tak | tak | | . | . | | takhle | take | | do | do | | m* | m | | ] | ) | | ) | ] | | do | do | | modra | modra | | to | to | | bylo | biló | | že | že | | jo | jó | | ? | ? | | takhle | take | | ty | ti | | .. | .. | | v | f | | tom | to_ | | meníčku | meňíčku | | takhle | ake | | .. | .. | | po | po | | levý | leví | | [ | [ | | straně | straňé | | ] | ] | ort: ['taková', 'st*', 'startrekovská', 'jakoby', 'jo', '?', '..', '[', '(', 'tak', '.', 'takhle', 'do', 'm*', ']', ')', 'do', 'modra', 'to', 'bylo', 'že', 'jo', '?', 'takhle', 'ty', '..', 'v', 'tom', 'meníčku', 'takhle', '..', 'po', 'levý', '[', 'straně', ']'] fon: ['takəvá', 'st', 'stártrekəfská', 'jakobi', 'jo', '?', '..', '[', '(', 'tak', '.', 'take', 'do|m', ')', ']', 'do|modra', 'to|biló', 'že|jó', '?', 'take|ti', '..', 'f|to_|meňíčku', 'ake', '..', 'po|leví', '[', 'straňé', ']'] 2023-09-08 00:15:38 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'hoďňe' | ORT | FON | |---------+---------| | to | to | | bylo | bio | | asi | asi | | ho* | ho | | .. | .. | | <PR | <PR | | ježdění | ježďeňí | | > | > | | ježděný | ježďení | | ne | ne | | ? | hoďňe | | hodně | ? | ort: ['to', 'bylo', 'asi', 'ho*', '..', '<PR', 'ježdění', '>', 'ježděný', 'ne', '?', 'hodně'] fon: ['to|bio', 'asi|ho', '..', '<PR', 'ježďeňí', '>', 'ježďení', 'ne|hoďňe', '?'] 2023-09-08 00:15:39 ERROR root 13A072N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'ale' | ORT | FON | |---------+---------| | @ | @ | | jakoby | jakobi | | .. | .. | | podlaha | podlahu | | už | uš | | je | jé | | de | de | | facto | fakto | | jakoby | jakobi | | čistá | čistá | | jo | jó | | ? | ale | | ale | ? | | jakoby | jakobi | | v | f | | těch | ťech | | . | . | | třeba | třeba | | v | f | | těch | ťeh | | bocích | bocích | | a | a | | takhle | taklé | | [ | [ | | že | že | | jo | ə | | ] | ] | | ? | ? | | .. | .. | | v | f | | tom | tom | | .. | .. | ort: ['@', 'jakoby', '..', 'podlaha', 'už', 'je', 'de', 'facto', 'jakoby', 'čistá', 'jo', '?', 'ale', 'jakoby', 'v', 'těch', '.', 'třeba', 'v', 'těch', 'bocích', 'a', 'takhle', '[', 'že', 'jo', ']', '?', '..', 'v', 'tom', '..'] fon: ['@', 'jakobi', '..', 'podlahu', 'uš|jé', 'de|fakto', 'jakobi', 'čistá', 'jó|ale', '?', 'jakobi|f|ťech', '.', 'třeba', 'f|ťeh|bocích', 'a|taklé', '[', 'že|ə', ']', '?', '..', 'f|tom', '..'] 2023-09-08 00:15:52 ERROR root 13A079N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'kurva', ftok: '(' | ORT | FON | |----------+----------| | taky | taki | | židák | židák | | .. | .. | | kurva | ( | | z | kurva | | výkopu | s | | .. | víkopu | | a | ) | | .. | .. | | ale | á | | dobrej | .. | | režisér | ale | | jako | dobrej | | vopravdu | režizér | | eso | jakó | | .. | vopravdu | | on | eso | | miluje | .. | | Řecko | o_ | | .. | miluje | ort: ['taky', 'židák', '..', 'kurva', 'z', 'výkopu', '..', 'a', '..', 'ale', 'dobrej', 'režisér', 'jako', 'vopravdu', 'eso', '..', 'on', 'miluje', 'Řecko', '..'] fon: ['taki', 'židák', '..', '(', 'kurva', 's|víkopu', ')', '..', 'á', '..', 'ale', 'dobrej', 'režizér', 'jakó', 'vopravdu', 'eso', '..', 'o_|miluje'] 2023-09-08 00:15:52 ERROR root 13A079N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'to', ftok: '(' | ORT | FON | |---------+---------| | říkám | řikam | | když | diš | | to | to | | říkáš | řikáš | | ty | ti | | který | terí | | jako | jako | | máš | maš | | i | i | | jako | jako | | režisér | režizər | | na | na | | to | ( | | .. | 1 | | na | ) | | to | .. | | náhled | na | | tak | to | | asi | náhle_ | | jo | tak | | .. | asi | ort: ['říkám', 'když', 'to', 'říkáš', 'ty', 'který', 'jako', 'máš', 'i', 'jako', 'režisér', 'na', 'to', '..', 'na', 'to', 'náhled', 'tak', 'asi', 'jo', '..'] fon: ['řikam', 'diš|to', 'řikáš|ti', 'terí', 'jako', 'maš|i', 'jako', 'režizər', 'na', '(', '1', ')', '..', 'na|to', 'náhle_', 'tak|asi'] 2023-09-08 00:15:58 ERROR root 13A083N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<PR', ftok: '' | ORT | FON | |---------+---------| | no | nə | | jo | jó | | tak | tag | | Dejvice | dejvice | | to | to | | byla | bila | | klasika | klasika | | chápeš | chápeš | | ale | aə | | to | to | | bylo | bio | | už | uš | | už | uš | | <PR | ← | | zma | <PR | | > | zma | | za | > | | mýho | za | | dětství | mího | | to | ďectví | | už | to | | [ | už | | bylo | [ | | ] | bió | ort: ['no', 'jo', 'tak', 'Dejvice', 'to', 'byla', 'klasika', 'chápeš', 'ale', 'to', 'bylo', 'už', 'už', '<PR', 'zma', '>', 'za', 'mýho', 'dětství', 'to', 'už', '[', 'bylo', ']'] fon: ['nə|jó', 'tag|dejvice', 'to|bila', 'klasika', 'chápeš', 'aə', 'to|bio|uš', 'uš|', '<PR', 'zma', '>', 'za|mího', 'ďectví', 'to|už', '[', 'bió'] 2023-09-08 00:16:00 ERROR root 13A085N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- [ [ ( eg eg* ] ) @ ] ezistuje @ [ existuje ťeškí [ taŋk těžký ] tank None ] None 2023-09-08 00:16:14 ERROR root 13A091N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf "_end": ts2, File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ @functools.cache ^^^^^^^^^ InvalidGraphemeCluster: ń is not allowed on the fon layer | ORT | FON | |----------+---------| | [ | [ | | s* | s | | .. | .. | | ( | ( | | v | f | | s* | s | | ) | ) | | v | f | | sedmičce | sedmice | | já | ja | | si | si | | já | já | | si | si | | ( | ( | | myslím | misəm | | ) | ) | | že | že | | tady | tak | | je | ńá | | ] | ] | ort: ['[', 's*', '..', '(', 'v', 's*', ')', 'v', 'sedmičce', 'já', 'si', 'já', 'si', '(', 'myslím', ')', 'že', 'tady', 'je', ']'] fon: ['[', 's', '..', '(', 'f|s', ')', 'f|sedmice', 'ja|si', 'já|si', '(', 'misəm', ')', 'že|tak|ńá', ']'] 2023-09-08 00:16:15 ERROR root 13A091N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf logging.error(f"{LABEL}:{e}") ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print except StopIteration: ^^^^^^^^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok ftok TokenMismatch: otok: '<PR', ftok: '' | ORT | FON | |------------+------------| | [ | [ | | pásku | páskú | | ] | ] | | jo | jo | | .. | .. | | no | nó | | . | . | | a | a | | . | . | | že | že | | máme | máme | | nachystáno | nachistáno | | na | na | | <PR | ← | | keně | <PR | | > | keňe | | na | > | | koně | na | | že | koňe | | jo | že | | tak | ó | | . | ta | ort: ['[', 'pásku', ']', 'jo', '..', 'no', '.', 'a', '.', 'že', 'máme', 'nachystáno', 'na', '<PR', 'keně', '>', 'na', 'koně', 'že', 'jo', 'tak', '.'] fon: ['[', 'páskú', ']', 'jo', '..', 'nó', '.', 'a', '.', 'že|máme', 'nachistáno', 'na|', '<PR', 'keňe', '>', 'na|koňe', 'že|ó', 'ta'] 2023-09-08 00:16:18 ERROR root 13A094N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf logging.error(f"{LABEL}:{e}") ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print except StopIteration: ^^^^^^^^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok ftok TokenMismatch: otok: 'něco', ftok: '(' | ORT | FON | |--------+--------| | jo | jo | | . | . | | no | no | | .. | .. | | tak | k | | ještě | ešťe | | řekneš | řekneš | | něco | ( | | ? | ? | | a | ecə | | neměj | ) | | ty | a | | ( | nemňej | | 1 | ti | | ) | ( | | ruce | 1 | | ( | ) | | v | ruce | | těch | ( | | ) | f | | .. | ťech | ort: ['jo', '.', 'no', '..', 'tak', 'ještě', 'řekneš', 'něco', '?', 'a', 'neměj', 'ty', '(', '1', ')', 'ruce', '(', 'v', 'těch', ')', '..'] fon: ['jo', '.', 'no', '..', 'k|ešťe', 'řekneš', '(', '?', 'ecə', ')', 'a|nemňej|ti', '(', '1', ')', 'ruce', '(', 'f|ťech'] 2023-09-08 00:16:19 ERROR root 13A094N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf "_end": ts2, File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ @functools.cache ^^^^^^^^^ InvalidGraphemeCluster: ń is not allowed on the fon layer | ORT | FON | |-----------+-----------| | takže | tagže | | takhle | takle | | no | nó | | já | já | | v | f | | pondělí | pońďeli | | nastupuju | nastupuju | | ve | ve | | Vindě | viňďé | | víš | víš | | + | + | ort: ['takže', 'takhle', 'no', 'já', 'v', 'pondělí', 'nastupuju', 've', 'Vindě', 'víš', '+'] fon: ['tagže', 'takle', 'nó', 'já|f|pońďeli', 'nastupuju', 've|viňďé', 'víš', '+'] 2023-09-08 00:16:50 ERROR root 13D006N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'dva', ftok: '(' | ORT | FON | |----------+---------| | kdyby | dibi | | to | to | | nebyli | nebili | | dva | ( | | na | dva | | je* | na | | kdyby | e | | to | ) | | nebylo | dibi | | v | to | | podstatě | nebilo | | dva | ← | | na | poctaťe | | jednoho | dva | | → | na | | → | jednoho | ort: ['kdyby', 'to', 'nebyli', 'dva', 'na', 'je*', 'kdyby', 'to', 'nebylo', 'v', 'podstatě', 'dva', 'na', 'jednoho'] fon: ['dibi|to', 'nebili', '(', 'dva|na|e', ')', 'dibi|to', 'nebilo', '|poctaťe', 'dva|na|jednoho'] 2023-09-08 00:17:36 ERROR root 13O008N:Wrong use of # in 'přeto#'. 2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- pochůzky {pochúski} no nó tak tək .. .. budeš bueš schovaná schovaná . bueš budeš choďit chodit f v potchodech podchodech jenom jenom a a .. .. pod pod deštňíkem deštníkem None 2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- jo jo myslíš məsí_ si si že žə mě mňe baví baví chodit choďi pod pod deštníkem dešňíkem .. .. [ [ já á chci chci ] ] aby abi svítilo svíťio sluníčko sluňíčko . mňe mně se se zase zase takle takhle líbí líbí ten ten podʒim podzim diš když je je barevnej barevnej .. .. None 2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '.', ftok: 'barevní' | ORT | FON | |------------+--------------| | stromy | stromi | | . | barevní | | barevný | lístečki | | lístečky | fšude | | všude | .. | | .. | oə | | ale | takoví | | takový | ti | | ty | {plískaňice} | | plískanice | jako | | jako | bəla | | byla | neska | | dneska | ráno | | ráno | .. | | .. | no | | no | to | | to | e | | je | hroznə | | hrozný | .. | ort: ['stromy', '.', 'barevný', 'lístečky', 'všude', '..', 'ale', 'takový', 'ty', 'plískanice', 'jako', 'byla', 'dneska', 'ráno', '..', 'no', 'to', 'je', 'hrozný'] fon: ['stromi', 'barevní', 'lístečki', 'fšude', '..', 'oə', 'takoví|ti', '{plískaňice}', 'jako', 'bəla', 'neska', 'ráno', '..', 'no', 'to|e', 'hroznə', '..'] 2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1063, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '-', ftok: '..' | ORT | FON | |-----------+-----------| | musíš | əpsíš | | jezdit | jezďi | | pomalu | pomalu | | to | to | | víš | víž | | ty | ti | | jezdíš | ezďíž | | jako | ago | | závodnice | závoďňicé | | a | a | | - | .. | ort: ['musíš', 'jezdit', 'pomalu', 'to', 'víš', 'ty', 'jezdíš', 'jako', 'závodnice', 'a', '-'] fon: ['əpsíš', 'jezďi', 'pomalu', 'to|víž', 'ti|ezďíž', 'ago', 'závoďňicé', 'a', '..'] 2023-09-08 00:17:54 ERROR root 13P002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1006, in print otok = next(ort) ^^^^^^^^^ StopIteration During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1008, in print raise OrtTooShort(self) OrtTooShort: | ORT | FON | |---------+---------| | + | + | | ( | ( | | ale | ááə | | ) | ) | | [ | [ | | všude | šude | | chceš | chcež | | bejt | bej | | první | prvňí | | ] | ] | | .. | .. | | fakt | ə | | závodíš | ag | | prosím | závoďíž | | tě | prəsiň | | → | ťe | ort: ['+', '(', 'ale', ')', '[', 'všude', 'chceš', 'bejt', 'první', ']', '..', 'fakt', 'závodíš', 'prosím', 'tě'] fon: ['+', '(', 'ááə', ')', '[', 'šude', 'chcež|bej', 'prvňí', ']', '..', 'ə|ag', 'závoďíž', 'prəsiň|ťe'] 2023-09-08 00:18:37 ERROR root 13T017N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: ')', ftok: 'upəňe' | ORT | FON | |---------+---------| | [ | [ | | ( | ( | | to | to | | bylo | bolo | | ) | upəňe | | úplně | ) | | odporné | otporné | | ] | ] | ort: ['[', '(', 'to', 'bylo', ')', 'úplně', 'odporné', ']'] fon: ['[', '(', 'to|bolo', 'upəňe', ')', 'otporné', ']'] 2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'ty#'. 2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'kdy#'. 2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'myslela#'. 2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'co#'. 2023-09-08 00:19:07 ERROR root 13T024N:Wrong use of # in 'ty#'. 2023-09-08 00:19:21 ERROR root 13T026N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ( ( ses ses předtím přeťím ) ) s z mamkou mamkou bavil bavil něco ňecə nebo nebo tak tak . . ( jak jak s ) tam #s šel tam za šel ňí za None ní None ? None 2023-09-08 00:20:49 ERROR root 14C015N:Wrong use of # in 's#'. 2023-09-08 00:21:17 ERROR root 14O002N:Wrong use of # in '#to'. 2023-09-08 00:21:18 ERROR root 14O004N:Wrong use of # in '#to'. 2023-09-08 00:21:19 ERROR root 14O004N:Wrong use of # in '#to'. 2023-09-08 00:21:19 ERROR root 14O004N:Wrong use of # in '#to'. 2023-09-08 00:22:16 ERROR root 14T015N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'dost', ftok: '(' | ORT | FON | |------------+------------| | ( | ( | | střední | třeďňe | | ) | ) | | musíš | musíš | | . | . | | hele | hele | | .. | .. | | aby | abi | | to | to | | nevypadalo | nevipadalo | | dost | ( | | že | dozd | | seš | ) | | totální | že | | debil | seš | | .. | totálňí | | vystudovat | debil | | v | .. | | určitém | vistudovad | | věku | ← | | že | určitéɱ | | jo | vjeku | | .. | že | | → | jə | ort: ['(', 'střední', ')', 'musíš', '.', 'hele', '..', 'aby', 'to', 'nevypadalo', 'dost', 'že', 'seš', 'totální', 'debil', '..', 'vystudovat', 'v', 'určitém', 'věku', 'že', 'jo', '..'] fon: ['(', 'třeďňe', ')', 'musíš', '.', 'hele', '..', 'abi|to', 'nevipadalo', '(', 'dozd', ')', 'že|seš', 'totálňí', 'debil', '..', 'vistudovad', '|určitéɱ', 'vjeku', 'že|jə'] 2023-09-08 00:22:26 ERROR root 14T022N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<CP', ftok: '<SP' | ORT | FON | |-------------+-------------| | jmenuje | menuje | | se | se | | to | to | | .. | .. | | <CP | <SP | | Orange | oránč | | bonpar | bompar | | > | > | | nebo | nebo | | nějak | ňák | | tak | tag | | jako | jako | | [ | [ | | pomerančový | pomerančovi | | bonpar | bəmpar | | ] | ] | | .. | .. | ort: ['jmenuje', 'se', 'to', '..', '<CP', 'Orange', 'bonpar', '>', 'nebo', 'nějak', 'tak', 'jako', '[', 'pomerančový', 'bonpar', ']', '..'] fon: ['menuje|se|to', '..', '<SP', 'oránč', 'bompar', '>', 'nebo|ňák', 'tag', 'jako', '[', 'pomerančovi', 'bəmpar', ']', '..'] 2023-09-08 00:23:08 ERROR root 14X014N:Wrong use of # in 'to#'. 2023-09-08 00:23:10 ERROR root 14X015N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'ale', ftok: '(' | ORT | FON | |--------+--------| | tak | ta_ | | hrozná | grozná | | [ | [ | | není | neňi | | ale | ( | | ] | 1 | | [ | ) | | ( | ] | | 4 | [ | | ) | ( | | my | 4 | | jsme | ) | | to | mi | | tady | ze | | měli | to | | ] | tai | | [ | mňeli | | taky | ] | | už | [ | | ] | taki | | → | uš | ort: ['tak', 'hrozná', '[', 'není', 'ale', ']', '[', '(', '4', ')', 'my', 'jsme', 'to', 'tady', 'měli', ']', '[', 'taky', 'už', ']'] fon: ['ta_|grozná', '[', 'neňi', '(', '1', ')', ']', '[', '(', '4', ')', 'mi|ze|to', 'tai', 'mňeli', ']', '[', 'taki|uš'] 2023-09-08 00:23:12 ERROR root 14X015N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'učeňiství' | ORT | FON | |------------+-----------| | @ | @ | | co | co | | ? | učeňiství | | učetnictví | ? | | @ | @ | | nemají | nemaj | | ze | zə | | zákona | zákona | | . | . | ort: ['@', 'co', '?', 'učetnictví', '@', 'nemají', 'ze', 'zákona', '.'] fon: ['@', 'co|učeňiství', '?', '@', 'nemaj', 'zə|zákona', '.'] 2023-09-08 00:23:14 ERROR root 14X015N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'teda', ftok: '(' | ORT | FON | |------------+------------| | + | + | | [ | [ | | takovej | takovej | | hnus | hnus | | ] | ] | | .. | .. | | takovej | takovej | | [ | [ | | studenější | studeňejší | | ] | ] | | [ | [ | | fouká | fouka | | teda | ( | | ještě | 1 | | ] | ) | | [ | ešťə | | ( | ] | | 2 | [ | | ) | ( | | seš | 2 | | pěšky | ) | | ] | seš | | ? | ? | ort: ['+', '[', 'takovej', 'hnus', ']', '..', 'takovej', '[', 'studenější', ']', '[', 'fouká', 'teda', 'ještě', ']', '[', '(', '2', ')', 'seš', 'pěšky', ']', '?'] fon: ['+', '[', 'takovej', 'hnus', ']', '..', 'takovej', '[', 'studeňejší', ']', '[', 'fouka', '(', '1', ')', 'ešťə', ']', '[', '(', '2', ')', 'seš', '?'] 2023-09-08 00:23:40 ERROR root 15A004N:Wrong use of # in 'to#'. 2023-09-08 00:23:49 ERROR root 15A004N:Wrong use of # in 'to#'. 2023-09-08 00:24:34 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'hej', ftok: '(' | ORT | FON | |-----------+-----------| | plyšáka | plišáka | | . | . | | hej | ( | | já | 1 | | žádného | ) | | nemám | jə | | .. | žádnéə | | no | nemám | | dobře | .. | | mám | no | | .. | dəbře | | dostal | mam | | jsem | .. | | nikdy | dostal | | jsem | sem | | si | ňigdi | | žádného | sem | | nekoupil | si | | . | žádnéo | | nenávidím | nekoupil | | plyšáky | . | | .. | nenáviďim | | čistý | plišáki | | [ | .. | | hate | čistí | | ] | [ | ort: ['plyšáka', '.', 'hej', 'já', 'žádného', 'nemám', '..', 'no', 'dobře', 'mám', '..', 'dostal', 'jsem', 'nikdy', 'jsem', 'si', 'žádného', 'nekoupil', '.', 'nenávidím', 'plyšáky', '..', 'čistý', '[', 'hate', ']'] fon: ['plišáka', '.', '(', '1', ')', 'jə', 'žádnéə', 'nemám', '..', 'no|dəbře', 'mam', '..', 'dostal|sem', 'ňigdi|sem|si', 'žádnéo', 'nekoupil', '.', 'nenáviďim', 'plišáki', '..', 'čistí', '['] 2023-09-08 00:24:34 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ć is not allowed on the ort layer | ORT | FON | |-----------+-----------| | i | i | | jako | jako | | na | na | | Z* | z | | na | na | | to | tó | | na | na | | Zrće | zəče | | ? | .. | | .. | nakupəval | | nakupoval | ← | ort: ['i', 'jako', 'na', 'Z*', 'na', 'to', 'na', 'Zrće', '?', '..', 'nakupoval'] fon: ['i|jako', 'na|z', 'na|tó', 'na', 'zəče', '..', 'nakupəval'] 2023-09-08 00:24:34 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ć is not allowed on the ort layer | ORT | FON | |----------+----------| | hej | héj | | .. | .. | | ale | a | | jako | jakə | | .. | .. | | ale | ale | | u | u | | toho | toho | | Zrće | zrče | | jsme | sme | | nečetli | nečetli | | jako | jako | | že | že | | by | bi | | tam | ta_ | | měly | mňeli | | být | bí | | nějaké | ňáké | | hřiště | hřišťe | | nebo | nebə | | něco | ňeco | | takového | takového | ort: ['hej', '..', 'ale', 'jako', '..', 'ale', 'u', 'toho', 'Zrće', 'jsme', 'nečetli', 'jako', 'že', 'by', 'tam', 'měly', 'být', 'nějaké', 'hřiště', 'nebo', 'něco', 'takového'] fon: ['héj', '..', 'a|jakə', '..', 'ale', 'u|toho', 'zrče', 'sme|nečetli', 'jako', 'že|bi|ta_', 'mňeli|bí', 'ňáké', 'hřišťe', 'nebə', 'ňeco', 'takového'] 2023-09-08 00:24:35 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ć is not allowed on the ort layer | ORT | FON | |------------+------------| | hej | hej | | a | a | | to | to | | .. | .. | | to | to | | Zrće | zrči | | .. | .. | | to | to | | je | jé | | .. | .. | | i | i | | normálně | normáňe | | přístupné | přístupné | | .. | .. | | jako | jakə | | [ | [ | | veřejnosti | veřejnosťi | | ] | ] | | nebo | nebo | | jenom | enom | | podle | podle | | těchto | ťechto | | zájezdů | zájezdú | | ? | ← | ort: ['hej', 'a', 'to', '..', 'to', 'Zrće', '..', 'to', 'je', '..', 'i', 'normálně', 'přístupné', '..', 'jako', '[', 'veřejnosti', ']', 'nebo', 'jenom', 'podle', 'těchto', 'zájezdů', '?'] fon: ['hej|a|to', '..', 'to|zrči', '..', 'to|jé', '..', 'i|normáňe', 'přístupné', '..', 'jakə', '[', 'veřejnosťi', ']', 'nebo', 'enom', 'podle', 'ťechto', 'zájezdú'] 2023-09-08 00:24:35 ERROR root 15E006N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ć is not allowed on the ort layer | ORT | FON | |------+------| | a | a | | pláž | pláž | | je | je | | .. | .. | | Zrće | zrče | ort: ['a', 'pláž', 'je', '..', 'Zrće'] fon: ['a|pláž|je', '..', 'zrče'] 2023-09-08 00:27:10 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ne ne a a úplně úpəe říkám řikam buď bu_ ticho ťichó a a ( jó já upəe ) .. úplně né .. a ne pak a ( pak 1 ( ) 1 <SP ) hej <SP kačo hej póď Kačo dem pojď kecat jdem > kecat .. > None .. None 2023-09-08 00:27:11 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<CP', ftok: '<SP' | ORT | FON | |---------+---------| | [ | [ | | a | a | | jak | jak | | se | se | | to | tə | | jmenuje | jmenuje | | ] | ] | | ? | ? | | <CP | <SP | | geok* | ǯeok | | > | > | ort: ['[', 'a', 'jak', 'se', 'to', 'jmenuje', ']', '?', '<CP', 'geok*', '>'] fon: ['[', 'a|jak|se|tə', 'jmenuje', ']', '?', '<SP', 'ǯeok', '>'] 2023-09-08 00:27:12 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'to', ftok: '(' | ORT | FON | |---------+---------| | @ | @ | | v | v | | @ | @ | | to | ( | | ( | to | | máš | máš | | ) | ) | | ( | ( | | 1 | 1 | | ) | ) | | pak | pag | | mořskou | mořskou | | nemoc | némoc | | bo | bo | | úplně | upəe | | slyšíš | slišíš | | ( | ( | | 1 | 1 | | ) | ) | | f* | f | | úplně | upəe | | & | & | | [ | [ | | furt | fur | | a | a | | úplně | upəé | | ] | ] | | hej | ej | | to | to | | úplně | upə | | nejde | nejde | | hej | hej | ort: ['@', 'v', '@', 'to', '(', 'máš', ')', '(', '1', ')', 'pak', 'mořskou', 'nemoc', 'bo', 'úplně', 'slyšíš', '(', '1', ')', 'f*', 'úplně', '&', '[', 'furt', 'a', 'úplně', ']', 'hej', 'to', 'úplně', 'nejde', 'hej'] fon: ['@', 'v', '@', '(', 'to|máš', ')', '(', '1', ')', 'pag|mořskou', 'némoc', 'bo|upəe', 'slišíš', '(', '1', ')', 'f', 'upəe', '&', '[', 'fur', 'a|upəé', ']', 'ej', 'to|upə', 'nejde', 'hej'] 2023-09-08 00:27:13 ERROR root 15X014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- a a na na jak* jak a á na na těch ťeh jiných jiní_ horách horách jsi si byla bila taky taki s s ní ňi ? ? [ [ nebo nebo s s .. .. ( jiníma jinýma ] ) None ] None 2023-09-08 00:27:34 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'bych', ftok: '(' | ORT | FON | |----------+----------| | já | já | | teda | təra | | ne | ne | | .. | .. | | to | to | | bych | bich | | radši | rači | | fakt | fak | | si | si | | to | to | | d* | d | | nějak | ňák | | . | . | | namyslel | namislel | | abych | abich | | mohl | moch | | makat | makat | | jak | jag | | bych | ( | | třeba | 1 | | vosm | ) | | .. | třea | ort: ['já', 'teda', 'ne', '..', 'to', 'bych', 'radši', 'fakt', 'si', 'to', 'd*', 'nějak', '.', 'namyslel', 'abych', 'mohl', 'makat', 'jak', 'bych', 'třeba', 'vosm', '..'] fon: ['já|təra', 'ne', '..', 'to|bich', 'rači', 'fak|si|to', 'd|ňák', '.', 'namislel', 'abich|moch', 'makat', 'jag', '(', '1', ')', 'třea'] 2023-09-08 00:27:34 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |-----------+-----------| | jo | jo | | prəstě | prəse | | . | . | | že | že | | jo | jo | | klasický | klasickí | | jsou | sou | | frézovaný | frézovaní | | . | . | | [ | [ | | že | že | | to | to | | ] | ] | | frézuje | frézujé | | céencéčko | cenzéčko | | .. | .. | ort: ['jo', 'prəstě', '.', 'že', 'jo', 'klasický', 'jsou', 'frézovaný', '.', '[', 'že', 'to', ']', 'frézuje', 'céencéčko', '..'] fon: ['jo|prəse', '.', 'že|jo', 'klasickí|sou', 'frézovaní', '.', '[', 'že|to', ']', 'frézujé', 'cenzéčko', '..'] 2023-09-08 00:27:34 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'když', ftok: '(' | ORT | FON | |---------+---------| | a | a | | teď | teť | | když | ( | | když | 1 | | půjdeš | ) | | do | diš | | kravína | pudež | | .. | do | | tak | kravína | | tam | .. | | ti | tak | | to | tam | | bude | ťi | | utíkat | to | | .. | bude | ort: ['a', 'teď', 'když', 'když', 'půjdeš', 'do', 'kravína', '..', 'tak', 'tam', 'ti', 'to', 'bude', 'utíkat', '..'] fon: ['a|teť', '(', '1', ')', 'diš|pudež', 'do|kravína', '..', 'tak', 'tam|ťi|to', 'bude'] 2023-09-08 00:27:35 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'protože', ftok: '(' | ORT | FON | |---------------+--------------| | dělali | ďeali | | jsme | sme | | kalibry | kalibri | | .. | .. | | protože | ( | | . | bže | | už | ) | | je | . | | začíná | už | | vyrábět | je | | Čína | začíná | | .. | virábje_ | | úplně | čína | | neskutečnejch | .. | | věcí | úplňe | | .. | neskutečnejh | ort: ['dělali', 'jsme', 'kalibry', '..', 'protože', '.', 'už', 'je', 'začíná', 'vyrábět', 'Čína', '..', 'úplně', 'neskutečnejch', 'věcí', '..'] fon: ['ďeali|sme', 'kalibri', '..', '(', 'bže', ')', '.', 'už|je', 'začíná', 'virábje_', 'čína', '..', 'úplňe', 'neskutečnejh'] 2023-09-08 00:27:35 ERROR root 15X025N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'to', ftok: '(' | ORT | FON | |------------+------------| | borec | borez | | říkal | řikal | | že | že | | to | tə | | že | že | | to | ( | | bylo | 1 | | neskutečný | ) | | a | bilə | | tu | neskuteční | | vodu | a | | prej | tu | | měnili | vodu | | jednou | prej | | za | mňeňili | | den | jednou | | že | za | | tam | den | | někdo | že | | přišel | tam | | .. | ňegdo | ort: ['borec', 'říkal', 'že', 'to', 'že', 'to', 'bylo', 'neskutečný', 'a', 'tu', 'vodu', 'prej', 'měnili', 'jednou', 'za', 'den', 'že', 'tam', 'někdo', 'přišel', '..'] fon: ['borez', 'řikal', 'že|tə', 'že', '(', '1', ')', 'bilə', 'neskuteční', 'a', 'tu|vodu', 'prej|mňeňili', 'jednou', 'za|den', 'že|tam', 'ňegdo'] 2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- intuitivní intuitivňí která která prostě prəsťe funguje fuŋguje vždycky vždicki a á nemůžeš nemužeš ji jí jako jako [ [ ( vipnout 1 pətəžə ) ] protože . ] None . None 2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |-----+-----| | [ | [ | | ( | ( | | anə | anə | | ) | ) | | ] | ] | ort: ['[', '(', 'anə', ')', ']'] fon: ['[', '(', 'anə', ')', ']'] 2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |-----+-----| | [ | [ | | ( | ( | | anə | anə | | ) | ) | | ] | ] | ort: ['[', '(', 'anə', ')', ']'] fon: ['[', '(', 'anə', ')', ']'] 2023-09-08 00:28:01 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: = is not allowed on the ort layer | ORT | FON | |----------+---------| | neo* | neo | | . | . | | <PR | <PR | | neo=lid | neo=lid | | *loberti | liberti | | > | > | | @ | @ | | jak | jak | | jim | jim | | říkaj | řikaj | | ? | . | | . | ← | ort: ['neo*', '.', '<PR', 'neo=lid', '*loberti', '>', '@', 'jak', 'jim', 'říkaj', '?', '.'] fon: ['neo', '.', '<PR', 'neo=lid', 'liberti', '>', '@', 'jak|jim', 'řikaj', '.'] 2023-09-08 00:28:02 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- no nó . . a a to to je je podle podle mě mňe právě právje ten ten výkyv víkif . . výkyv víkif . . jakoby jakobi von von to to ( samořeme psaní hoďňe ) zobecňí hodně alə zobecní třeba ale .. třeba None .. None 2023-09-08 00:28:02 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'vlastně', ftok: '(' | ORT | FON | |------------+-------------| | to | to | | co | co | | nám | nám | | oni | oňi | | říkaj | řikaj | | to | to | | jak | jak | | s* | s | | . | . | | jak | jak | | se | se | | to | to | | bude | bude | | chovat | chovat | | vlastně | ( | | dlouhodobě | 1 | | ( | ) | | 1 | dlouhodobje | | ) | ( | | se | 1 | | chovat | ) | | nebude | se | | ( | chovat | | 5 | nebude | | ) | ( | | .. | 5 | ort: ['to', 'co', 'nám', 'oni', 'říkaj', 'to', 'jak', 's*', '.', 'jak', 'se', 'to', 'bude', 'chovat', 'vlastně', 'dlouhodobě', '(', '1', ')', 'se', 'chovat', 'nebude', '(', '5', ')', '..'] fon: ['to|co|nám', 'oňi', 'řikaj', 'to|jak|s', '.', 'jak|se|to', 'bude', 'chovat', '(', '1', ')', 'dlouhodobje', '(', '1', ')', 'se|chovat', 'nebude', '(', '5'] 2023-09-08 00:28:02 ERROR root 15X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: à is not allowed on the ort layer | ORT | FON | |----------+---------| | možná | možná | | tenkou | teŋkou | | knížku | kňíšku | | à | a | | la | lá | | ten | ten | | Malcolm | malkəlm | | Gladwell | gledvel | | .. | .. | ort: ['možná', 'tenkou', 'knížku', 'à', 'la', 'ten', 'Malcolm', 'Gladwell', '..'] fon: ['možná', 'teŋkou', 'kňíšku', 'a|lá', 'ten|malkəlm', 'gledvel', '..'] 2023-09-08 00:28:04 ERROR root 15X037N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'protože', ftok: '(' | ORT | FON | |-----------+-----------| | já | a | | jim | jim | | nezávidím | nezáviďim | | teda | teda | | vůbec | vúbes | | nic | ňiz | | jako | jako | | jo | jó | | .. | .. | | jako | jako | | vůbec | vúbes | | nic | ňiz | | jim | jim | | nezávidím | nezáviďiɱ | | vůbec | vúbec | | nic | ňic | | prostě | prosťə | | t* | t | | jakože | akəžé | | . | . | | protože | ( | | z | prəče | | toho | ) | | co | s | | maj | too | | nemaj | co | | jo | maj | | .. | nema_ | ort: ['já', 'jim', 'nezávidím', 'teda', 'vůbec', 'nic', 'jako', 'jo', '..', 'jako', 'vůbec', 'nic', 'jim', 'nezávidím', 'vůbec', 'nic', 'prostě', 't*', 'jakože', '.', 'protože', 'z', 'toho', 'co', 'maj', 'nemaj', 'jo', '..'] fon: ['a|jim', 'nezáviďim', 'teda', 'vúbes', 'ňiz', 'jako|jó', '..', 'jako', 'vúbes|ňiz', 'jim|nezáviďiɱ', 'vúbec|ňic', 'prosťə', 't|akəžé', '.', '(', 'prəče', ')', 's|too', 'co|maj', 'nema_'] 2023-09-08 00:28:05 ERROR root 15X037N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- pro tak tebe f . tom pro přípaďe klienta to .. e tak prohra v pro tom ňe případě jo to . je None prohra None pro None ně None jo None . None 2023-09-08 00:28:05 ERROR root 15X037N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- šel šel ( zem jsem . ) pišel . s přišel im s za tým mnou za .. mnou None .. None 2023-09-08 00:28:11 ERROR root 15X040N:Wrong use of # in 'to#'. 2023-09-08 00:28:46 ERROR root 16A006N:Wrong use of # in '#si'. 2023-09-08 00:28:49 ERROR root 16A008N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'v', ftok: '(' | ORT | FON | |------+------| | [ | [ | | v | ( | | sedm | ← | | ] | sedu | ort: ['[', 'v', 'sedm', ']'] fon: ['[', '(', '|sedu'] 2023-09-08 00:28:50 ERROR root 16A008N:Wrong use of # in 'to#'. 2023-09-08 00:28:51 ERROR root 16A008N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |------------------+-------------------| | @ | @ | | by | bi | | sis | sis | | nə | nə | | jako | jako | | čtyřhvězdičkovej | štiřhvjezďičkovej | | hotel | hotel | | v | və | | Bulharsku | bulharsku | | [ | [ | | by | bi | | sis | sis | | neřekla | neřekla | | ] | ] | | + | + | ort: ['@', 'by', 'sis', 'nə', 'jako', 'čtyřhvězdičkovej', 'hotel', 'v', 'Bulharsku', '[', 'by', 'sis', 'neřekla', ']', '+'] fon: ['@', 'bi|sis', 'nə', 'jako', 'štiřhvjezďičkovej', 'hotel', 'və', 'bulharsku', '[', 'bi|sis', 'neřekla', ']', '+'] 2023-09-08 00:30:56 ERROR root 16X040N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'teda', ftok: '(' | ORT | FON | |-------+-------| | nebo | nebo | | aspoň | aspoň | | ne | né | | moc | moc | | asi | asi | | <SP | <SP | | teda | ( | | > | 1 | | .. | ) | ort: ['nebo', 'aspoň', 'ne', 'moc', 'asi', '<SP', 'teda', '>', '..'] fon: ['nebo', 'aspoň', 'né|moc', 'asi', '<SP', '(', '1', ')'] 2023-09-08 00:31:06 ERROR root 16X042N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |-------+-------| | [ | [ | | ( | ( | | to | ← | | je | je | | taky | aki | | məžný | možní | | ) | ) | | .. | .. | | jo | jə | | jo | jə | | jo | jo | | ] | ] | ort: ['[', '(', 'to', 'je', 'taky', 'məžný', ')', '..', 'jo', 'jo', 'jo', ']'] fon: ['[', '(', '|je', 'aki', 'možní', ')', '..', 'jə|jə|jo', ']'] 2023-09-08 00:31:25 ERROR root 16X046N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- on on si ci on on si si sklo sklo ( zaďňí zadní vibil vybil ne ) .. ne jə .. máš jak to máš . to to . və to viklápjecí v* nebo vyklápěcí co nebo None co None 2023-09-08 00:31:36 ERROR root 16X056N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'pěkně', ftok: '(' | ORT | FON | |--------+--------| | no | nə | | jo | jó | | vždyť | diť | | pršelo | pršelo | | [ | [ | | vždyť | diť | | pršelo | pršelo | | pěkně | ( | | . | 1 | | no | ) | | ] | . | | . | nó | | no | ] | | . | . | ort: ['no', 'jo', 'vždyť', 'pršelo', '[', 'vždyť', 'pršelo', 'pěkně', '.', 'no', ']', '.', 'no', '.'] fon: ['nə|jó|diť', 'pršelo', '[', 'diť|pršelo', '(', '1', ')', '.', 'nó', ']', '.'] 2023-09-08 00:32:31 ERROR root 17X005N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ( ( 1 1 ) ) ( nebili nebyli líní ) .. líný páce .. je práce furt je no furt . no a . mraki a .. mraky None .. None 2023-09-08 00:32:32 ERROR root 17X005N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'věci', ftok: '(' | ORT | FON | |----------+----------| | věci | ( | | .. | vjeci | | však | ) | | mám | .. | | ty | fšak | | zimní | mam | | přípravy | ti | | a | zimňí | | tak | přípravi | | jak | a | | to | tag | | .. | jak | | → | tə | ort: ['věci', '..', 'však', 'mám', 'ty', 'zimní', 'přípravy', 'a', 'tak', 'jak', 'to', '..'] fon: ['(', 'vjeci', ')', '..', 'fšak|mam|ti', 'zimňí', 'přípravi', 'a|tag|jak|tə'] 2023-09-08 00:32:41 ERROR root 17X011N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'někoho', ftok: '(' | ORT | FON | |--------+--------| | [ | [ | | jak | jak | | ty | ti | | nejsou | nejsou | | ] | ] | | no | nó | | [ | [ | | tak | tak | | to | to | | je | je | | někoho | ( | | jiného | ňekoo | | ] | jinéo | ort: ['[', 'jak', 'ty', 'nejsou', ']', 'no', '[', 'tak', 'to', 'je', 'někoho', 'jiného', ']'] fon: ['[', 'jak|ti|nejsou', ']', 'nó', '[', 'tak|to|je', '(', 'ňekoo', 'jinéo'] 2023-09-08 00:32:43 ERROR root 17X011N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ' is not allowed on the ort layer | ORT | FON | |------+-------| | <CP | DUMMY | | it's | DUMMY | | ok | DUMMY | | > | DUMMY | ort: ['<CP', "it's", 'ok', '>'] fon: None 2023-09-08 00:32:48 ERROR root 17X011N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'jako', ftok: '(' | ORT | FON | |------+------| | [ | [ | | jako | ( | | jo | jako | | no | ó | | ] | nə | ort: ['[', 'jako', 'jo', 'no', ']'] fon: ['[', '(', 'jako', 'ó', 'nə'] 2023-09-08 00:32:55 ERROR root 17X014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ježiš ježiš teď téť jsem em ti ťi málem málem hodila hoďila tu tu klobásu klobásu do do toho toho ( já já se_ ) mislea jsem že myslela mám že ten mám talíř ten .. talíř vedle .. təhə vedle None toho None 2023-09-08 00:34:25 ERROR root 18A023N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<CP', ftok: '<SP' | ORT | FON | |----------+----------| | tak | tag | | mně | mňe | | to | to | | úplně | úpəe | | [ | [ | | potěšilo | poťešilo | | že | žé | | jako | jako | | ] | ] | | je | je | | takovej | takovej | | nějakej | ňákej | | <CP | <SP | | soulmate | soulmejt | | > | > | | u | u | | nás | nás | | taky | taki | ort: ['tak', 'mně', 'to', 'úplně', '[', 'potěšilo', 'že', 'jako', ']', 'je', 'takovej', 'nějakej', '<CP', 'soulmate', '>', 'u', 'nás', 'taky'] fon: ['tag|mňe|to', 'úpəe', '[', 'poťešilo', 'žé|jako', ']', 'je|takovej', 'ňákej', '<SP', 'soulmejt', '>', 'u|nás', 'taki'] 2023-09-08 00:34:25 ERROR root 18A023N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: ')', ftok: 'se' | ORT | FON | |------------+------------| | ( | ( | | takže | aže | | ) | se | | se | ) | | trochu | trochu | | podle | podle | | mě | mňe | | přikalili | přikalili | | protože | prətəže | | mi | mi | | psal | psal | | asi | asi | | tak | tak | | ve | ve | | dvě | dvje | | ráno | ráno | | tak | tak | | si | si | | myslím | misim | | že | že | | to | to | | bylo | bio | | nějaký | akí | | vydatnější | vidaťňejší | | .. | .. | ort: ['(', 'takže', ')', 'se', 'trochu', 'podle', 'mě', 'přikalili', 'protože', 'mi', 'psal', 'asi', 'tak', 've', 'dvě', 'ráno', 'tak', 'si', 'myslím', 'že', 'to', 'bylo', 'nějaký', 'vydatnější', '..'] fon: ['(', 'aže|se', ')', 'trochu', 'podle|mňe', 'přikalili', 'prətəže|mi|psal', 'asi|tak', 've|dvje', 'ráno', 'tak|si', 'misim', 'že|to', 'bio', 'akí', 'vidaťňejší', '..'] 2023-09-08 00:34:29 ERROR root 18A023N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'taky', ftok: ')' | ORT | FON | |---------+---------| | no | nó | | tak | tak | | to | to | | můžete | mužete | | bydlet | bidlet | | spolu | spolu | | ale | ale | | to | to | | mu | mu | | taky | taki | | <SM | <SM | | nemůžeš | nemúžeš | | udělat | uďelat | | > | > | | [ | [ | | ( | ( | | 1 | 1 | | ) | ) | | .. | .. | | ( | ( | | to | tə | | je | ə | | taky | ) | | sranda | ( | | ) | taki | | ] | srana | | .. | ) | ort: ['no', 'tak', 'to', 'můžete', 'bydlet', 'spolu', 'ale', 'to', 'mu', 'taky', '<SM', 'nemůžeš', 'udělat', '>', '[', '(', '1', ')', '..', '(', 'to', 'je', 'taky', 'sranda', ')', ']', '..'] fon: ['nó', 'tak|to', 'mužete', 'bidlet', 'spolu', 'ale', 'to|mu', 'taki', '<SM', 'nemúžeš', 'uďelat', '>', '[', '(', '1', ')', '..', '(', 'tə|ə', ')', '(', 'taki', 'srana', ')'] 2023-09-08 00:34:39 ERROR root 18A032N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |------------+------------| | je | je | | to | to | | úplně | uple | | cool | kúl | | je | je | | to | to | | hr* | hr | | . | . | | o | o | | tom | tom | | jsem | sem | | psala | psala | | də | də | | . | . | | úkol | úkol | | na | na | | sociologii | sociologii | ort: ['je', 'to', 'úplně', 'cool', 'je', 'to', 'hr*', '.', 'o', 'tom', 'jsem', 'psala', 'də', '.', 'úkol', 'na', 'sociologii'] fon: ['je|to', 'uple', 'kúl', 'je|to', 'hr', '.', 'o|tom|sem', 'psala', 'də', '.', 'úkol', 'na|sociologii'] 2023-09-08 00:34:43 ERROR root 18A032N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'Luci', ftok: '(' | ORT | FON | |-------+------| | & | & | | Luci | ( | | .. | luci | | ó | ) | | můj | .. | | bože | ó | | . | múj | | kde | božé | | #s | . | | to | gde | | to | s | | je | to | | z | to | | Tiger | e | | ? | ? | ort: ['&', 'Luci', '..', 'ó', 'můj', 'bože', '.', 'kde', '#s', 'to', 'to', 'je', 'z', 'Tiger', '?'] fon: ['&', '(', 'luci', ')', '..', 'ó', 'múj', 'božé', '.', 'gde|s|to', 'to|e', '?'] 2023-09-08 00:34:54 ERROR root 18E004N:Wrong use of # in '#kám'. 2023-09-08 00:35:06 ERROR root 18E009N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'prostě', ftok: '(' | ORT | FON | |-----------+-----------| | prostě | ( | | jako | sťé | | to | jako | | auto | ) | | se | to | | mi | auto | | absolutně | se | | od | mi | | toho | apsoluťňe | | kolegy | o_ | | nelíbilo | toho | | .. | kolegi | ort: ['prostě', 'jako', 'to', 'auto', 'se', 'mi', 'absolutně', 'od', 'toho', 'kolegy', 'nelíbilo', '..'] fon: ['(', 'sťé|jako', ')', 'to|auto', 'se|mi', 'apsoluťňe', 'o_|toho', 'kolegi'] 2023-09-08 00:35:07 ERROR root 18E009N:Wrong use of # in 'kde#'. 2023-09-08 00:35:07 ERROR root 18E009N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- a a @ @ já ja říkám řikam . . co co blbneš blbnež ( esi jestli se ) pořežež se víž pořežeš nebə víš že nebo ťi že to ti škubne to .. škubne None .. None 2023-09-08 00:35:07 ERROR root 18E009N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- jako jako ty ti ( akučki akučky to ) je to neska je úpəe dneska jinde úplně None jinde None 2023-09-08 00:35:12 ERROR root 18T002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ' is not allowed on the ort layer | ORT | FON | |---------+--------| | @ | @ | | Gamer's | gejmrs | | Pub | pap | | se | se | | stěhuje | sťehue | ort: ['@', "Gamer's", 'Pub', 'se', 'stěhuje'] fon: ['@', 'gejmrs|pap', 'se|sťehue'] 2023-09-08 00:35:16 ERROR root 18T002N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- práci neo nebo pra pra* nə no nó no ne ne praksi praxi asi asi ne ne spíš spíš práci práci .. .. None 2023-09-08 00:35:19 ERROR root 18T003N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'hlavou', ftok: '(' | ORT | FON | |------------+------------| | [ | [ | | tak | tag | | vnímala | vňímaa | | že | že | | odpovídala | otpovídala | | ] | ] | | hlavou | ( | | [ | 1 | | kývala | ) | | ] | [ | ort: ['[', 'tak', 'vnímala', 'že', 'odpovídala', ']', 'hlavou', '[', 'kývala', ']'] fon: ['[', 'tag|vňímaa', 'že|otpovídala', ']', '(', '1', ')', '['] 2023-09-08 00:35:41 ERROR root 18T009N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ( husťe hustě .. ) to .. práve to .. právě tai .. tadləncta tady ázijé tahleta a Asie indijé a tak Indie vona tak je vona plná je tai plná təkəedlech tady tech takovejhlech trakú tech .. trucků None .. None 2023-09-08 00:35:41 ERROR root 18T009N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ( hmm hmm None ) None 2023-09-08 00:35:41 ERROR root 18T009N:Unexpected para code in <prosím / ['<prosím', '.', 'vy', 'si', 'dáte', 'něco', '>', '?']. 2023-09-08 00:35:49 ERROR root 18T011N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ĺ is not allowed on the ort layer | ORT | FON | |-------------+-------------| | byl | bil | | na | na | | chodbě | chodbje | | a | a | | vo* | vol | | . | . | | a | a | | volal | vəlal | | .. | .. | | a | a | | telefonovaĺ | telefonovaĺ | | prý | prí | | plynně | pliňe | | německy | ňemecki | | a | a | | že | že | | si | si | | říkala | řikaa | | . | . | ort: ['byl', 'na', 'chodbě', 'a', 'vo*', '.', 'a', 'volal', '..', 'a', 'telefonovaĺ', 'prý', 'plynně', 'německy', 'a', 'že', 'si', 'říkala', '.'] fon: ['bil|na|chodbje', 'a|vol', '.', 'a|vəlal', '..', 'a|telefonovaĺ', 'prí', 'pliňe', 'ňemecki', 'a|že|si', 'řikaa', '.'] 2023-09-08 00:35:49 ERROR root 18T012N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |----+----| | [ | [ | | nə | nə | | ] | ] | | - | - | ort: ['[', 'nə', ']', '-'] fon: ['[', 'nə', ']', '-'] 2023-09-08 00:35:53 ERROR root 18T012N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'proč', ftok: '(' | ORT | FON | |--------+-------| | [ | [ | | proč | ( | | jí | 1 | | dává | ) | | ten | jí | | řetěz | dává | | ] | ten | | ? | řeťez | | on | ? | | je | ] | | prostě | on | | → | je | ort: ['[', 'proč', 'jí', 'dává', 'ten', 'řetěz', ']', '?', 'on', 'je', 'prostě'] fon: ['[', '(', '1', ')', 'jí|dává', 'ten|řeťez', '?', ']', 'on|je'] 2023-09-08 00:35:53 ERROR root 18T012N:Misplaced _ in 'tagže|se|ta__'. 2023-09-08 00:35:57 ERROR root 18T014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'nadávaji' | ORT | FON | |----------+----------| | [ | [ | | proč | proč | | ? | nadávaji | | nadávají | ? | | ] | ] | | nebo | nebo | | jako | jakə | | - | - | ort: ['[', 'proč', '?', 'nadávají', ']', 'nebo', 'jako', '-'] fon: ['[', 'proč|nadávaji', '?', ']', 'nebo', 'jakə', '-'] 2023-09-08 00:35:58 ERROR root 18T014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'nebo', ftok: '(' | ORT | FON | |----------+--------| | ne | nə | | jako | jako | | že | že | | to | to | | nebude | nebude | | dělat | ďeat | | pět | pjet | | nebo | ( | | [ | 1 | | taky | ) | | těch | [ | | vosm | daki | | ] | tech | | let | vosum | | co | ] | | dělala | le_ | | toho | co | | bakaláře | ďelalə | | .. | təo | ort: ['ne', 'jako', 'že', 'to', 'nebude', 'dělat', 'pět', 'nebo', '[', 'taky', 'těch', 'vosm', ']', 'let', 'co', 'dělala', 'toho', 'bakaláře', '..'] fon: ['nə|jako', 'že|to', 'nebude', 'ďeat', 'pjet', '(', '1', ')', '[', 'daki', 'tech|vosum', ']', 'le_', 'co|ďelalə', 'təo'] 2023-09-08 00:36:01 ERROR root 18T015N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<PR', ftok: '' | ORT | FON | |----------------+--------------| | tak | tak | | . | . | | jako | ja_ | | kdyby | kdibi | | . | . | | já | ja | | . | . | | za | za | | <PR | ← | | teambuilgingem | <PR | | > | tímbilgiŋgem | | ve* | > | | vidím | ve | | [ | viďím | | prostě | [ | | ] | prəsťé | | - | ] | ort: ['tak', '.', 'jako', 'kdyby', '.', 'já', '.', 'za', '<PR', 'teambuilgingem', '>', 've*', 'vidím', '[', 'prostě', ']', '-'] fon: ['tak', '.', 'ja_|kdibi', '.', 'ja', '.', 'za|', '<PR', 'tímbilgiŋgem', '>', 've|viďím', '[', 'prəsťé', ']'] 2023-09-08 00:36:02 ERROR root 18T015N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<PR', ftok: '' | ORT | FON | |------------+------------| | a | a | | podruhý | podruhí | | ho | ho | | taťka | taťka | | přinesl | přines | | z | s | | <PR | ← | | popradnice | <PR | | > | popraďňicə | | .. | > | ort: ['a', 'podruhý', 'ho', 'taťka', 'přinesl', 'z', '<PR', 'popradnice', '>', '..'] fon: ['a|podruhí|ho', 'taťka', 'přines', 's|', '<PR', 'popraďňicə', '>'] 2023-09-08 00:36:23 ERROR root 18X034N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1070, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '?', ftok: 'nebo' | ORT | FON | |--------+--------| | a | a | | first | frs | | minute | minit | | jsou | sou | | do | o | | konce | konce | | března | března | | ne | né | | ? | nebo | | nebo | ? | | - | - | ort: ['a', 'first', 'minute', 'jsou', 'do', 'konce', 'března', 'ne', '?', 'nebo', '-'] fon: ['a|frs|minit', 'sou|o|konce', 'března', 'né|nebo', '?', '-'] 2023-09-08 00:37:00 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- [ [ on o_ nechce nechcé a a ( říka říká . ) prəpiska . ale propiska já ale bi_ já chťel bych ] chtěl takové ] običejné takové to obyčejné None to None 2023-09-08 00:37:02 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '[', ftok: '' | ORT | FON | |----------+----------| | [ | [ | | mašle | mašle | | ] | ] | | [ | [ | | krabice | krabice | | ] | ] | | [ | [ | | všecko | fšeckə | | ] | ] | | .. | .. | | [ | [ | | a | a | | víc | víc | | . | . | | víc | víc | | nemáte | nemáte | | ] | ] | | ? | ? | | ona | ona | | .. | .. | | příští | přišťí | | týden | tiden | | se | se | | [ | ← | | zeptejte | [ | | ] | zeptejte | ort: ['[', 'mašle', ']', '[', 'krabice', ']', '[', 'všecko', ']', '..', '[', 'a', 'víc', '.', 'víc', 'nemáte', ']', '?', 'ona', '..', 'příští', 'týden', 'se', '[', 'zeptejte', ']'] fon: ['[', 'mašle', ']', '[', 'krabice', ']', '[', 'fšeckə', ']', '..', '[', 'a|víc', '.', 'víc|nemáte', ']', '?', 'ona', '..', 'přišťí', 'tiden', 'se|', '[', 'zeptejte'] 2023-09-08 00:37:03 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- [ [ ( jako 1 opchodú ) ] obchodů [ ] ale [ ( a 1 ( ) 1 ] ) None ] None 2023-09-08 00:37:08 ERROR root 18X098N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- [ [ to to dělá ďela ( náš 1 ] ) .. ] [ .. mi [ to my mame to ] máme [ ] z [ roďini z ] rodiny [ ] ( [ brusa ( ) brusa ] ) None ] None 2023-09-08 00:37:18 ERROR root 18X100N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ń is not allowed on the fon layer | ORT | FON | |-------------+-------------| | [ | [ | | já | ja | | jsem | sem | | o | o | | ní | ńí | | ] | ] | | taky | taki | | přemejšlela | přemejšlela | | .. | .. | ort: ['[', 'já', 'jsem', 'o', 'ní', ']', 'taky', 'přemejšlela', '..'] fon: ['[', 'ja|sem|o|ńí', ']', 'taki', 'přemejšlela', '..'] 2023-09-08 00:37:20 ERROR root 18X100N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<SM', ftok: '<PR' | ORT | FON | |---------+---------| | samý | samí | | chaty | chati | | včera | fčera | | mi | mi | | máma | máma | | řekla | řekla | | kup | kup | | si | si | | zahradu | zahradu | | nějakou | ňákou | | já | já | | říkám | řika_ | | mami | mami | | <SM | <PR | | dej | dej | | > | > | | dej | dej | | mi | mi | | pokoj | poko_ | | já | já | | zahradu | zahradu | | nechci | nechci | | .. | .. | ort: ['samý', 'chaty', 'včera', 'mi', 'máma', 'řekla', 'kup', 'si', 'zahradu', 'nějakou', 'já', 'říkám', 'mami', '<SM', 'dej', '>', 'dej', 'mi', 'pokoj', 'já', 'zahradu', 'nechci', '..'] fon: ['samí', 'chati', 'fčera|mi', 'máma', 'řekla', 'kup|si', 'zahradu', 'ňákou', 'já|řika_', 'mami', '<PR', 'dej', '>', 'dej|mi', 'poko_', 'já|zahradu', 'nechci', '..'] 2023-09-08 00:37:41 ERROR root 18X105N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '<SP', ftok: '<SM' | ORT | FON | |---------+---------| | něco | ňeco | | [ | [ | | lepšího | lepšího | | vytvoří | vitvoří | | no | no | | ] | ] | | .. | .. | | [ | [ | | <SP | <SM | | hmm | hmm | | hmm | hmm | | > | > | | ] | ] | ort: ['něco', '[', 'lepšího', 'vytvoří', 'no', ']', '..', '[', '<SP', 'hmm', 'hmm', '>', ']'] fon: ['ňeco', '[', 'lepšího', 'vitvoří', 'no', ']', '..', '[', '<SM', 'hmm', 'hmm', '>', ']'] 2023-09-08 00:37:57 ERROR root 18X132N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |----+----| | [ | [ | | nə | nə | | ] | ] | ort: ['[', 'nə', ']'] fon: ['[', 'nə', ']'] 2023-09-08 00:37:58 ERROR root 18X132N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ń is not allowed on the fon layer | ORT | FON | |----------+----------| | no | ńə | | tak | tak | | než | neš | | . | . | | přijedeš | přijedeš | | k | k | | nám | nám | | tak | tak | | vpravo | fprao | | takhle | takle | | .. | .. | ort: ['no', 'tak', 'než', '.', 'přijedeš', 'k', 'nám', 'tak', 'vpravo', 'takhle', '..'] fon: ['ńə|tak', 'neš', '.', 'přijedeš', 'k|nám', 'tak', 'fprao', 'takle', '..'] 2023-09-08 00:37:59 ERROR root 18X132N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'všechny', ftok: '(' | ORT | FON | |---------+---------| | [ | [ | | <SM | <SM | | že | še | | je | bi | | tam | tam | | ] | ] | | nechal | nechal | | všechny | ( | | peníze | fšechni | | > | ) | ort: ['[', '<SM', 'že', 'je', 'tam', ']', 'nechal', 'všechny', 'peníze', '>'] fon: ['[', '<SM', 'še|bi|tam', ']', 'nechal', '(', 'fšechni', ')'] 2023-09-08 00:38:10 ERROR root 19A003N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- + [ [ terí který ma_ mají ] ] jiní jiný koňíčki koníčky .. .. tak tak to to ə je peklo peklo jó no s s ňima nima seš jsi prosťe prostě púl půl oďini hodiny f v kabiňe kabině a a bolí bolí ťe tě uši uši .. .. None 2023-09-08 00:38:14 ERROR root 19A005N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'jako', ftok: ')' | ORT | FON | |----------+----------| | dál | dál | | to | to | | vyřešit | viřešit | | .. | .. | | Míša | míša | | mně | mňe | | teda | teda | | říkal | řikal | | že | že | | to | to | | jsou | sou | | nějaký | ňákí | | zas | zas | | takový | takoví | | ty | ti | | vývojový | vívojoví | | prostě | pəsťe | | vlny | vlni | | .. | .. | | že | že | | se | se | | to | to | | ( | ( | | jakoby | pakobi | | jako | ) | | ) | jakə | | spraví | spraví | ort: ['dál', 'to', 'vyřešit', '..', 'Míša', 'mně', 'teda', 'říkal', 'že', 'to', 'jsou', 'nějaký', 'zas', 'takový', 'ty', 'vývojový', 'prostě', 'vlny', '..', 'že', 'se', 'to', '(', 'jakoby', 'jako', ')', 'spraví'] fon: ['dál|to', 'viřešit', '..', 'míša|mňe', 'teda', 'řikal', 'že|to|sou', 'ňákí', 'zas|takoví|ti', 'vívojoví', 'pəsťe', 'vlni', '..', 'že|se|to', '(', 'pakobi', ')', 'jakə', 'spraví'] 2023-09-08 00:38:15 ERROR root 19A005N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |----------+----------| | von | von | | právě | trae | | Míša | míša | | @ | @ | | jako | jakə | | Míša | míša | | celkəvě | celkovje | | neuznává | neuznává | | tadyty | taiti | | [ | [ | | oslavy | oslavi | | . | . | | dětí | ďeťí | | .. | .. | | v | v | | rámci | rámci | | ] | ] | | v | v | | rámci | rámci | | prostě | prəsťe | | m* | me | | jako | jakə | | mezi | mezi | | dětma | ďetma | ort: ['von', 'právě', 'Míša', '@', 'jako', 'Míša', 'celkəvě', 'neuznává', 'tadyty', '[', 'oslavy', '.', 'dětí', '..', 'v', 'rámci', ']', 'v', 'rámci', 'prostě', 'm*', 'jako', 'mezi', 'dětma'] fon: ['von|trae', 'míša', '@', 'jakə', 'míša', 'celkovje', 'neuznává', 'taiti', '[', 'oslavi', '.', 'ďeťí', '..', 'v|rámci', ']', 'v|rámci', 'prəsťe', 'me', 'jakə', 'mezi', 'ďetma'] 2023-09-08 00:38:24 ERROR root 19A010N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'pro', ftok: '(' | ORT | FON | |--------+--------| | prostě | prosťe | | jo | jó | | . | . | | ( | ( | | jsem | sem | | se | řikaa | | ) | ) | | kdyby | dibi | | .. | .. | | kdyby | dibi | | . | . | | [ | [ | | po | po | | . | . | | pro | ( | | po | 1 | | mně | ) | | chtěli | po | | peníze | mňe | | ] | chťeli | | .. | peňíze | ort: ['prostě', 'jo', '.', '(', 'jsem', 'se', ')', 'kdyby', '..', 'kdyby', '.', '[', 'po', '.', 'pro', 'po', 'mně', 'chtěli', 'peníze', ']', '..'] fon: ['prosťe', 'jó', '.', '(', 'sem|řikaa', ')', 'dibi', '..', 'dibi', '.', '[', 'po', '.', '(', '1', ')', 'po|mňe', 'chťeli', 'peňíze'] 2023-09-08 00:38:25 ERROR root 19A010N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- že že ( jesi jestli tai ) si ať tám si sat tam . sad jakəbi . uďelají jakoby .. udělají ale .. žé ale . že že . jim že to jim akəbi to prənajmou jakoby . pronajmou ale . kəbi ale . jakoby asi . besplaťňe asi None bezplatně None 2023-09-08 00:38:28 ERROR root 19A013N:Wrong use of # in 's#'. 2023-09-08 00:38:29 ERROR root 19A013N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'ty', ftok: '(' | ORT | FON | |-----------+-----------| | no | nə | | tak | ə | | že | že | | maj | maj | | chvilku | chvilku | | čas | času | | jestli | jesi | | nekoupíme | nekoupíme | | motorky | motorki | | a | a | | já | já | | říkám | igám | | hoši | həši | | ty | ( | | jo | ti | | . | ə | ort: ['no', 'tak', 'že', 'maj', 'chvilku', 'čas', 'jestli', 'nekoupíme', 'motorky', 'a', 'já', 'říkám', 'hoši', 'ty', 'jo', '.'] fon: ['nə|ə', 'že|maj', 'chvilku', 'času', 'jesi', 'nekoupíme', 'motorki', 'a|já', 'igám', 'həši', '(', 'ti|ə'] 2023-09-08 00:38:29 ERROR root 19A013N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- ale ale teď te_ ten ten ( motokəs motocross to ) é to . je celkəvje . finančňe celkově f finančně prdeli v a prdeli .. a None .. None 2023-09-08 00:38:29 ERROR root 19A013N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'hele', ftok: '(' | ORT | FON | |-----------+---------| | tak | tak | | v | ← | | půl | púl | | desáté | desate | | jsem | sem | | doma | dəma | | se | ze | | vším | fšiɱ | | všudy | fšudi | | hele | ( | | na | 1 | | motocross | ) | | to | na | | musíš | motokəs | | jezdit | to | | .. | musíž | ort: ['tak', 'v', 'půl', 'desáté', 'jsem', 'doma', 'se', 'vším', 'všudy', 'hele', 'na', 'motocross', 'to', 'musíš', 'jezdit', '..'] fon: ['tak||púl', 'desate', 'sem|dəma', 'ze|fšiɱ', 'fšudi', '(', '1', ')', 'na|motokəs', 'to|musíž'] 2023-09-08 00:38:41 ERROR root 19A031N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ə is not allowed on the ort layer | ORT | FON | |----+----| | [ | [ | | nə | nə | | ] | ] | ort: ['[', 'nə', ']'] fon: ['[', 'nə', ']'] 2023-09-08 00:38:42 ERROR root 19A031N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'hmm', ftok: '(' | ORT | FON | |-----+-----| | [ | [ | | hmm | ( | | ] | hmm | ort: ['[', 'hmm', ']'] fon: ['[', '(', 'hmm'] 2023-09-08 00:38:56 ERROR root 19X028N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1095, in add_qmarks_on_fon ftok = self.fon.pop(0) ^^^^^^^^^^^^^^^ IndexError: pop from empty list During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 905, in __init__ self.add_qmarks_on_fon() File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1097, in add_qmarks_on_fon raise AddQMarksFailed(self.ort, new_fon) AddQMarksFailed: ORT FON --- --- když diš ( to to tak ) podle tak ňakích podle obecních nějakých statistik obecných .. statistik None .. None 2023-09-08 00:38:56 ERROR root 19X028N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'jako', ftok: '(' | ORT | FON | |---------+---------| | + | + | | [ | [ | | člověk | človjek | | a | a | | když | diš | | ] | ] | | viděla | viďela | | ještě | ešťe | | ten | ten | | scénář | scénář | | jako | ( | | že | jako | | to | ) | | je | že | | fakt | to | | úchylný | je | | .. | fak | | → | uchilní | ort: ['+', '[', 'člověk', 'a', 'když', ']', 'viděla', 'ještě', 'ten', 'scénář', 'jako', 'že', 'to', 'je', 'fakt', 'úchylný', '..'] fon: ['+', '[', 'človjek', 'a|diš', ']', 'viďela', 'ešťe', 'ten|scénář', '(', 'jako', ')', 'že|to|je', 'fak|uchilní'] 2023-09-08 00:38:57 ERROR root 19X028N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '(', ftok: 'já' | ORT | FON | |-------------+-------------| | protože | pəče | | ( | já | | já | se_ | | jsem | musela | | ) | do | | musela | šatni | | do | a | | šatny | ešťe | | a | si | | ještě | dát | | si | <SM | | dát | ( | | <SM | jedni | | aspoň | ) | | kalhotky | kalhotki | | a | a | | oblíct | oblíct | | podvlíkačky | podvlíkački | | > | > | | a | a | | pak | pag | | že | že | | se | se | | z | s | | nich | ňich | | nemohla | nemohla | | vůbec | vúbez | | dostat | dosta | | ( | ( | | 1 | 1 | | ) | ) | | .. | .. | ort: ['protože', '(', 'já', 'jsem', ')', 'musela', 'do', 'šatny', 'a', 'ještě', 'si', 'dát', '<SM', 'aspoň', 'kalhotky', 'a', 'oblíct', 'podvlíkačky', '>', 'a', 'pak', 'že', 'se', 'z', 'nich', 'nemohla', 'vůbec', 'dostat', '(', '1', ')', '..'] fon: ['pəče', 'já|se_', 'musela', 'do|šatni', 'a|ešťe|si|dát', '<SM', '(', 'jedni', ')', 'kalhotki', 'a|oblíct', 'podvlíkački', '>', 'a|pag|že|se|s|ňich', 'nemohla', 'vúbez', 'dosta', '(', '1', ')', '..'] 2023-09-08 00:38:57 ERROR root 19X028N:Unexpected para code in <příští / ['<příští', 'zastávka', 'Národní', 'třída', '>']. 2023-09-08 00:38:58 ERROR root 19X028N:Unexpected para code in <N / ['<N', 'árodní', 'třída', 'přestup', 'na', 'metro', 'příští', 'zastávka', 'Národní', 'divadlo', '>']. 2023-09-08 00:39:00 ERROR root 19X035N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: 'tímhle', ftok: '(' | ORT | FON | |------------+------------| | ( | ( | | 1 | 1 | | ) | ) | | nevadí | nevaďí | | dobrý | dobrí | | .. | .. | | mně | mňe | | se | se | | nechce | nechce | | voblizovat | voblizovat | | stůl | stúl | | víš | víš | | tak | tak | | to | to | | nechám | nechám | | radši | rači | | tady | tadi | | tímhle | ( | ort: ['(', '1', ')', 'nevadí', 'dobrý', '..', 'mně', 'se', 'nechce', 'voblizovat', 'stůl', 'víš', 'tak', 'to', 'nechám', 'radši', 'tady', 'tímhle'] fon: ['(', '1', ')', 'nevaďí', 'dobrí', '..', 'mňe|se', 'nechce', 'voblizovat', 'stúl', 'víš', 'tak|to', 'nechám', 'rači', 'tadi', '('] 2023-09-08 00:39:20 ERROR root 20A004N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '>', ftok: 'daa' | ORT | FON | |-------+-----| | <SM | <SM | | kam#s | kam | | to | s | | dala | tə | | > | daa | | ? | ? | ort: ['<SM', 'kam#s', 'to', 'dala', '>', '?'] fon: ['<SM', 'kam|s|tə', 'daa', '?'] 2023-09-08 00:39:20 ERROR root 20A004N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1020, in print self.print_tok(otok, ftok, special) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1052, in print_tok raise TokenMismatch(self, otok, ftok) TokenMismatch: otok: '>', ftok: 'moje' | ORT | FON | |-------+-------| | <SM | <SM | | to | to | | je | e | | to | to | | co | co | | jíš | íš | | teď | téť | | . | . | | jen | jen | | ty#s | ti | | někam | z | | dala | ňekam | | to | daa | | moje | to | | > | moje | ort: ['<SM', 'to', 'je', 'to', 'co', 'jíš', 'teď', '.', 'jen', 'ty#s', 'někam', 'dala', 'to', 'moje', '>'] fon: ['<SM', 'to|e', 'to|co|íš', 'téť', '.', 'jen|ti|z', 'ňekam', 'daa', 'to|moje'] 2023-09-08 00:39:21 ERROR root 20A004N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1006, in print otok = next(ort) ^^^^^^^^^ StopIteration During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1384, in process_eaf ).print() ^^^^^^^ File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1008, in print raise OrtTooShort(self) OrtTooShort: | ORT | FON | |-------+-------| | ty#s | ti | | řekla | z | | že | řekla | | je | že | | pět | je | | ale | pjet | | už | ale | | je | uš | | čtvrt | je | | na | štvrt | | šest | na | | → | šest | ort: ['ty#s', 'řekla', 'že', 'je', 'pět', 'ale', 'už', 'je', 'čtvrt', 'na', 'šest'] fon: ['ti|z|řekla', 'že|je', 'pjet', 'ale|uš|je', 'štvrt|na|šest'] 2023-09-08 00:39:22 ERROR root 20A007N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 841, in __init__ self._check_delimiters(ort) File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 947, in _check_delimiters raise ValueError(f"Nested {d} in {trans!r}") ValueError: Nested < in '<JO3 <PR bizi bizi bizi>' 2023-09-08 00:39:40 ERROR root 20X022N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ' is not allowed on the ort layer | ORT | FON | |----------+-------| | ty | DUMMY | | neznáš | DUMMY | | .. | DUMMY | | Ignácia | DUMMY | | O'Reilly | DUMMY | ort: ['ty', 'neznáš', '..', 'Ignácia', "O'Reilly"] fon: None 2023-09-08 00:39:40 ERROR root 20X022N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ' is not allowed on the ort layer | ORT | FON | |---------+-------| | John | DUMMY | | Kennedy | DUMMY | | O'Toole | DUMMY | | to | DUMMY | | napsal | DUMMY | ort: ['John', 'Kennedy', "O'Toole", 'to', 'napsal'] fon: None 2023-09-08 00:39:53 ERROR root 21X014N:Corrupt segment -- Traceback (most recent call last): File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 1372, in process_eaf Segment( File "/cnk/users/home/lukes/corp/ortofon/./bin/eaf2vert.py", line 904, in __init__ raise InvalidGraphemeCluster(self) InvalidGraphemeCluster: ' is not allowed on the ort layer | ORT | FON | |----------+-------| | ono | DUMMY | | se | DUMMY | | to | DUMMY | | jmenuje | DUMMY | | Zack | DUMMY | | Snyder's | DUMMY | | . | DUMMY | | to | DUMMY | | je | DUMMY | | fakt | DUMMY | | jako | DUMMY | | pro | DUMMY | | něj | DUMMY | | jenom | DUMMY | | ten | DUMMY | | film | DUMMY | ort: ['ono', 'se', 'to', 'jmenuje', 'Zack', "Snyder's", '.', 'to', 'je', 'fakt', 'jako', 'pro', 'něj', 'jenom', 'ten', 'film'] fon: None