Fonetický přepis
v korpusu ORTOFON

David Lukeš

Úvod (I)

Úvod (II)

Postup sběru dat pro ORTOFON

Kdybychom měli pravidla vymyslet...

  • co víme o fonetickém přepisu?
  • co víme o našem materiálu?
    • situace
    • způsob nahrávání
  • co víme o projektu ORTOFON?

    • kdo sbírá data?
    • kdo je přepisuje?

    → Jak bychom tedy mohli postupovat při vytváření transkripčních pravidel pro fonetický přepis?

Postup

  1. Schválení vrstvy ort v databázi a “překlopení” přepisu na vrstvu fon.
    • provedou se některé základní záměny znaků, které se na vrstvě fon (skoro) nepoužívají, např. měkkýmňekí
  2. Přepis vrstvy fon v Transcription Mode v ELANu.
    • možnost rozkliknout si daný úsek detailněji i v Praatu
  3. Kontrola alignace vrstev ort a fon pomocí programu TransVer
  4. Vložení do databáze, kontrola přepisu (automatická i lidská), dodatečné opravy.

Co a jak zachycujeme? (I)

Co a jak zachycujeme? (II)

Co a jak zachycujeme? (III)

  • kvantita:
    • dloužení i krácení
    • patálie okolo [i/í]
  • obecně: piš jak slyš – i cizí slova, vlastní jména, zkratky a zkratková slova…

Alignace vrstev ort a fon

Budoucnost

  • snad zrychlení procesu přepisu :)
  • též větší konzistentnost
  • s obojím by mohly pomoct metody založené na rozpoznávání řeči:
    • místo překlopení by se na základě nahrávky a soupisu již existujících výslovnostních variant vygeneroval automatický přepis
    • ten by pak editor jen kontroloval

Díky za pozornost!

Otázky?

Prezentace je k dispozici na .

Vlnovka ~ se na běžné české klávesnici píše kombinací kláves PravýAlt + 1 (míněna je klávesa 1 vlevo nahoře, ne na číselné klávesnici).