bulletin4corpus: Paralleles Korpus kreiert aus den Credit Suisse Bulletin
Ein manuell korrigiertes wortartengetaggtes Korpus von ca. 62.000 Token (Language: German; Domain: Reports about the University of Zurich; PoS-Tagset: STTS)
4561 deutsche Testfälle (ZIP, 122 KB) für PP-Anbindung aus der Computerzeitung verwendet in der Habilitationsschrift: Martin Volk: The automatic resolution of prepositional phrase attachment ambiguities in German. University of Zurich. 2001.
3000 Sätze, welche vollständig im NEGRA-Format annotiert sind (Computerzeitung) Bitte Martin Volk kontaktieren.
Der deutschsprachige Thesaurus UniNet mit ca. 20'000 Nomen im WordNet-Format zum Anwendungsbereich (schweizerisches) Universitätsvokabular (im Web anschauen). Für andere Formate bitte Simon Clematide kontaktieren.
The Gold Standard corpus of temporal annotations von zirka 34,000 Tokens. Das Korpus enthält 50 historische Rechtstexte in Frühneuhochdeutsch aus der Sammlung der schweizerischen Rechtsquellenstiftung.