LexDb ist eine sehr umfangreiche Datenbank mit deutschen und englischen Lemmata bzw. Morpheme (Stammwörtern). Über Derivationsalgorithmen und Kompositionsregeln werden Flexionen gebildet.
Jedes gebildete Wort kann in der Datenbank mit der Wortart, Geschlecht, Sprache oder Grundform abgefragt werden.
Wörter können hinsichtlich der Rechtsschreibung verifiziert werden. Aktuell ist der Schwerpunkt auf IT gelegt. Aufgrund der hohen Anzahl an Anglizismen sind auch englische Wörter enthalten.
Semantische Informationen sind ebenfalls verfügbar und werden optional gepflegt. So können beispielsweise alle Tiere, textile Stoffe, Pharmazeutika, Betriebsstätten abgefragt bzw. identifiziert werden.
Wir haben diese Datenbank zusammen mit Tools zur Pflege über viele Jahre hinweg entwickelt und gepflegt, um Rechtschreibprüfungen in technischen Texten (IT, Software) zu automatisieren. Des weiteren wurde die Datenbank für die semantische Suche eingesetzt.
Die Daten werden von uns weiterhin gepflegt und können über eine Schnittstelle regelmäßig geladen oder nur abgefragt werden.
Der individuelle Ausbau der Daten ist durch Erfassung neuer Schwerpunkte wie beispielsweise medizinische, geologische, geographische oder biologische Begriffe möglich. Auch ein spezieller semantischer Ausbau kann von uns übernommen werden.
Aktuell sind ca. 5.000 Abkürzungen aus dem IT-Umfeld mit Bedeutungen enthalten.
Folgende Wortarten wurden klassifiziert:
Markierungen von Teilworten sind enthalten. Ein Testumfang (Beispieldatensätze) kann zur Verfügung gestellt werden.