Textspezifisches Wörterbuch
 
StartSeite | Neues | TestSeite | ForumSeite | Teilnehmer | Kategorien | Index | Hilfe | Einstellungen | Ändern

zu: LernsoftwareProgrammierung
Wer hat das noch nicht erlebt: beim lesen eines englischen Textes werden wie wild, in einem mehr oder weniger dicken Schinken, unbekannte Wörter nachgeschlagen.

Wie schön ist es dagegen, zu einem Übungstext die schwierigen Worte gleich nebenan aufgelistet zu finden. Sicher könnte man solche Übungen erstellen und sammeln. Und was ist mit Aktuellem? Oder wenn man sogar seinen Lieblingsautor mal im Original lesen möchte?

Eine Software-Tool zum automatischen erstellen solcher textspezifischer Übersetzungslistungen muss her! Man kann das später mit vielen Ideen weiter ausbauen. Die einfachste Form ist aber erst mal ein Ausdruck passend zum Text.

Damit das Sinn macht, muss der Text natürlich als Datei vorliegen. Von aktuellen Web-Nachrichten bis zu E-Books gibt es da genug Material.

Daneben wird noch eine ÜbersetzungsMöglichkeit samt Bedeutungen der "schwierigen Worte" gebraucht. Hier ist das Internet das ideale Medium zur Zusammenarbeit um die Übersetzung-Daten zu Sammeln.

Der SchnelleWortVersuch zeigte, dass eine Lösung möglich ist. Die Probleme werden eher bei der ÜbersetzungsMöglichkeit liegen. So sind dort Großschreibung und Wortvarianten (Mehrzahl, Vergangenheitsformen usw.) zu bedenken.

Programmdefinition:

Eingangsdaten sind ein beliebiger Quelltext als ANSI-Textdatei, eine einfache, sortierte Wortliste der "leichten" Worte und ein digitales "Wörterbuch", in der einfachsten Form ebenfalls eine Textdatei mit alphabetisch sortierten Wortpaaren. Beispiel zum Letzten:

 copy Kopie, Abschrift
 palliate lindern, bemänteln, beschönigen

Heraus kommt eine Liste von Wortpaaren in einem druckbaren Format. Da das Layout eines Wörterbuches nicht optimal ist, ist hier eine Tabelle sinnvoll.

 copy       - Kopie, Abschrift
 palliate   - lindern, bemänteln, beschönigen

Alle 4 Dateinahmen können beim Tool-Aufruf als Parameter übergeben werden. Als Quelltext und Druckliste können auch Standard-In und Out genutzt werden. Ein Codebeispiel hierzu ist vorhanden. "Wörterbuch" und "leichten" Worte sind auch per Environment-Variabeln festlegbar.

Die Funktion des Tools wird druch einzelne Schritte erreicht, die die Daten einander Übergeben:

Große Datenmengen sind ja heute kein Problem mehr, fallen auch im programmablauf aber auch nicht an. - Der Quelltext kann fast beliebig lang sein, da er nur einmal sequenziell gelesen wird. Die doppelten Worte können schon beim Einsortieren entfernt werden sodas eine Liste unter 10000 Worten erwartet werden kann. - Bei der Übersetzung reicht es die Wortliste als auch das Wörterbuch nur sequenziell durchzugearbeiten.

Die Text-Shell-Tools die der SchnelleWortVersuch genutzt hat sind als Lösungsweg denkbar, aber etwas sperrig und altmodisch. Gleiches läßt sich mit Quellcode-Sammlungen erreichen, die direkt besser zusammen arbeiten. Damit entsteht zumindest im Geiste eine Klassen-Bibliotek auch wenn die Syntax von C++ nicht unbedingt genutzt wird. Der Code sollte dann mit jedem C-Compiler übersetzbar sein. Vielleicht findet sich ja auch ein Java- oder PHP-Kenner damit das Tool online genutzt werden kann.

Von den oben gelisteten Modulen sind Code für 1 und 3 vorhanden. Da bei 2 nur einzelne Worte dazu sortiert werden, Könnte die BinäreSuche genutzt werden(Ist schon umgestellt und getested). Die Schritte 4 und 5 sind jeweils Varianten von 1 und 3 zusammen. Und 6 ist trivial.

Ablauf: Erst mal Schritt 0. In Schritt 1 in einer Schleife wird für jedes Wort Schritt 2 aufrufen und damit auch Schritt 3 ausführen. Schritt 4 hat eine eigene Schleife. Die letzte Schleife in Schritt 5 ruft auch Schritt 6 auf. Fertig

Für die erzeugung der Dateien "leichte-Worte" (anwenderabhängig!) und "Wörterbuch" sind andere Tools denkbar, was aber vom Thema her Teil der ÜbersetzungsMöglichkeit ist.

Fehlt also nur noch der Code , natürlich getestet. Geduld, ist schon in arbeit, echt ...


StartSeite | Neues | TestSeite | ForumSeite | Teilnehmer | Kategorien | Index | Hilfe | Einstellungen | Ändern
Text dieser Seite ändern (zuletzt geändert: 18. April 2003 10:45 (diff))
Suchbegriff: gesucht wird
im Titel
im Text