| ||||||||
Sprachforschung
| ||||||||
| ||||||||
|
Bei einer durchschnittlichen Körpergröße von 1.75 m belegt
das Standardsystem ca. 95%.
Innerhalb der restlichen 5 % kann man Bereiche feststellen, die nicht oder nur temporär genutzt werden und daher dem Nutzer des Systems zur Verfügung stehen. Da es sich dabei auch physisch um den oberen Systembereich handelt, wird hier oft die Bezeichnung high memory area verwendet. Meines Erachtens nach steht hma jedoch korrekt für human mental area. Die untersuchten Teile werden zur Laufzeit geladen. Da Reboots beim System Mensch eher selten sind und die Uptime wesentlich über der von DOS, Windows oder sogar UNIX-Systemen liegt, ist bereits frühzeitig mit Fehlermeldungen wie "not enough memory" zu rechen ( "Was Hänschen nicht lernt ..."). Wie bei anderen vergleichbaren Systemen leicht nachzuweisen, ist die optimale Nutzung dieses Bereiches ausschlaggebend für die Effizienz des Gesamtsystems. Mittels AM werden daher laufend Methoden zur Optimierung des hma-Einsatzes erforscht, angewandt und zum Wohle der Menschheit publiziert. Ein großer Teil der hma ist durch Satzkonstruktionen belegt, die als Antworten auf verschiedenste Fragestellungen zur Verfügung stehen. Der praktische Wert ist dabei oft vernachlässigbar. Es zeigt sich jedoch, daß gerade dieses Antwort-System durch kleine Änderungen wesentlich effizienter wird, obwohl es nur noch einen Bruchteil des ursprünglichen Platzbedarfs aufweist. | ||||||||
| ||||||||
GAGS(Generelles- Antwort-Generierungs-System)Innerhalb der hma belegt ein Normal-GAGS einen beträchtlichen Raum. Ein durchschnittlicher User hat ca. 3600 vordefinierte Antwortfloskeln abrufbereit, die mit durchschnittlich 0-3 Parametern arbeiten.
ZB: Schubert wurde ... geboren. Über den praktischen Wert dieser Characterstrings erübrigt sich jede Diskussion. Da eine Vergrößerung des Bereichs zu Lasten der Perfomance geht, andererseits jedoch besonders gutes Antwortzeitverhalten ( = Schlagfertigkeit) gefragt ist, wurde von uns der Datenbestand analysiert. 1. Der Datenbestand ist nur teilweise relational aufgebaut, große Teile liegen (wie die angegebenen Beispiele ) linear vor, nur in einem sehr begrenzten Rahmen wird mit Methoden der fuzzy logic zugegiffen. 2. Ca. 60 % der Datenmenge wird in weniger als 1.5 % der Queries verwendet. Andererseits liegt die durchschnittliche Trefferquote beim Datenzugriff unter 30 %. In 70 % kann also kein Treffer erzielt werden. Die Antwort muß in diesen Fällen nachgeladen werden. In diesen Fällen liegt also kein GAG vor! Eine Optimierung nach AM ist daher in dreifacher Weise anzusetzen:a) nach dem Datentypus b) nach der Parameteranzahl - Konkretisierung c) nach dem benötigten Speicherplatz | ||||||||
| ||||||||
Wir unterscheiden 5 Arten von GAG-Sequenzen:1) primitiv GAGBenötigt keine Parameter. Kennt keine secondary keys. Ausnahmslos in Form ziemlicher flat files vorliegend. Kabarettszenen beginnen meist mit einer derartigen Sequenz. GAG-Serien allgemein, die damit beginnen, können jederzeit ansatzlos abgerufen werden. Die DB-Trefferquote konnte in einigen Fällen unter Laborbedingungen auf über 90 % gesteigert werden. Auch als Default definierbar. "Ich kann Sie nicht verstehen." oder "Weiß ich nicht" oder besonders bei Schulfragen "Weiß ich AUCH nicht !" e.t.c. 2) primary GAG
Benötigt keine Auslöser. DB-Trefferquote unter Ausschluß der primitv-GAGS bis 80 %. Oft wird ein Situationsmerkmal als Parameter mitgegeben: zB: "<Parameter 1> Wetter, heute!" Als Parameter 1 können Daten aus dem visuellen Bereich eingesetzt werden. 3) secondary GAGa) general secondarySind von der Art des Auslösers, der jedoch als Startsequenz prinzipiell notwendig ist, relativ unabhängig. Auch hier sind die Trefferquoten nach bisher vorliegenden Tests leicht optimierbar. Zusätzlich können secondary GAGS im Rahmen einer DB-Reorganisation durch Hinzufügen kurzer Startsequenzen zu primary GAGS konvertiert werden. Ein Beispiel :general secondary GAG: "Der Urlaub in Thailand war heuer.....". Der Bezug innerhalb der Sequenz "heuer" wird durch einen Time-Parameter ersetzt und der ganze Block mit einer Startsequenz "Übrigens muß ich Ihnen unbedingt von <prior secondary> erzählen" zu einem primary GAG aufgewertet. Damit entfällt die Notwendigkeit, auf einen Auslöser zu warten und der jetzt primary GAG kann jederzeit zur Erhöhung der Trefferquote ausgelöst werden. b) specific secondaryAuch ohne Parameter möglich, jedoch in hohem Maße an den Auslöser angepaßt. z B. "Dieses Braun steht Ihnen aber gut" oder "Toller Haarschnitt", etc. Oder "Hoppala" als GAG zu dementsprechenden Vorfällen. Es zeigt sich, daß ein Großteil des GAG-Datenbestandes durch secondary GAG-Sequenzen belegt wird, die aber nur unterdurchschnittliche Trefferquoten erzielen. Erster Tip zur Optimierung des GAG-Systems ist daher eine flächendeckende Konvertierung von general secondary GAGS in primary bzw. primitiv GAGS. Beispiele:
Specific secondary GAGS, bzw. noch komplexere Arten werden wir gesondert analysieren. | ||||||||
| ||||||||