Top-Fragen
Zeitleiste
Chat
Kontext
Extensible MultiModal Annotation markup language
auf XML basierende Sprachstandard Aus Wikipedia, der freien Enzyklopädie
Remove ads
Remove ads
Extensible MultiModal Annotation markup language (EMMA) ist ein auf XML basierender Sprachstandard aus der Medieninformatik, der durch das World Wide Web Consortium geschaffen wurde und sich noch in Bearbeitung befindet. Sie soll es ermöglichen, multimodale und bereits interpretierte Nutzereingaben standardisiert für die Weiterverarbeitung darzustellen. EMMA ist zur Anwendung in so genannten Multimodal Interaction Frameworks (MMI) gedacht.
Folgende Erkennungs-Systeme (Recognizers) sollen EMMA-Code erzeugen (können):
- Spracherkennungssysteme
- Handschrift-Erkennungssysteme
- Media Interpreter für Eingabegeräte (z. B. Zeigegeräte, Tastaturen)
- die Multimodal integration component
Ein EMMA-Dokument hält Interpretationen von Nutzereingaben aus den verschiedenen Erkennungssystemen bereit. Es ist auch möglich, mehrere Interpretationen der gleichen Eingabe, die mit unterschiedlichen Konfidenzfaktoren versehen sind, zu speichern. Interpretationsdaten werden stets Anwendungsbezogen beschrieben.
Remove ads
Beispiel
Zusammenfassung
Kontext
Eine Anwendung mit einem telefonischen Spracherkennungssystem, das Kunden eines Reiseunternehmens Auskunft über Flugverbindungen geben soll, erzeugt Audiodaten, die zunächst interpretiert werden. Ein Kunde möchte gern alle Flüge von Boston nach Denver am 11. März 2003 angesagt bekommen. Dazu wird er von der Anwendung aufgefordert, den Abflugort, den Zielort und das Datum anzugeben. Der Interpreter, der den Input der Spracherkennung auswertet, könnte folgendes EMMA-Dokument erzeugen:
<emma:emma version="1.0"
xmlns:emma="http://www.w3.org/2003/04/emma"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3.org/2003/04/emma
http://www.w3.org/TR/emma/emma10.xsd"
xmlns="http://www.example.com/example">
<emma:info>
<caller_id>
<phone_number>2121234567</phone_number>
<state>NY</state>
</caller_id>
<customer_type>residential</customer_type>
<service_name>acme_travel_service</service_name>
</emma:info>
<emma:one-of id="r1" emma:start="1087995961542"
emma:end="1087995963542">
<emma:interpretation id="int1" emma:confidence="0.75">
<origin>Boston</origin>
<destination>Denver</destination>
<date>03112003</date>
</emma:interpretation>
<emma:interpretation id="int2" emma:confidence="0.68">
<origin>Austin</origin>
<destination>Denver</destination>
<date>03112003</date>
</emma:interpretation>
</emma:one-of>
</emma:emma>
Der Interpreter hat zwei mögliche Interpretationen geliefert: Die Eingabe des Abflugortes könnte „Boston“ lauten, es besteht aber auch die Möglichkeit, dass sie „Austin“ lautet, was aber aufgrund des niedrigeren Wertes des Attributs „emma:confidence“ weniger wahrscheinlich ist.
Remove ads
Weblinks
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads