VoiceXML
digitale dokumentstandaard From Wikipedia, the free encyclopedia
Remove ads
VoiceXML (VXML) is ’n digitale dokumentstandaard wat gebruik word om interaktiewe media en stemdialoog tussen mense en rekenaars te spesifiseer. Dit word algemeen gebruik vir toepassings soos bankstelsels, stemgestuurde selfdiensportale en kliëntedienslyne.
VoiceXML werk op ’n manier soortgelyk aan HTML in ’n webblaaier—maar eerder vir stem. Die dokumente word geïnterpreteer deur ’n stemblaaier (’n stemgebaseerde weergawe van ’n gewone blaaier), en gebruikers kommunikeer dikwels daarmee via die openbare geskakelde telefoonnetwerk (OGTN).
Die formaat self is gebaseer op XML (Uitbreibare Merktaal) en is deur die World Wide Web Consortium (W3C) as standaard vasgestel.
Remove ads
Gebruik
VoiceXML-toepassings word in baie nywerhede gebruik. Tipiese voorbeelde sluit in: bestellingnavrae, pakkieopsporing, roetebeskrywings, noodwaarskuwings, stemtoegang tot e-pos, kliënteverhoudingsbestuur, voorskrifhernuwing, stemgebaseerde nuusdienste, stemskakeling, en eiendomsinligting.
Die opmaaktaal beskik oor merke wat die stemblaaier instrueer om spraaksintese, outomatiese spraakherkenning, dialoogbestuur, en oudioterugvoer te hanteer.
Remove ads
Voorbeeld
Hier volg ’n eenvoudige “Hello World”-voorbeeld:
<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
<form>
<block>
<prompt>Hello world!</prompt>
</block>
</form>
</vxml>
Geskiedenis
VoiceXML is oorspronklik ontwikkel deur 'n vennootskap tussen AT&T, IBM, Lucent, en Motorola. In Maart 1999 het hulle die VoiceXML Forum gestig om 'n standaard opmaaktaal vir stemdialoge te skep. Teen September 1999 is VoiceXML 0.9 vrygestel vir kommentaar, en teen Maart 2000 is VoiceXML 1.0 amptelik gepubliseer.
Daarna het die Forum beheer oorgedra aan die Wêreldwye Web Konsortium (W3C), wat VoiceXML 2.0 in Maart 2004 as 'n amptelike aanbeveling gepubliseer het, gevolg deur weergawe 2.1 in Junie 2007.
Toekomstige Weergawes van die Standaard
VoiceXML 3.0 was geskeduleer om die volgende groot weergawe van VoiceXML te wees, met belangrike nuwe kenmerke. Met die ontbinding van die VoiceXML-forum in Mei 2022, is die ontwikkeling van die nuwe standaard egter gestaak.
Implementering
VoiceXML is geïmplementeer in beide kommersiële en oopbron spraakplatforms. Hierdie platforms interpreteer VoiceXML-skripte en maak dit moontlik om interaktiewe gesproke dialoë met gebruikers te skep. Dit word algemeen gebruik in IVR-stelsels om interoperabiliteit met ander toepassings en tegnologieë te verseker.
Sommige noemenswaardige implementerings sluit in:
- JVoiceXML – 'n oopbron interpreteerder wat in Java geskryf is.[1]
- OpenVXI – 'n C++-gebaseerde oopbron VoiceXML-interpreter, oorspronklik ontwikkel deur SpeechWorks.[2]
- Voxeo Prophecy – voorheen 'n oopbron VoiceXML-platform (nou gestaak).[3]
- UniMRCP – oopbron implementering van die Media Resource Control Protocol (MRCP), wat TTS en ASR ondersteun.[4]
- Nuance Communications – ontwikkelaar van die kommersiële Nuance Voice Platform.[5]
- Avaya – vervaardiger van die Avaya Aura Experience Portal, wat VoiceXML ondersteun.[6]
- Genesys – vervaardiger van die Genesys Voice Platform.[7]
- Cisco – ontwikkelaar van die Cisco Unified Customer Voice Portal (CVP), wat spraakinteraksie via VoiceXML moontlik maak.[8]
Remove ads
Verwante standaarde
Verskeie ander standaarde is nouverwant aan of word dikwels saam met VoiceXML gebruik:
- Call Control XML (CCXML) – spesifiseer oproepbeheermeganismes en word dikwels gebruik saam met VoiceXML om interaktiewe stemtoepassings te bou.[9]
- Speech Recognition Grammar Specification (SRGS) – definieer die grammatika wat gebruik word om herkenbare insette van gebruikers te beskryf tydens spraakherkenning.[10]
- Semantic Interpretation for Speech Recognition (SISR) – spesifiseer hoe semantiese interpretasie toegepas word op grammatikas wat deur SRGS gedefinieer is.[11]
- Speech Synthesis Markup Language (SSML) – laat ontwikkelaars toe om teks-na-spraak (TTS) uitvoer te beheer, insluitend aspek soos intonasie, tempo en uitspraak.[12]
- Pronunciation Lexicon Specification (PLS) – definieer 'n standaardformaat vir die spesifikasie van uitspraakleksikons wat deur TTS- en ASR-stelsels gebruik word.[13]
- EMMA – die Extensible MultiModal Annotation-formaat vir die verteenwoordiging van gebruikersinsette in multimodale stelsels.[14]
Hierdie platforms word dikwels gebruik in kliëntedienssentrums, bankwese, telekommunikasie, en ander nywerhede waar geoutomatiseerde stem-interaksie voordelig is.
Remove ads
Verwysings
Eksterne skakels
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads