Trend 2012 |
Eines der Verkaufsargumente für das neue iPhone 4S ist die smarte Sprachassistentin Siri. Seit Oktober häufen sich im Netz witzige Siri-Dialoge und Einsatzversuche für andere Aufgaben, wie Siri Proxy
Von Halyna Kubiv (13.01.2012)
Ausbaufähig ist auch das Zusammenspiel zwischen verschiedenen Applikationen, in die Siri integriert ist: Obwohl im Terminkalender am 10. Dezember ein ganztägiger Termin in San Francisco steht, liefert Siri auf die Frage "Brauche ich am 10. Dezember einen Regenschirm?" die Wettervorhersage für den aktuellen Standort (in unserem Test für München) und nicht korrekterweise für San Francisco.
Apples persönlicher Assistent ist ein komplexes Konstrukt aus diversen Datenbanken und Software-Modulen zu Spracherkennung und -verstehen, Dialogsteuerung, Sprachgenerierung, Sprachsynthese und Audio-Ausgabe.
Moderne Spracherkennungssoftware, beispielsweise Dragon Dictation von Nuance, basiert auf einem statistischen Verfahren zur Auswertung einer (sprachlichen) Einheit, wobei man das Merkmalsmuster der fraglichen Einheit mit einer Reihe der gespeicherten Referenzmuster vergleicht. Je größer die Referenzdaten-bank ist, desto genauer sind die Ergebnisse. Für Apples Sprachassistenz bedeutet dies konkret, je öfter Anwender diese Funktion nutzen, desto genauere Antworten auf ihre Fragen bekommen sie. Bei solchen statistischen Verfahren (Hidden Markov Model) ist vollkommen irrelevant, welche Größenordnung die gesuchte Einheit hat. Der gleiche Algorithmus wird zur Erkennung einzelner Phoneme, Wörter oder ganzer Wortphrasen genutzt. Die zahlreichen Anwender fungieren hier als Lehrer, das heißt, dass Siri mit der Zeit immer besser Anwender mit Akzent oder Dialektausdrücke versteht, und dass die Software anhand von schematischen Grammatikmodellen für einzelne Sprachen die Satzstrukturen besser erkennt.
Was Siri von anderen Sprachsteuerungen wie Microsofts "Tell Me" oder Googles "Voice Search" unterscheidet, ist ihre fast menschliche Intelligenz. Siri versteht nicht nur konkrete Stichwörter wie "Wettervorhersage, 2. Januar, München" sondern auch abstrakte Begriffe wie "Regenschirm". Grund dafür ist eine ausgereifte Dialogsteuerung, die dem Nutzer den Zugriff auf mehrere unterschiedliche Anwendungen gleichzeitig erlaubt. Dabei wertet ein Dialogmanager konkrete Angaben aus und weist sie einer bestimmten Anwendung zu.
Newsletter bestellen: Newsletter und Wochenchronik
Das könnte Sie auch interessieren:
Mehr zu diesen Stichwörtern: SIri, Sprachsteuerung, Assistent, Kontext
Forum (0 Kommentare)
|
Bitte melden Sie sich mit Ihrem Benutzernamen und Passwort an, um das Forum nutzen zu können, oder registrieren Sie sich für das Benutzerforum.