Schweitzer Fachinformationen
Wenn es um professionelles Wissen geht, ist Schweitzer Fachinformationen wegweisend. Kunden aus Recht und Beratung sowie Unternehmen, öffentliche Verwaltungen und Bibliotheken erhalten komplette Lösungen zum Beschaffen, Verwalten und Nutzen von digitalen und gedruckten Medien.
Das Speech Application SDK ermöglicht den Aufbau von sprachgestützten Web-Applikationen innerhalb des .NET-Frameworks.
Im vorliegenden Buch wird die Implementierung entsprechender Programme anhand fundierter und praxisnaher Code-Beispiele dargestellt. Als Werkzeuge werden das .NET Framework 1.1 und das aktuelle SASDK 1.0 zum Einsatz kommen, wobei die einzelnen Komponenten des Visual Studio 2003 ebenso beschrieben werden wie auch SML (Semantic Markup Language) und SALT (Speech Application Language Tags) sowie JScript/JScript.NET und C#. Hierbei soll das Verständnis dieser Technologien für den Aufbau und Einsatz von sprachgestützten, Web-basierten Applikationen im Vordergrund stehen.
Ferner werden Tipps und Tricks aufgezeigt, die bei der Implementierung unter ASP.NET zu beachten sind. Der Leser sollte nach der Lektüre des Buches in der Lage sein, selbständig sprachgesteuerte Web-Applikationen entwickeln zu können.
Studium der Betriebswirtschaft an der FH Mainz, Fachbereich Wirtschaftsinformatik, Abteilung Wirtschaftswissenschaften. Abschluß: Diplom-Betriebswirt (FH)
Seit 1983 im IT-Umfeld tätig Sun Certified Java Programmer
Mehrjährige Tätigkeiten in deutschen und amerikanischen Unternehmen als Softwareentwickler, Projektleiter und Trainer, u.a. in den Bereichen Multimedia, Finanzsoftware, Content Management Programmierfokus: Java, C++, C#
Derzeit freiberuflicher Technologieberater, Trainer und Softwareentwickler mit dem Schwerpunkt .NET Fokussierung auf die Bereiche Mobility und Speech Sprecher auf Konferenzen
Veröffentlichung von Artikeln in einschlägigen Fachzeitschriften Co-Initiator und Co-Betreiber der .NET Usergroup Hamburg (INETA member)
12 Voice-only Applikationen (S. 285-286) Voice-only Applikationen sind die „klassische" Umsetzung, wenn es um ausschließlich sprachgestützte Anwendungen geht. Während multimodale Anwendungen derzeit noch nicht so sehr verbreitet sind (aber ein sehr großes Potential bergen), werden Ihnen sicher viele aktuelle Beispiele einfallen, in denen Sie sich schon einmal mithilfe Ihrer Stimme oder per Telefontastatur mit einem Sprachcomputer „unterhalten" haben (oder unterhalten mussten) – entweder bei Buchungen und Reservierungen (Flug/Zug), bei Banktransaktionen oder Serviceanfragen von IT-Dienstleistern. Für den Nutzer dieser Dienste ist es wichtig, komfortabel, sicher und vor allem schnell zum gewünschten Ergebnis zu kommen, da diese Systeme meistens nur unter kostenpflichtigen Servicerufnummern betrieben werden. 12.1 Betrachtung unterschiedlicher Systemtypen Bei der Entwicklung sprachgestützter Webapplikationen lässt sich keine Aussage über ein pauschales Konzept treffen, sozusagen eine Blaupause, die immer und überall einsetzbar ist. Dazu gibt es zu viele unterschiedliche Einflussfaktoren und entsprechend zahlreiche Varianten für eine Umsetzung. Ein Parameter muss jedoch als Grundlage für die zu entwickelnde Anwendung feststehen: Der Systemtyp, dessen Festlegung maßgeblich Einfluss auf die weitere Gestaltung hat. Nachfolgend werden die wesentlichen Systemtypen des Oberbegriffs „Voice-only Applikation" betrachtet. Dual tone multi frequency (DTMF) Anwender, die in Kontakt mit einem DTMF-Interface treten, haben in der Regel nur über das Tastentelefon (bzw. dessen Töne) die Möglichkeit, innerhalb der Anwendung zu navigieren. Geführt werden Sie durch Sprachausgaben mit einer natürlich oder – immer seltener – synthetisch klingenden Stimme. Interactive voice response (IVR) Diese Systeme werden meistens mit DTMF-Anwendungen gleichgesetzt, auch sie reagieren auf Tastentöne und erlauben manchmal zusätzlich die Eingabe von Sprachbefehlen. Ein IVR ist normalerweise die Vorstufe zu einem Callcenter, um einerseits vor der Weiterleitung an einen Agenten (Sachbearbeiter) gezielte Informationen zu kanalisieren und andererseits die Mitarbeiter sowie die Vermittlung zu entlasten. Natural language (NL) Natürlichsprachliche Dialogsysteme (Konversationssysteme) sind die bislang am weitesten entwickelte Form der Mensch-Maschine-Kommunikation auf sprachlicher Basis. Der größte Vorteil ist der – wie der Name bereits ausdrückt – natürliche Austausch von Informationen, genauer gesagt, die Art und Weise, wie Mensch und Maschine miteinander umgehen. Durch entsprechend umfangreiche Grammatikbibliotheken sind die NLSysteme (oder auch NDS) in der Lage, aus längeren Sätzen die relevanten Kerninformationen herauszufiltern und zu verarbeiten. Im Gegenzug wird der Anwender nicht mit stakkatoartigen Befehlen oder Ansagen konfrontiert, sondern ebenfalls mit umgangssprachlichen Sätzen. Die Aufzeichnungen sind oft sehr hochwertig und von professionellen Sprechern vorbereitet, was diese Systeme zusätzlich aufwertet. Multimodal open microphone Die Zukunft wird sicherlich in der Nutzung multimodaler Anwendungen unter Einsatz völlig freier, umgangssprachlicher Sätze bestehen, und zwar zu jeder Zeit an jedem Ort mit jedem sprach- und webtauglichen (mobilen) Gerät. Bislang scheitet die Umsetzung sowohl an den Bandbreiten als auch an den zur Verfügung stehenden Geräten, außerdem sind viele technische Voraussetzungen noch unklar, unter anderem Sicherheitsaspekte (security options), Personalisierung, Transaktionsverwaltung (transaction handling) oder auch Sitzungsmanagement (session management). Doch durch die rapide Entwicklung in diesen Segmenten – zum Beispiel im Bereich Voice over IP (VoIP) oder drahtlosen Netzen (WLANs) – und der zunehmenden Miniaturisierung wird es diese Systeme wohl in absehbarerer Zukunft zu erschwinglichen Preisen und in tragbaren Kleidungsstücken eingenäht geben, vielleicht die Killerapplikation der nächsten Jahre?
Dateiformat: PDFKopierschutz: Wasserzeichen-DRM (Digital Rights Management)
Systemvoraussetzungen:
Das Dateiformat PDF zeigt auf jeder Hardware eine Buchseite stets identisch an. Daher ist eine PDF auch für ein komplexes Layout geeignet, wie es bei Lehr- und Fachbüchern verwendet wird (Bilder, Tabellen, Spalten, Fußnoten). Bei kleinen Displays von E-Readern oder Smartphones sind PDF leider eher nervig, weil zu viel Scrollen notwendig ist. Mit Wasserzeichen-DRM wird hier ein „weicher” Kopierschutz verwendet. Daher ist technisch zwar alles möglich – sogar eine unzulässige Weitergabe. Aber an sichtbaren und unsichtbaren Stellen wird der Käufer des E-Books als Wasserzeichen hinterlegt, sodass im Falle eines Missbrauchs die Spur zurückverfolgt werden kann.
Weitere Informationen finden Sie in unserer E-Book Hilfe.