Google Audio Search – bloße Idee oder tatsächlich bald Realität?
Immer wieder überrascht Google uns mit neuen Features. So vielleicht auch bei dem Thema Audio Search. Wird uns der Suchmaschinenriese es tatsächlich jemals ermöglichen, einen Index von Audioinhalten zu erstellen, welcher dann wie eine Website durchsucht werden kann?
Um diese Funktion jemals zu realisieren, hat Google bereits einige Tests durchgeführt – mit dem Ergebnis, dass die Umsetzung schwieriger ist als erwartet. Um festzustellen, wie Audios schnell und fehlerfrei transkribiert werden können, arbeiten Google und KQED mit KUNGFU.AI zusammen. Tim Olson, SVP für digitale strategische Partnerschaften bei KQED, hat Details in einem Blogartikel veröffentlicht und wir haben die wichtigsten Informationen für Sie zusammengefasst:
Die Schwierigkeiten der Google Audio Search
Die Tatsache, dass Audios zunächst in Texte konvertiert werden müssen, bevor sie durchsucht und sortiert werden können, ist derzeit das größte Hindernis. Hier gibt es aktuell noch keine Lösung, diese so zu transkribieren, dass sie schnell gefunden werden können.
Automatisierte Transkriptionen sind die einzige Möglichkeit, eine weltweite Audiosuche jemals möglich zu machen. Manuelle Transkriptionen würden den Verlagen zu viel Zeit und Mühe kosten.
Einschränkungen der aktuellen Speech-to-Text-Technologie
Bei bisherigen Tests wurden Einschränkungen bei der Fähigkeit der KI entdeckt, Eigennamen (auch als benannte Entitäten bezeichnet) zu identifizieren. Bei benannten Entitäten kann es sich beispielsweise um Musikgruppen, Events oder auch Personen handeln. Um diese genau zu identifizieren, muss der Kontext verstanden werden und genau hier liegt derzeit noch der Schwachpunkt der KI. Olson gibt in seinem Blogartikel ein Beispiel, wie das Problem in den USA aussieht:
“KQED’s local news audio is rich in references of named entities related to topics, people, places, and organizations that are contextual to the Bay Area region. Speakers use acronyms like “CHP” for California Highway Patrol and “the Peninsula” for the area spanning San Francisco to San Jose. These are more difficult for artificial intelligence to identify.”
Wird hier das Gesuchte nun falsch verstanden, ändert das den gesamten Inhalt der Suchergebnisse.
Wie sieht die Zukunft der Google Audio Search aus?
Die Arbeit an der Audiosuche wird fortgesetzt, um die Technologie weiter zu verbessern und die Ansprüche erfüllen zu können. Laut David Stoller, Partner Lead für News & Publishing bei Google, soll diese Technologie nach Abschluss des Projekts auch offen geteilt werden, sodass sie allgemein genutzt werden kann.
Der nächste Schritt besteht nun wohl darin, eine Rückkopplungsschleife zu testen, in der Nachrichtenredaktionen dazu beitragen, maschinelles Lernen zu verbessern und häufige Transkriptionsfehler zu identifizieren.
Wir dürfen also weiterhin gespannt bleiben, ob und wann es eine Google Audio Search geben wird. Was ist Ihre Meinung zu einer solchen Funktion? Hoffen Sie auf die Einführung oder sehen Sie sie als weniger notwendig? Lassen Sie es uns in den Kommentaren wissen!
Quelle: Search Engine Journal
Keine Kommentare vorhanden