Denne teknologien gir deg muligheten til å snakke flytende kinesisk

Og det er en gammel kjempe som leder an.

Hei, denne artikkelen er over ett år gammel og kan innholde utdatert informasjon

(Dagbladet): Talegjenkjennende programvarer har vært en viktig, men litt saktegående prosess i teknologien de siste 60 årene.

Apple har så langt vært ledende med sin talgjenkjennende, personlige assistent «Siri», som ved å gjenkjenne brukerens naturlige tale, skal være i stand til å gjennomføre oppgaver som å skrive meldinger og avtale møter.

«Siri» stiller også spørsmål hvis den trenger mer informasjon for å fullføre en oppgave.

Men nå presenteres det som kan være et nytt gjennombrudd innen talegjenkjenningstekonologien.

Den er det Apples hovedkonkurrent Microsoft som står bak.

Oversetter både muntlig og skriftlig Og Microsoft tar samtidig det hele ett skritt lenger.

For deres nye talegjenkjenning innebærer også teknikken «Deep Neural Networks», som gjør det mulig å ikke bare gjenkjenne brukerens stemme, men også oversette den fra et språk til et annet.

Rick Rashid, leder i Microsoft Research, demonstrerte denne nye teknologien i Tianjin i Kina i slutten av oktober da han gjestet konferansen «Microsoft Research Asia's 21st Century Computing».

Der viste han først hvordan teknologien sørget for å oversette alt han sa både til skriftlig engelsk og kinesisk.

Deretter viste han hvordan teknologien også oversatte det han sa fra muntlig engelsk til muntlig kinesisk - med hans stemme.

- Lovende, men ikke perfekt «Denne teknologien er veldig lovende, og i løpet av noen få år håper vi at vi er i stand til å bryte ned språkbarrierene mellom mennesker. Personlig tror jeg dette kommer til å lede til en bedre verden,» sa Rashid, både på engelsk og kinesisk under foredraget sitt.

På sin blogg skriver Rashid at forskere ved Microsoft Research og University of Toronoto fant ut at ved å bruke Deep Neural Networks-teknikken, var de i stand til å skape strengere og bedre talegjenkjennelser enn tidligere metoder har gjort.

«Vi har nå greid å redusere ordfeil med over 30 prosent sammenliknet med tidligere metoder. Det betyr at i stedet for at hvert fjerde av femte ord oversettes feil, er nå bare hvert syvende av åttende ord feil,» skriver han på bloggen sin.

Rashid er tydelig på at teknologien fortsatt ikke er perfekt.