Эксперты Google усовершенствовали программу по распознанию речи, которая работает на базе транскрипции голосовых сообщений в Google Voice. В предыдущем месяце было выявлено, что степень ошибок распознавания в Google Voice понизилась на целых 50%. Специалисты, которые занимались разработками, пояснили, как они смогли добиться таких результатов.

Google Voice стал на 50% точнее
Google Voice стал на 50% точнее

Экспертами была преобразована система транскрипции. Прежняя система базировалась на технологии общего машинного обучения, которая больше знакома как модель гауссовой смеси. Новоизобретенная вариация данной системы применяет иной вид искусственного интеллекта, а именно длинные рекуррентные нейронные сети кратковременной памяти.

Google для проверки брал за основу голосовые сообщения различных пользователей. Стоит отметить, что сообщения прослушивали исключительно компьютеры, которые выполняли свою работу под управлением алгоритмов машинного обучения. Благодаря этому получилось сформировать улучшенные акустические модели для распознавания данных.

За счет машинного обучения Google смог добиться показателя ошибок в распознавании речи в пределах всего 8%. Кроме того, что компания использовала обучение для данной системы, она произвела обучение и многих других своих предлагаемых сервисов, к числу которых относится и Google Переводчик.

Распознаватель Google Voice значительно улучшился и стал более точным, благодаря глубокому обучению, этот факт позволяет усилить конкуренцию с другим компаниям, которые занимаются транскрипцией речи, к примеру, Apple с Siri и Microsoft с Cortana.

Хочется упомянуть о том факте, что Stone Temple Consulting выпустил в свет интересное исследование еще в конце 2014 года. Оно базировалось на том, что было сопоставлено 3086 ответов на вопросы в Siri, Google Now и Cortana для того чтобы установить как каждый себя поведет по сравнению с другим. Победителям был признан Google Now, который дал больше точных и более развернутых ответов на поставленные вопросы.