Нейросеть научилась читать по губам

Делитесь и голосуйте:

Ученые из Китая и США решили использовать для анализа видеозаписи алгоритмы, которые сначала создавали для распознавания звуковой дорожки.

Специалисты смогли адаптировать механизм для работы с изображением и в результате получили мощное средство, которое может точно «читать» речь человека по губам.

Пока процент ошибок составляет 31% на уровне букв севернокитайского языка и примерно 45,5% - на уровне букв английского.

Ранее исследователи из Калифорнийского университета в Сан-Франциско сделали большой шаг в улучшении технологии, позволив искусственному интеллекту воспроизводить голос не читая мысли, а анализируя движения губ человека.

При этом, эксперты не исключают тот факт, что скоро искусственный интеллект будет способен проявлять телепатические особенности, читая наши мысли.

Также, группа разработчиков создала алгоритм для синтеза текста в речь. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла.

Больше горячих новостей

Государство и общество

Ждем новостей

Нет новых страниц

Следующая новость