В Китае представили первый в мире новостной выпуск, который читал цифровой ведущий, созданный на основе искусственного интеллекта (ИИ). Как пояснили разработчики, достаточно загрузить в программу видео с живым человеком, после чего ИИ самостоятельно проанализирует его мимику, манеру говорить, жестикулировать, а также голос и эмоции. Затем на основе видео будет создана цифровая модель, которую в виде голограммы можно использовать для создания телепередачи. Такому цифровому ведущему перед записью эфира необходимо лишь загрузить готовый текст, после чего голограмма сама его зачитает, копируя жесты и мимику реального "исходного" образа.

 

Для премьеры программы был выбран образ популярного китайского телеведущего Цю Хао. Разработчики отмечают, что такие "искусственные" телеведущие способны работать 24 часа в сутки и без выходных. Программа не может допустить оговорку или другую ошибку, свойственную человеку, поэтому любой сюжет готов с одного дубля.

"Перспективы у технологий ИИ очень радужные, - комментирует Кирилл Петров, управляющий директор Just AI. - Во многих областях они начинают постепенно заменять людей, например, в контакт-центрах или в управлении автомобилем. Разговорный ИИ, системы синтеза и распознавания речи и машинного обучения широко используются в виртуальных ассистентах, таких как Алиса от "Яндекса". А умные колонки уже давно зачитывают своим владельцам новости из разных медиа".

Не угроза ли это живым людям, которые сейчас ведут эфиры, в том числе на телевидении и радио? По мнению Петрова, китайская разработка - это скорее интересная демонстрация возможностей технологии. Пока системы синтеза речи не способны в полной мере передать всю эмоциональную окраску, присущую живому языку, а системы генерирования естественного языка все равно берут за основу тексты, подготовленные людьми. ИИ не умеет мыслить, он может лишь имитировать или казаться умным. "В обозримом будущем я не ожидаю, что подобные технологии смогут заменить профессию, скажем, журналиста или ведущего - они не смогут передать эмоции, подстроиться под непредсказуемость обстоятельств или стихийное развитие диалога, - говорит Петров. - Однако если говорить просто о зачитывании заранее подготовленного текста, телеканалы или медиаблоги вполне могут использовать ИИ и 3D-моделирование в качестве интересной фишки для аудитории. Собственно, в какой-то мере многие это уже делают".

Юлия Кривошапко

Источник: Российская газета