Сегодня искусственный интеллект становится все более востребованным в самых разных отраслях человеческой деятельности. Нейронные сети постоянно учатся и предлагают все новые и новые возможности. Например, совсем недавно в Техасском университете ИИ научили преобразовывать в текст мозговую активность человека.
Испытуемый на протяжении нескольких часов слушал подкасты, после этого его мозг был исследован с помощью МРТ. Система семантического декодирования работает таким образом, чтобы она могла преобразовывать мысли человека в текст. Даже когда некоторые из испытуемых смотрели просто ролики без звука, нейросеть достаточно точно могла описать то, что происходит на экране. Само собой, рассматривать сгенерированный текст как точную стенограмму не стоит, но в то же время это позволяет фиксировать мысли и идеи. А примерно в половине случаев система способна считать мысли пользователя практически дословно.
Для декодера частично использовали модели уже существующих нейросетей, таких как ChatGPT от OpenAI, чат-бот Google Bard и Speechtext.ai. По утверждению исследователей, им удалось совершить действительно большой скачок, если сравнивать с тем, что было до этого. Так, они смогли получить работающую модель, которая позволяет декодировать язык с достаточно сложными идеями. Предполагается, что когда система станет более совершенной, ее можно будет использовать для того, чтобы помогать людям, утратившим способность разговаривать и набирать текст, например, тем, кто полностью парализован.
Стоит отметить, что попытки помочь пациентам с дегенеративными заболеваниями мозга предпринимаются не в первый раз, и ученым удавалось достичь определенных успехов в этой области. Например, искусственный интеллект фиксировал то, как мозг пациента реагирует на прочтение аудиокниг. После этого нейросеть преобразовывала мысли человека в текст. Такая модель имела способность декодировать до двух третей текста.
Более простым вариантом использования ИИ для работы с текстами является расшифровка аудио, которая имеет похожий принцип. Для этого используются специальные сервисы, которые позволяют получить качественные транскрипции аудиозаписей, для которых используется помощь искусственного интеллекта. Он способен работать со множеством языков и способен идентифицировать говорящих в диалоге и полилоге, при этом точность распознавания речи может достигать 96% в зависимости от сервиса.
Искусственный интеллект сегодня становится полноправным участником лингвистического процесса, упрощая очень многие работы, на которые раньше уходили часы или которые были совершенно невозможными. В современных условиях работа с искусственным интеллектом — это именно то, что позволяет развивать многие сферы. Например, многие компании внедряют в своей работе языковые модели, которые позволяют автоматизировать бизнес-процессы, и это внедрение проходит успешно, например, ИИ можно поручить извлечение информации из разных источников.





