Идентификация человека по голосу — один из традиционных способов распознавания, применяемый повсеместно. Можно легко узнать собеседника по телефону, не видя его. Также можно определить психологическое состояние по эмоциональной окраске голоса. Так как голосовая идентификация бесконтактна и не требует от человека особых усилий, ведутся работы по созданию голосовых замков и систем ограничения доступа к информации. Интерес в этой области связан еще и с прогнозами повсеместного внедрения голосовых интерфейсов.
Распознавание человеческого голоса — это процесс преобразования акустического сигнала в некую абстрактную форму разговорного языка. Он состоит из этапа преобразования голоса в текст и из этапа автоматической интерпретации семантики речи.
Десятилетиями ученые и инженеры искали способы, которые позволили бы людям общаться с компьютером так же, как они общаются между собой, а не заставлять пользователей приспосабливаться к языку, который понятен машине. Понятно, что речь — это самое прямое, непосредственное и интуитивное средство общения между людьми, которое могло бы быть мостом между человеком и машиной. Одной из основных целей машинного автоматического распознавания голоса (речи) является создание ориентированного на человека интерфейса компьютерных систем.
< ... >