음성 인식기술을 이용하면 음성언어를 문자열로 변환할 수 있다.
단순히 입력받은 문자를 화면에 뿌려주는 것이다.
남자 두 명과 여자 한 명이 지금 동시에 말하고 있는 경우 각각의 특징을 분석해서
언어를 따로 따로 담아내고 화면에 각각 뿌려준다.
사용자는 그 중에서 자기가 관심있는 말소리를 클릭하여 집중하고,
인식률을 높이고 컴퓨터 더 적은 과정으로 처리 가능하게 한다.
그리고 원하면 그 말소리가 누구것인지 id를 부여할 수도 있다.
관건은 잡음이 많고, 여러사람이 동시에 말할 수도 있는 환경에서 어떻게
정확히 말의 내용을 담아낼 수 있느냐이다.
잡음처리의 경우 이미 많은 기관에서 연구해오고 있다.
기본적으로 음성정보든 영상정보든 특징을 잡아내고 분석하는 것은
확률적인 방법을 사용한다. 특히 수학자들의 역할이 기대되는 부분이다.