대통령기록관 홈페이지로 이동합니다
33호 4월 15일

생활길라잡이 추천 리스트 프린트

연희연 독자 (인천만석초등학교 / 6학년)

추천 : 86 / 조회수 : 112

뉴스 공유하기 C
					로그 미투데이 트위터 Facebook

내 말을 알아 듣는 똑똑한TV

우리가 가끔 인터넷TV(IPTV)로 영화를 보고 싶을 때 어떤 영화를 보아야 하는지 내가 좋아하는 주인공이 나오는 영화가 무엇인지 검색하기가 힘들 때가 있다. 하지만 이런 불편이 곧 사라질 전망이다. 보고 싶은 영화나 드라마 제목을 말하기만 하면 자동으로 찾아주는 기술이 국내에서 개발됐기 때문이다. 말(음성)로 작동하는 TV 시대가 멀지 않았다는 얘기다.


한국전자통신연구원(ETRI)은 3일 KT중앙연구소 가온미디어 등과 공동으로 시청자가 보고 싶은 영화나 드라마 제목, 출연자의 이름, 장르 등을 말하면 해당 콘텐츠를 검색해서 찾아주는 ‘음성인식 IPTV시스템’을 개발했다고 밝혔다.


리모컨에 있는 마이크에 특정 단어를 말하면 IPTV와 연결된 셋톱박스에 내장된 음성인식 소프트웨어가 작동해 원하는 콘텐츠를 찾아주는 방식이다. 그 동안 네내비게이션 등에 음성인식 기술이 적용돼 왔으나 TV 조작에 음성 인식 기술이 적용된 것은 이번이 처음이다. ETRI는 하반기 중에 음성인식을 지원하는 셋톱박스 20여대를 제작해 일반인을 대상으로 시험 가동할 계획이다.


이번에 개발한 음성인식 소프트웨어는 50만개의 단어를 고속으로 인식할 수 있으며 인식 정확도는 92% 수준이다. 현재는 한국어와 영어만 인식할 수 있으나 일본 중국어 등의 인식 기술도 개발 중이다. 이 소프트웨어는 특정 단어만을 인식하는 데 그치지 않고 테마 별 검색도 가능한 것이 특징이다. 이윤근 ETRI 음성처리연구팀장은 "음성인식 기술을 활용하면 노인이나 어린이들도 손쉽게 IPTV를 조작할 수 있게 된다"고 말했다. (한국경제신문인용)


이 프로젝트에 참여하신 이윤근팀장님(yklee@etri.re.kr)과의 인터뷰 내용이다.


Q: "ETRI"는 어떤 일을 하는 곳인가요?

A: ETRI는 우리말로 "한국전자통신연구원" 이고요, 주로 통신, 방송, 컴퓨터, 디지털콘텐츠, 전자부품 등에 관한 첨단 기술을 연구 개발하는 조직입니다. 1976년도에 설립된 이래 약 30여년간 우리나라가 세계 속의 정보통신 강국으로 도약하는데 중추적인 역할을 해 온 국내 최대의 정보통신 정부출연 연구기관입니다.


Q: "IPTV"는 일반 TV와 어떤 점이 다른 점은 무엇이고 일반 TV에는 적용할 수 없습니까?

A: 일반 TV는 방송국에서 전파를 통해 각 가정에 전송하는 프로그램을 시청할 수 있는 장치입니다. 따라서 시청자가 원하는 프로그램을 원하는 시간에 시청할 수는 없고, 방송국의 프로그램 편성 일정에 따라서 시청해야만 합니다.

IPTV는 IP(Internet Protocol) 즉, 인터넷 망을 이용하여 프로그램이 각 가정으로 전달됩니다. 마치 우리가 컴퓨터를 인터넷에 연결하여 동영상 등을 보는 것과 유사하다고 생각하시면 됩니다. 그렇기 때문에 시청자는 원하는 시간에 원하는 프로그램을 선택해서 볼 수 있는 장점이 있습니다. 그리고 제공하는 프로그램도 일반 TV에 비하여 매우 방대합니다. 이 방대한 프로그램 중에서 자신이 원하는 프로그램을 손쉽게 찾기 위해서 음성인식 기술을 적용한 것입니다.일반 TV는 앞서 말씀드린 바와 같이 프로그램이 방송국에 의해 결정되어 있기 때문에 사용자가 선택하여 시청하는 것이 불가능하므로 이러한 기능을 적용할 필요가 없습니다.


Q : 음성인식sw의 과학적 원리는 무엇입니까?

A: 음성인식 기술은 사람의 귀의 역할을 컴퓨터가 수행할 수 있도록 해주는 기술입니다.

사람의 말은 자음과 모음과 같은 음소의 조합으로 이루어져 있고, 각각의 음소를 발성할 때는 고유한 입과 혀의 위치, 모양 등에 의해 고유의 소리가 만들어지는데 이에 따라 각 음소들은 고유한 주파수 특성을 가지게 됩니다. 마치 악기들이 고유한 주파수 특성에 의해 고유한 음색을 갖는 것과 유사한 것이죠.


사람의 귀는 이러한 말소리의 주파수 특성을 분석하여 어떠한 음소의 조합인지 찾아내는 역할을 하는데, 이와 유사한 기능을 컴퓨터가 수행하는 것이 곧 음성인식 기술입니다. 즉, 사람이 말을 하면 컴퓨터에 장착된 마이크가 말소리를 전기적 신호로 바꾸어 이를 컴퓨터가 주파수 분석을 하여 음소의 조합을 알아내어 인식하는 과정이 되겠습니다.

“유비쿼터스” 시대를 맞아 이제 이 시스템이 모든 분야에 적용이 된다면 40명의 도적이 알리바바에게 더 이상 자기들이 감추어 놓은 보물을 빼앗길 필요가 없을 것이고 가정에서 리모콘을 잃어 버려서 헤매지 않아도 되는 “디비디바비디브” 내 음성 한마디에 모든 것이 움직이는 시대가 열린 것이다.

인터뷰에 응해 주신 이윤근팀장님께 감사드린다.

연희연 독자 (인천만석초등학교 / 6학년)

추천 리스트 프린트

 
 

 

렌즈속세상

놀이터

[책 읽는 세상] 4월 추천도서 교보문고


Template_ Compiler Error #10: cannot write compiled file "/web/webapp/data/ipress/iprdata7/e3/school.president.go.kr_paper/template/kr/_compile/group/46/1/bottom.htm.php"