[아이뉴스24 윤소진 기자] “꽁꽁 얼어붙은 한강 위로 고양이가 걸어 다닙니다.”
SNS 상에서 인기를 끌고 있는 밈(meme)으로, 몇 년전 강추위를 표현한 한 뉴스 기자의 멘트다. 이 멘트를 이스트소프트의 AI휴먼 동영상 제작 서비스 ‘AI 스튜디오 페르소’를 활용해 짧은 영상으로 만들어봤다. AI 아나운서가 화면에 띄워진 이미지를 음성으로 직접 설명하는 형태다.
영상에 띄워진 이미지 역시 카카오브레인의 AI 이미지 제작 서비스 ‘칼로’를 통해 제작했다. ‘한겨울 한강 위를 걷는 고양이’라는 프롬프트를 입력하면 이 이미지와 비슷한 사진 여러 장이 순식간에 만들어진다.
7초가량의 짧은 영상을 만드는 데 채 3분도 걸리지 않았다. 비용은 무료다. 일상에서 누구나 손쉽게 AI휴먼 기술을 활용한 고품질의 콘텐츠를 제작할 수 있게 된 것이다.
생성형AI 기술의 발전으로 챗봇, 음성인식 등 대화형AI 서비스는 빠르게 진화하고 있다. 제주도·경북·상주 등 지역 뉴스의 ‘월급 60만원, AI 아나운서’가 이목을 끌었으며, 백화점에서 AI직원이 다국어로 고객을 응대하는 서비스도 등장했다.
이에 관련 기술을 보유한 AI기술 기업들의 서비스가 국내외 시장에서 큰 관심을 받고 있다. 과거에는 기업이 막대한 비용을 들여 자체 AI모델을 구축했다면, 현재는 서비스형 소프트웨어(SaaS) 형태로 수익모델도 변화하는 모습이다.
최근 AI 서비스 전문기업 이스트소프트는 ‘구독형 AI 휴먼 서비스’를 글로벌 시장에 론칭했다. AI 휴먼 영상 제작 서비스 ‘AI 스튜디오 페르소’와 실시간 대화와 통역을 지원하는 대화형 AI 휴먼 서비스 ‘페르소 라이브’ 2종이다.
페르소 라이브는 거대언어모델(LLM)이 결합한 대화형 AI 서비스로 100개의 언어를 지원한다. 실시간 대화는 물론 고도화된 통역 서비스로 활용도가 높다. 두 서비스는 MS 애저를 기반으로 작동한다. 제공 방식은 △SaaS △응용프로그램 인터페이스(API) △소프트웨어 개발 키트(SDK)로 구성됐다.
생성형 AI 전문 기업 딥브레인AI는 음성으로 대화하는 ‘AI 휴먼 안내 서비스’를 현대백화점 더현대 서울 지점에 도입했다. 스마트폰으로 QR코드를 스캔하면 가상의 직원이 등장해 정보를 안내하는 방식이다. 안내데스크, 무인물품보관함 등 다양한 위치에서 QR코드를 스캔한 뒤 문의 사항을 말하면, 질문에 대한 답변을 실시간으로 전달받을 수 있다. 영어, 중국어, 일본어 총 3개 언어를 지원한다.
이 밖에도 교육, 마케팅, 엔터테인먼트 등 AI휴먼 서비스의 활용 영역은 빠르게 확산할 전망이다. 업계 한 관계자는 “AI 업계의 떠오르는 키워드는 ‘멀티모달’이다. 사용자의 요구에 따라 텍스트를 음성, 또는 영상으로 자유롭게 변환하는 기술이 발전하면서 관련 산업도 빠르게 성장할 것”이라며 “영역의 전문화와 구독형 모델의 등장으로 시간과 비용 모두 효율성이 높아졌으며, 특히 AI휴먼 서비스는 구동할 수 있는 디바이스만 있으면 누구나 이용할 수 있어 확장 기대감이 높다”고 설명했다.
댓글0