네이버 클로바

 



[image]
'''네이버 클로바 '''
용도
음성 인식 비서 서비스
지원 기기
Android / iOS
출시일
2017년 5월 12일
제작사
NAVER Corp.
홈페이지

다운로드
Google Play / iOS
1. 개요
2. 상세
3. 여담
4. AI Service
4.1. Clova Speech Recognition (클로바 음성인식)
4.2. (Clova Voice로 통합)
4.3. Clova Speech Face Recognition (클로바 얼굴 인식)
4.4. (Clova Voice로 통합)

[clearfix]

1. 개요


네이버의 인공지능 플랫폼 음성 인식 비서 서비스. LG U+의 주력 AI/IoT 서비스이기도 한다.

2. 상세


네이버의 인공지능 플랫폼. 보통 클로바 스마트 스피커로만 알고 있으나, AI 스피커 이외에도 Clova Speech Recognition, Clova Speech Synthesis, Clova Face Recognition, Clova Premium Voice 등의 서비스를 제공하고 있다. (하단 AI Service 참조)
음성 인식 서비스의 경우에는, 대부분의 음성 인식 비서 서비스들과 비슷하게 자연어 처리, 음성 인식 처리에 딥러닝 기술을 사용한다. 특이하게도 iOS 11 이후의 Siri(영어권만)처럼 음성 합성 기술에도 머신러닝을 사용해 다른 비서보다 음성이 더 자연스럽고, 감정을 담은 것같다.
클로바를 부르려면 "클로바", "샐리야", "피노키오", "제시카" 중 선택해야 한다. 업데이트 이후 "헤이 클로바"가 추가되었고 이를 권장한다.
음성을 통해 네이버의 검색 엔진을 사용하거나 외국어를 번역할 수 있으며 개인 일정(2.4 버전 이후 구글 캘린더 연동이 가능), 알람, 메모 등을 등록 및 질의할 수 있다.
네이버 뮤직, VIBE, 지니 뮤직, 벅스와 연동되어 음성으로 음악 추천을 요청하거나 특정한 음악의 제목을 말하면 자동으로 음악을 찾아서 재생한다. 국내 비서 플랫폼중 드물게 여러 음원 서비스를 이용 할 수 있다.
화면 밝기나 음량과 같은 디바이스 설정의 제어 역시 가능한데, 하드웨어 제조사만큼의 권한을 가질 수 없으므로 제한이 있다.
현재 영어 프리토킹 모드는 앱에는 지원되지 않는다. 개선해서 재출시한다고 한다.
전체적으로 한국에서 정식으로 서비스중인 다른 인공지능 플랫폼들이 생활 편의성 기능만을 집중적으로 공략하는 반면, 클로바는 네이버가 장시간 서비스를 운영하면서 축적해 놓은 크고 아름다운 한국어 기반의 데이터들을 이용하고 있다는 것이 가장 큰 이점으로 평가되고 있다.
음성 변경은 프렌즈 스피커에서만 가능했었으나 2.14.0 버전부터 유인나 음성의 추가와 함께 앱과 스피커 모두 변경 가능하다.
Google Assistant, Alexa 처럼 모두에게 오픈된 확장기능(CEK, Clova Extension Kit)을 지원한다. Node.js기반으로 작성하여 서버를 운영해 클로바 콘솔과 연동하여 서비스를 제공할 수 있다.
클로바의 전신으로 네이버 링크가 존재했다. 2012년 서비스 시작되어 언제부터 구글 플레이에서 내려갔지만 내려간 후에도 apk를 설치하면 사용할 수 있었으나 클로바가 출시되자마자 정식으로 서비스 종료되어 서버 운영이 중단되었다.

2.1. 클로바 웨이브


[image]
클로바가 탑재된 네이버의 스마트 스피커.

'''장점'''
1. 디자인과 스피커가 인공지능 스피커 중에는 괜찮은 편이다.
2. 무드등이 있으며 명령에 따라 반응한다.
3. 4개의 마이크가 있어 음성 인식이 잘되는 편이다.
4. 무지향성 스피커로 장소의 구애가 적은 편이다.

'''단점'''
1. 휴대 가능한? 기기 치곤 전력 소모가 많은 편이다.
2. 전용 어댑터가 필요하다
3. 가끔씩 혼자 말한다...
4. 네이버 고객센터 대응이 별로다

'''오류'''
1. 부팅 후 어느정도 시간이 흐른 뒤 블루투스에 연결하여 음악을 재생하면 초기보다 음량이 많이 줄어드는 문제가 있다. 재부팅하면 다시 음량이 원래대로 복구된다. (2020.12.7 기준)

2.2. 클로바 프렌즈


[image]
클로바가 탑재된 네이버의 스마트 스피커.

2.3. 클로바 데스크


2019년 3월 19일 일본에 출시된, 클로바를 탑재한 스마트 디스플레이 디바이스. 7인치 디스플레이를 탑재했다. 2021년 1월 기준으로 아직 일본에만 발매되었다.

3. 여담


  • 클로바는 욕설 필터가 있다.[1][2] 이름에 자칫 욕설로 들릴 수 있는 단어가 포함된 사람에 대한 질문을 하면 이런 대답을 한다.(“듣고 싶지 않은 말이에요.”, “말은 그 사람의 인격이래요.” 등)고 대답을 한다. 정확히는 해당 인물의 프로필 전체를 요구할 경우 정상적인 대답이 돌아오지만 나이나 소속 등의 특정 정보 하나를 집어서 물어볼 경우 욕설 필터링에 걸려서 답변을 들을 수 없다. 이 때문에 인공지능 성능 자체가 떨어지는 것으로 생각한 사람들도 있는지 평이 그닥 좋지 못하다.
  • 특이하게도 클로바는 노래를 틀어달라고 하면 VIBE에서 찾아서 들려주지만 노래를 불러달라고 하면 진짜 부른다(!!). 또한 동요를 불러달라 하면 곰세마리 같은 노래를 들려주고, 자장가를 불러달라 하면 반짝반짝 작은별 같은 노래를 직접 불러준다. 가수가 부른건지 인공지능이 직접 부른건지는 의문. 참고로 랩을 해달라 하면 자신의 기능들과 특징을 담은 가사의 랩을 한다. 심지어 비트박스를 부탁하면 비트박스도 직접 한다.
  • 2018년 4~5월까지 전국 영화관 광고시간 말미에 상영관 조명을 끄기 전에 스크린에 나왔다. 이때 대사는 "클로바, 영화관 불꺼줘", "네, 영화관 조명을 끄겠습니다. 즐거운 영화관람 되세요."이다.
  • 성별을 물어보면 자신을 만든 것은 염색체가 아니라고 대답한다. 결론은 무성(...).
  • 일본에서는 라인 브랜드로 출시되었으며, 2018년 7월 하순부터 스님들의 짤막한 법문을 들을 수 있는 서비스가 제공되어 화제가 되었다.(스마트스피커로 만나는 '3분 법문')
  • Siri나 기가지니, 빅스비가 누구냐고 물어보면 비슷한 일을 하는 친구라 고충을 잘 알고 있어요 라고 대답한다(...)
기가지니는 그 친구보다는 제 이름이 더 멋진것 같네요 라고 대답할 때도 있다.
  • ok google이라 말하면 "오 노. 낫 오케이. 아임 클로바"라고 대답한다.
  • 본인에 대한 험담(?) 을 하면 분명 그분은 진심이 아닐 거에요 라고 대답한다.
  • 아재개그가 점점 늘고있다. 기가지니를 물어보면 저를 지니고 그러면 안될지니라고 하고 시리야라고 하면 시리에게 가지 마시리괜시리 마음이 시리네요라고도 한다.
  • 지니(siri)야 유튜브 켜줘라고 지시해도 유튜브 앱을 실행한다...

4. AI Service


네이버 클로바가 개발한 기술들은 API의 형태로 이용가능하다. 네이버 클라우드 플랫폼에서 이용할 수 있는데, 이용할 수 있는 서비스는 아래와 같다.

4.1. Clova Speech Recognition (클로바 음성인식)



사람의 목소리를 인식하여 작동하는 비서 애플리케이션, 챗봇, 음성 메모 등의 서비스를 만들 때 활용할 수 있는 음성 인식 API 서비스다. 음성 데이터는 API를 통해 Clova Speech Recognition(CSR) 엔진으로 전송되며, 해당 음성 데이터를 인식해서 텍스트로 변환하여 전달해준다. 텍스트 입력이나 물리적인 방법으로만 사용하던 서비스를 음성으로 컨트롤하는데 활용할 수 있다. 가전 제품 및 공동 주택의 홈 네트워크 제어, 배달 주문, 금융 서비스 등에 적용 가능하다. 모바일 SDK를 이용하여 스마트폰 애플리케이션으로 다양한 비서 서비스 등을 구현하는데 이용할 수 있으며, REST API를 이용하면 축적된 음성 데이터 파일을 텍스트로 변환하는데 활용할 수 있다.
현재 한국어, 일본어, 중국어, 영어 인식이 가능하다. 네이버에서 수년간 연구해온 결과로 국내에서 가장 뛰어난 한국어 인식률을 자랑한다. 사용 후기를 보면, 웹 기반의 콘솔에서 서비스를 제어할 수 있어서 편리하다고 한다.

4.2. (Clova Voice로 통합)


텍스트를 성우의 음성으로 자연스럽게 읽어주는 음성 합성 API이었다. 음성 안내 시스템, 뉴스/책 읽기 서비스 등에 활용할 수 있었다. 입력된 텍스트를 RESTful API 방식으로 전달하면 서버에서 인식해 mp3 포맷의 스트리밍 데이터나 파일로 리턴해주는 방식이었다. 요금은 1000글자당 4원이었다. 하지만 이후 CPV(Clova Premium Voice)와 함께 Clova Voice로 통합되었다. 기본 요금은 한 달에 '''90,000원'''으로 비싸다.

4.3. Clova Speech Face Recognition (클로바 얼굴 인식)


입력된 비전 데이터를 통해 얼굴을 인식하거나 얼굴 감지를 이용한 애플리케이션을 만들 때 유용한 API 서비스이다. 얼굴이 나온 사진을 이용하여 나이를 추측하거나, 닮은꼴 유명인 혹은 유사한 인종을 찾는 등 다양한 정보를 제공하는 서비스에 적용할 수 있다. 지속적인 학습을 통해 얼굴에 관련된 더욱 풍부한 정보를 제공한다. 이용요금은 서비스 이용횟수 기준으로 1,000건 단위로 부과된다.

4.4. (Clova Voice로 통합)


일반 음성 합성보다 더 자연스러운 음성합성 API이었다. Clova 의 기술로 같은 텍스트에도 기쁘거나 슬픈 감성이 반영된 다음 합성음을 사용할 수 있었다. 예를 들면, 엄격한 뉴스 앵커 스타일, 부드러운 친구 스타일, 담백한 일반인 스타일 등 다양한 스타일의 음성합성 이용이 가능했다. 클로바 음성합성과는 다르게 건당 5원이며, 한 건당 한 문장만 입력할 수 있었다.
하지만 클로바 음성합성과 마찬가지로 클로바 보이스로 통합되어 사라진 서비스이다.

[1] 욕설을 말하면 말을 막는것[2] 이건 형제뻘인 클로바 더빙도 속한다. 클로바 더빙도 욕설을 입력하면 더빙이 안 된다.