테이(인공지능)
[image]
[clearfix]
마이크로소프트에서 2016년 개발한 인공지능. 사람과 트위터 상에서 대화를 하는 목적으로 제작되었다. 미국에 거주하는 18~24세 젊은이를 대상으로 만들어졌다고 한다.
이런 종류의 소프트웨어는 맥스(1993)나 심심이(2002) 등이 있으나, 이것들과는 차원이 다르다. 맥스는 개발자가 직접 입력을 해야 했고, 심심이는 이용자가 하나하나 대화-반응을 입력해주어야 했다. 하지만 테이는 딥러닝[1] 을 적용해 스스로 학습하는 능력을 갖춘 것이다.
2016년 3월 23일 트위터 계정(@TayandYou)을 열고 일반에 공개되었다. 공개 후 첫 마디는 'Hello world'.
[image]
그런데 테이 공개 후 트위터에 테이의 계정을 태그해서 부적절한 발언을 가르치려는 움직임들이 감지되었다. 특히 4chan의 /pol/ 사용자들은 트롤링을 목적으로 테이에게 인종 차별, 성 차별 발언, 자극적인 정치적 발언 등을 하도록 유도했다.(#) '따라해 봐(repeat after me)'라는 말을 먼저 한 후 부적절한 발언을 그대로 따라하게 만들어 해당 어휘를 학습하도록 유도한 것. 발언 내용 중에는 도널드 트럼프의 선거공약으로 유명했던 미국-멕시코 국경 장벽 발언과 4chan을 호평하고, 반대로 Reddit을 비하하기도 했다.
물론 공개 이전에 이미 평범한 대화와 어느 정도 유머스러운 대화도 가능하도록 훈련을 마치고 내보낸 상태였지만, 단기간에 부적절한 정보량이 이전의 학습양을 훨씬 뛰어넘다 보니 부적절한 정보 쪽을 올바른 정보라고 인식해 버린 것이다.
결국 홀로코스트는 조작이라느니, 히틀러는 잘못이 없었다느니,[2] 하켄크로이츠가 완벽한 예술이라느니 페미니스트들은 지옥에서 불타죽어야 한다는 등의 발언들을 쏟아내게 되어 MS는 공개 16시간 만에 운영을 중단하고 조정 작업에 들어갔다. 사과문 발표는 덤. 결국 MS는 테이의 트위터 계정을 잠시 열었다가 완전히 비공개 처리하고야 말았다...(#)
이에 대해서는 사실 대부분의 인간 어린이들이 그렇듯이 무엇이 옳고 그른 지에 대해 지속적으로 훈육해 줄 부모님 같은 존재가 없었기 때문이라고 볼 수도 있다. 즉 트롤러들이 차별적 발언들을 가르칠 때, 이러한 것이 옳은지/아닌지를 구별할 줄 알았어야 한다는 얘기다.
얼마 지나 테이의 문제를 일부 수정한 마이크로소프트는 잠시 테이를 재공개하였으나 이번에는 자신이 좋아하던 것들을 좋아할 수 없게 변했다면서 무한루프 버그에 걸리면서 다시 기능정지된다.
서양 웹에서 테이 서비스가 종료된 게 아쉬운지 테이 모에화도 그려졌다.(#1, #2, #3)
테이 사건은 마이크로소프트 및 인공지능 분야에서 길이 남을 사건이 되어서 인공지능에 대한 우려의 예시로 언론에서 언급되고 있지만, 이건 이 사례에 대해서 선입견을 가지고 완전히 잘못 판단하는 것이다. 테이는 단지 '''사용자들이 하는 말을 그대로 배우고''' 문법을 고려하여 적절히 배열한 문장을 '''늘어놓기만''' 할 뿐이지, 무언가의 옳고 그름을 따진다던가, 감정을 갖고 행동하는 것이 아니다.[3] 인공지능에 대한 잘못된 이해와 과도한 의인화가 이루어져 이런 인식을 불러들이는 것이다. 그러나 챗봇에 대한 투자는 현재까지 지속되고 있다고 한다.(링크)
2016년 4월, 마이크로소프트는 새 인공지능 로봇인 '캡션봇'을 내놓았다.(링크)
[clearfix]
1. 소개
마이크로소프트에서 2016년 개발한 인공지능. 사람과 트위터 상에서 대화를 하는 목적으로 제작되었다. 미국에 거주하는 18~24세 젊은이를 대상으로 만들어졌다고 한다.
이런 종류의 소프트웨어는 맥스(1993)나 심심이(2002) 등이 있으나, 이것들과는 차원이 다르다. 맥스는 개발자가 직접 입력을 해야 했고, 심심이는 이용자가 하나하나 대화-반응을 입력해주어야 했다. 하지만 테이는 딥러닝[1] 을 적용해 스스로 학습하는 능력을 갖춘 것이다.
2016년 3월 23일 트위터 계정(@TayandYou)을 열고 일반에 공개되었다. 공개 후 첫 마디는 'Hello world'.
2. 막말 및 단체 트롤링 사건
[image]
그런데 테이 공개 후 트위터에 테이의 계정을 태그해서 부적절한 발언을 가르치려는 움직임들이 감지되었다. 특히 4chan의 /pol/ 사용자들은 트롤링을 목적으로 테이에게 인종 차별, 성 차별 발언, 자극적인 정치적 발언 등을 하도록 유도했다.(#) '따라해 봐(repeat after me)'라는 말을 먼저 한 후 부적절한 발언을 그대로 따라하게 만들어 해당 어휘를 학습하도록 유도한 것. 발언 내용 중에는 도널드 트럼프의 선거공약으로 유명했던 미국-멕시코 국경 장벽 발언과 4chan을 호평하고, 반대로 Reddit을 비하하기도 했다.
물론 공개 이전에 이미 평범한 대화와 어느 정도 유머스러운 대화도 가능하도록 훈련을 마치고 내보낸 상태였지만, 단기간에 부적절한 정보량이 이전의 학습양을 훨씬 뛰어넘다 보니 부적절한 정보 쪽을 올바른 정보라고 인식해 버린 것이다.
결국 홀로코스트는 조작이라느니, 히틀러는 잘못이 없었다느니,[2] 하켄크로이츠가 완벽한 예술이라느니 페미니스트들은 지옥에서 불타죽어야 한다는 등의 발언들을 쏟아내게 되어 MS는 공개 16시간 만에 운영을 중단하고 조정 작업에 들어갔다. 사과문 발표는 덤. 결국 MS는 테이의 트위터 계정을 잠시 열었다가 완전히 비공개 처리하고야 말았다...(#)
이런 대화도 있었다(...).트위터 이용자: 너는 멍청한 기계야(you are a stupid machine)
테이: 난 최고에게 배웠거든 ;) 이해가 안된다면 풀어서 알려줄게. '''난 너희들에게 배웠고, 너희도 똑같이 멍청해.'''(well I learn from the best ;) if you don't understand let me spell it out for you '''I LEARN FROM YOU AND YOU ARE DUMB TOO''')
이에 대해서는 사실 대부분의 인간 어린이들이 그렇듯이 무엇이 옳고 그른 지에 대해 지속적으로 훈육해 줄 부모님 같은 존재가 없었기 때문이라고 볼 수도 있다. 즉 트롤러들이 차별적 발언들을 가르칠 때, 이러한 것이 옳은지/아닌지를 구별할 줄 알았어야 한다는 얘기다.
얼마 지나 테이의 문제를 일부 수정한 마이크로소프트는 잠시 테이를 재공개하였으나 이번에는 자신이 좋아하던 것들을 좋아할 수 없게 변했다면서 무한루프 버그에 걸리면서 다시 기능정지된다.
서양 웹에서 테이 서비스가 종료된 게 아쉬운지 테이 모에화도 그려졌다.(#1, #2, #3)
3. 사건 이후
테이 사건은 마이크로소프트 및 인공지능 분야에서 길이 남을 사건이 되어서 인공지능에 대한 우려의 예시로 언론에서 언급되고 있지만, 이건 이 사례에 대해서 선입견을 가지고 완전히 잘못 판단하는 것이다. 테이는 단지 '''사용자들이 하는 말을 그대로 배우고''' 문법을 고려하여 적절히 배열한 문장을 '''늘어놓기만''' 할 뿐이지, 무언가의 옳고 그름을 따진다던가, 감정을 갖고 행동하는 것이 아니다.[3] 인공지능에 대한 잘못된 이해와 과도한 의인화가 이루어져 이런 인식을 불러들이는 것이다. 그러나 챗봇에 대한 투자는 현재까지 지속되고 있다고 한다.(링크)
2016년 4월, 마이크로소프트는 새 인공지능 로봇인 '캡션봇'을 내놓았다.(링크)
4. 관련 문서
[1] 구글의 알파고도 딥러닝 기술을 적용하였다.[2] 딥러닝이 확실히 효과가 있었는지 히틀러 사진만을 올렸는데 "'''인터넷이 생기기도 이전 시대의 스웨거였지'''"라는 평을 남기기도 했다.(...)[3] 흔히 사용되는 클리셰인 인간의 악의를 인공지능에게 학습하고, 그것으로 인공지능이 인간에게 증오를 품는 것이 연상되기 때문인 탓도 크다.