키워드 스터핑
1. 개요
[image]
Keyword stuffing
검색 엔진에서 높은 우선순위를 얻기 위해 웹 페이지에 특정 키워드를 고의로 다량 삽입하는 행위를 말한다. 검색 엔진의 색인을 조작해서 이득을 취하려는 여러 기법을 통틀어 스팸덱싱(Spamdexing)이라 하는데, 키워드 스터핑도 스팸덱싱의 일종이다.
2. 상세
많은 상거래 행위가 온라인으로 이루어지는 현 시장환경에서 포털사이트는 많은 영향력을 행사할 수 있다. 포털사는 검색시 상위에 노출되도록 돈을 받고 광고를 걸어주지만 소비자는 제휴광고라고 명시된 컨텐츠보다 자연스럽게 노출된 기업 사이트와 실제 사용자들의 후기를 더 선호한다. 이때 소비자가 좋아할 만한 광고를 만드는 것뿐만 아니라 검색 엔진이 좋아할 만한 광고를 만들 필요성이 생긴다. 이것을 노리는 전략을 SEO(Search Engine Optimization), 검색엔진 최적화라고 한다. 보통은 정직하게 태그를 알맞게 정리하거나 보안기준을 충족하는 식이지만 포털 사이트 가이드라인을 위배해도 현행법상 문제의 소지가 없기 때문에 의뢰받은 대로 실적만 올리면 장땡인 블랙햇 SEO업자들과 양심 없는 광고주들은 편법을 동원한다.
키워드 스터핑은 검색 엔진이 페이지 내용을 크롤링할 때 키워드 카운트가 높을수록 검색 정확도를 후하게 책정하는 점을 악용하는 것이다. 아래 서술된 여러 가지 방법으로 키워드를 꽉꽉 채워넣으면 그 내용이 유익한지 아닌지에 관계 없이 각종 포털, 검색 엔진에서 상위 노출될 가능성이 높아진다. 검색 엔진 역시 이에 대응해서 각종 최적화 기법을 개발하여 이런 페이지들을 검색 결과에서 제외하고 있다.
키워드를 쑤셔넣는 방법은 다양하지만 2010년대 이래 검색 엔진이 잘 발달되어 있어 이런 페이지들은 거의 모두 걸러진다.
- 단순히 본문에 키워드의 입력을 여러 번 반복
- 본문에 키워드를 포함하되 배경 색과 같은 폰트 색, 또는 이미지 뒤에 위치시키는 등 정상적인 페이지처럼 보이게 위장
- 메타 태그, 알트텍스트(alt-text), HTML 소스의 no frame 섹션 등 페이지 렌더링 시 출력되지 않는 부위에 키워드 다량 포함
2.1. 한국에서
한국 역시 2000년대 초중반에는 검색 엔진 로직이 정교하지 않아 키워드 스터핑된 쓰레기 페이지들이 사람을 자주 낚았다. 키워드 밀도가 비정상으로 높은 페이지를 쉽게 거르는 검색엔진을 속이기 위해서 단순히 한 단어를 반복하는 게 아니라 의미 없는 문장을 문맥에 맞지 않게 배열하고 그 사이에 광고단어를 끼워넣는 방식이 흔했다.예시 번역체로 보이는 부분도 있고 소설이나 비문학 글의 여러 문장을 토막내어 짜깁기한 흔적도 있으며 인코딩 문제였는지 한자나 각종 깨진 문자가 들어가 있기도 했다. 기만용 문장을 숨기려는 노력조차 없어서 대놓고 사기라고 알려주는 초보적인 수준이었지만 그걸 구분하지 못하는 봇을 속여 광고실적 쌓기엔 충분했고, 사기인 걸 못 알아보는 부주의한 인간들까지 속이는 효과도 있었다. 첨부된 파일은 별도로 첨부하기도 하지만, 텍스트에 하이퍼링크가 포함되는 경우도 많은데 보통 다운로드 매니저라는 이름으로 설치를 유도해 애드웨어를 감염시켰고 링크는 쇼핑몰이나 웹하드에 연결되는 일이 흔했다.
당시를 추억하는 사람들은 낚시 당했던 그 때의 기억을 살려 이를 재현한 드립글을 커뮤니티에 가끔 올리곤 한다. 제목은 같은 커뮤니티 유저들이 솔깃할 만한 파일이나 토렌트 링크 등을 나눠주겠다는 식으로 적절히 짓고 본문은 어디서 많이 본 사진 한 장과 키워드 스터핑으로 메우는 것이다. 키워드 스터핑을 기억하는 유저들은 "제가 찾던 ○○○ 여기 있었네요 ^^ 감사합니다~" 또는 "잘 받아가요" 등의 댓글로 동조해 준다.#1 #2
간첩 블로그, 라조육이사이 괴담이 이와 연관되어 있다.
3. 기타
키워드 스터핑을 걸러내는 검색 엔진들의 로직은 가끔 그럴 의도가 없는 작성자들에게 적용될 때도 있다. 방문자, 구독자, 페이지 뷰가 중요한 블로거나 온라인 신문 운영자들은 이런 불상사를 피하기 위한 노하우를 공유하기도 한다.#