나무위키 MDict
1. 개요
나무위키 덤프로 만든 MDict 사전 파일이다. 이것을 이용하면 오프라인으로 위키를 열람할 수 있다.
이미 리그베다 위키의 전성기 무렵부터 만들어져 왔지만, 리그베다 위키 덤프 블로그가 2013년 문을 닫아서 2012년판이 최신이다.(리그베다)[1]
나무위키는 2015년 7월 12일 부로 Qewin의 블로그에서 데이터베이스 덤프를 이용해 오프라인 파일이 만들어지기 시작했다.
2016년 1월 경에 개발을 중지하며 변환기 소스를 제외한 파일을 모두 삭제했으나[2] 개발 재개 계획이 나왔었고,[3] 7월부터 JSON 에 맞춰 개조한 NamuWiki2HTML 로 변환한 5월 버전이 올라왔었다.
이후 Qewin은 NamuWiki2HTML C버전을 작성했었고. 이 이후 2016년 8월 12일(7월 덤프)부터는 제작자가 NamuWiki2HTML만 개발하고 MDict 파일 업로드는 다른 사용자[4] 가 하는 방식으로 진행되었다.
이후 qewin의 변환기가 제작자의 수험기간으로 인하여 연기되었다가 결국 추가 업데이트는 취소 되었고,
이에 다른 사용자가 새로운 파서인 biryo를 만들게 되었고
현재는 이를 이용하여 파일이 만들어 지고 있다.
참고로 해당 파서는 나무위키의 거의 모든 문법에 최적화 되어있어 변환후 오류가 적은편
추가로 새 버전이 나오면 최신 정보를 담고 있는 만큼 크기도 계속 커진다. 처음에는 900MB도 되지 않았으나 지금 2020년 3월 기준으로 biryo m3l 기준으로 2.94GB 내외다.
또한 이 파일은 나무위키 덤프에서 새로운 덤프가 나와야지만 업데이트가 가능하다.
새로운 버전이 필요하다면 운영자에게 업데이트를 건의해 보자.
2. 사용 방법
MDict를 사용해서 윈도우, 안드로이드, iOS, 윈도우 CE 등의 운영체제에서 나무위키를 오프라인으로 볼 수가 있다. 참고
ios는 mdict, 안드로이드는 mdict나 stardict 를 받아 하단의 데이터 파일을 기기에 넣고 경로를 지정하면 되고,
pc는 여기서 프로그램을 받아 하단의 데이터 파일을 받아
\doc 에 넣고 동일 경로의 mdict.cfg 파일을 지우고 실행하거나 데이터 파일이 있는 폴더 경로를 설정하면 실행 된다.
3. 데이터 파일
이전 데이터 파일은(2016년 8월까지) Qewin [5] 에서 다운받을 수 있었다.
이후 업데이트 된 파일은 하단의 링크 참조
2016년 1월 버전 : 이곳 또는 이곳
2016년 5월 버전 : 이곳 [6]
2016년 7월 버전 : 여기
2016년 8월 버전 : 여기 [7]
2016년 10월 버전 : 여기
2017년 03월 버전 : 여기
2018년 03월 버전 : 여기 또는 이곳
2019년 03월 버전 : 여기
2020년 03월 버전 : 여기
4. 장단점
- 장점
- 오프라인으로 나무위키가 가능하다. - 최대의 장점. 데이터가 부족하거나 없으면(항해/재난) 아주 유용하다.
- 배터리 소모량이 적다. - 데이터를 사용하지 않는다는 가정 하에
- [8] (~2020.04 이후 장병 휴대폰 사용 가능이후로는 거의 희석된 단점)
- 단점
- 원본보다는 밋밋해 보인다. - 간단한 HTML로 변환되어 있다. Biryo에서 그래도 상당히 깔끔해진편,
- 고용량이다. 오프라인이라 방대한 정보 베이스를 저장매체에 의존하려니 생기는 문제.
- 사진/동영상/음악이 안 나온다. - 덤프에 포함되지 않는다. 설사 포함되더라도 용량이 감당 못 할 정도로 매우 커지기 때문.
- 인터넷 링크는 표시되지 않는다. - 제작자가 오프라인이라는 이유로 임의로 제외시켰다.
- 덤프를 다시 한번 mdict에 맞게 코딩하는거라 덤프가 늦어지거나, 변환해주는 유저의 사정 등 갱신에 외부적인 영향을 많이 받는 편이고 정보의 신선도가 비교적 떨어지는 편.
- 수식이 지원 안된다.
- 해결된 단점
- 제작과정에서 상당량의 문서가 유실될 가능성이 높다. → 현재 biryo 버전에서는 해당문제가 상당히 개선되어 거의 해결된 단점.
- 가끔 html이 깨져 있다. → 온라인 문서는 오프라인 리더인 이상 반영 될 수 없지만, biryo에서 틀이나 특수링크가 대다수 작동[9] 했기 때문에 역시 거의 해결된 문제.
5. NamuWiki2HTML
나무위키 덤프를 MDX[10] 로 변환하기 위해 만든 프로그램. Github에 공개했다. 라이선스는 GNU GPL 2판.
5.1. NamuWiki2HTML Python
링크
Python으로 작성되었고, 변환 속도가 느려 Pypy를 쓰는 것을 권장하고 있다. 7월 28일 덤프까지는 이것을 이용해 만들어졌다. 2016년 1월 이후 개발자가 손을 놓으면서 거의 동시에 나무위키 덤프 형식이 JSON으로 바뀌었고, 그래서 6개월간 나무위키 MDict는 나오지 않았다. 7월 경에 JSON에 사용할 수 있도록 개조되었다. 개조 이후 뒷 문서가 잘리는 버그가 있으나, NamuWiki2HTML C버전을 개발하면서 개선을 '''포기'''했다. 현재 올라오고 있는 덤프는 NamuWiki2HTML Python 버전을 이용한 것이다.
2016년 1월 26일 기준 덤프를 Python 3.2.5에 호환되는 PyPy3 2.4.0를 활용하여 변환해 본 결과 큰 문제없이 변환된 것으로 보인다. 다만 구버전의 Mdxbuilder의 경우 김수한무~~돌돌이 '''문서의 제목이 너무 길어서''' mdx 파일로 변환시 '''오류를 뿜는다'''.
2016년 1월본 기준 일부 문서들의 각주에 해당 각주가 달린 부분의 뒷부분의 내용이 섞여들어가는 문제가 있는 상태이다.
5.2. NamuWiki2HTML C
링크
기능은 위와 동일하나 현재 개발 중인 C언어로 작성된 버전. '''특이하게도 멀티 스레드로 동작한다.''' Python 버전보다 변환 속도가 훨씬 빠르다. i3-6100H 노트북 기준으로 2~3분내외로 변환이 가능하다. i7-4690K 4.2GHz 오버클럭 상태에서는 1분 내외를 찍어주기도. 또 다른 특징으로는 디스크 부하가 커서 컴퓨터가 버벅거린다. 작업 관리자를 켜서 디스크 부하를 보면 하드디스크의 읽기/쓰기 최고 속도를 번갈아 찍는 것을 볼 수 있다.
이후 추가적인 업데이트가''' 전무한 상황'''이다.
6. biryo
링크
Scala로 작성되었으며, 현존하는 거의 모든 나무위키 문법을 지원하는 새로운 파서. 위 변환기의 잦은 오류에 절망하여 처음부터 새로 만들었다고 한다.
일단 전 버전보다 확실히 가독성 자체가 개선되었고, 틀 문서가 생성되기 시작하였다.[11] 그리고 문서가 깨지거나 유실된 게 거의 없다시피 할 정도로 급감되어 유실문서수가 매우 줄었다. 문서 오류도 줄어 표가 깨져서 온 화면이 표로 뒤범벅되는 문서가 없어졌다. 이래저래 눈에 띄는 발전을 보여주는 파서. 현존하는 파서중에 가장 안정되고 빠른 속도를 보여준다.
다만 사용법이 조금 복잡하여 처음 사용하는 경우 readme.md 문서를 꼭 읽으면서 하는 것을 권장한다.
[1] MUstar.KR 저장본 또는 Onedrive 2010년/2012년 [2] 출처 : mdx 변환 2월부터 중단하겠습니다.[3] 출처 : 나무위키 MDX 변환기를 새로 작성할 지 고민 중입니다. [4] 현재는 Livetrack이 블로그에서 제공하는 중이다. [5] 현재 페이지 삭제[6] 지금은 제공되지 않음[7] 관리 부족으로 인한 유실. 사본을 가지고 있다면 LiveTrack 블로그 에 알려주자. [8] 사실상 현 나무위키 MDict의 매우 큰 존재 의의 중 하나이며, CE기반 PMP 3신기 중 하나. 다른 2개는 에뮬레이터인 MorphGear와 2D 스크립터 기반 미연시 구동기인 온스크립터.[9] 틀은 문서로 링크된다..[10] 정확히는 mdxbuilder에 필요한 파일이다.[11] 물론 개발한계상 틀이 반영되지는 않지만, 그래도 생겼다는 거에 의의를 두는 편. 예를 들어 노래방관련 문서는 틀에 의존하는 문서들이 많은데, biryo 부터 틀이 반영되어서 열람이 가능해졌다.