Backblaze

 

[image]
https://www.backblaze.com/
1. 개요
2. Personal Backup
2.1. 특징
2.1.1. 철저한 보안
2.1.2. 안전한 서버 관리
2.1.3. 속도
2.1.4. 쉬운 접근성
2.1.5. 데이터 배달(?)
2.2. 가격
3. Business Backup
4. B2 Cloud Storage
4.1. 특징
4.2. 가격
4.3. 업로드 방법
5. 주의사항
6. 하드드라이브 고장률 통계
7. 여담


1. 개요


Backblaze는 백업 전문 클라우드 스토리지이다. 제공방법과 가격에 따라 Personal Backup, Business Backup, B2 Cloud Storage 세가지 서비스로 나뉜다.
'''Personal Backup''' 서비스의 경우 용량 제한은 없으며, 15일의 무료 체험 기간이 있다. (무료체험 이후 유료) 또한, 자동 또는 수동으로 내용을 백업할 수 있도록 설정할 수 있다. 그러나 NAS등 네트워크 드라이브의 자료는 백업할 수 없다.[1] 이걸 허용할 경우 얼마든지 여러 사람의 PC를 한 계정에 몰아서 악용할 수 있기 때문에 단순히 사업적인 측면에서 막아둔 것이라고 한다. 그 대신 한 대의 컴퓨터에 물려 있기만 하다면 외장하드건 뭐건 수십 TB건 개의치 않고 같은 가격으로 백업해준다. 유튜버들이 자기 백업 PC를 통째로 올려서 쏠쏠하게 써먹는 듯.
'''B2 Cloud Storage'''의 경우에는 10GB의 무료 용량을 제공한다. 자세한 사항은 아래를 참고 할 것.
Windows XP 이상, Mac OS X 10.5+ 에서 사용 가능하며, 아이폰,아이패드,안드로이드 앱도 지원한다.
영어, 프랑스어, 독일어, 이탈리아어, 포루투갈어, 러시아어, 스페인어, 중국어(간체), 중국어(번체), 일본어, '''한국어''' 를 지원한다.


2. Personal Backup



2.1. 특징


보통의 클라우드처럼 파일을 선택해서 올리는 방식이 아니라 macOS의 타임머신과 같은 기능을 한다. 시스템에 연결되어 있는 장치만 백업이 가능하며[2] 장치가 사라지면 파일이 삭제된 것으로 간주하고 보관기간이 지나면 Backblaze 서버에서도 사라지게 되므로 주의, 보관기간이 끝나기 전에 장치를 다시 연결하면 보관기간이 다시 늘어난다.

2.1.1. 철저한 보안


사용자 데이터를 보호하기 위해 AES 암호화SSL의 조합을 이용한다. 뿐만 아니라 모든 사용자가 별도로 지정한 개인 키를 사용하여 암호화시켜 Backblaze 서버 내에 저장 할 수 있다. 보다 더 안전하지만 사용자 본인도 키를 분실할 경우, 복호화 할 수 있는 방법이 없다고 한다. 그렇기 때문에 정부의 압수수색이라든가 데이터 유출로 부터 비교적 안전하다고 한다. 더 자세한 정보를 알고싶다면 여기를 읽어보자.
또한 로그인을 할 때 휴대폰으로 6자리의 인증코드가 담긴 문자 메세지를 받아 입력하여 로그인하는 2중 인증 시스템을 지원하고 있다.[3]

2.1.2. 안전한 서버 관리


암호화 뿐만 아니라 서버 내의 모든 데이터는 24 시간 상주하는 직원과 생체 인식 보안이 설치된 데이터 센터에 저장된다.

2.1.3. 속도


Backblaze의 특성상 대용량의 파일을 다루기 때문에 업로드 및 다운로드 시간을 감소시키기 위해 데이터 압축 및 대역폭 제한을 사용한다.
사용자 자신이 Backblaze 에서 다운로드/업로드 할 때 어느정도의 속도가 나오는지 알 수 있도록 웹사이트에 속도 측정 공간을 마련해 뒀다. # 한국에서는 데이터센터와의 거리가 멀어 기본 설정으로는 이 속도가 나오지 않는데 그 차이가 매우 크다. 속도 측정할때는 50Mbit/s가 나오는데 실제 백업은 1Mbit/s가 나오기도.. 한달 내내 백업해야 260GB 되는 속도다. 설정에서 자동 스로틀을 끄고 쓰레드를 컴퓨터 성능에 맞게 늘려주면 그나마 나아질 때가 많다.

2.1.4. 쉬운 접근성


전용 클라이언트 뿐 아니라 웹상에서도 자료를 받을 수 있게 해놨다. 마치 자신의 컴퓨터에 접속해 있는듯이 폴더와 파일을 선택해서 다운로드 하면 된다고 한다. 또한 맨 위의 개요에 적혀있듯이 아이폰,아이패드,안드로이드와 같은 모바일 기기에서 접속할 수 있는 앱을 제공한다. 다운로드는 이쪽

2.1.5. 데이터 배달(?)


자료의 용량이 너무 방대하거나 인터넷이 느린 사용자를 위해 자료를 256GB USB 플래쉬 드라이브나 8TB 외장 하드디스크에 담아 빠르고 안전하기로 유명한 FedEx로 배송해주는 서비스도 제공하고 있다.[4] 가격은 각각 99달러, 189달러이다. #[5]
또, 그것도 모자라서 받은 물건을 30일 내로 우편을 통해 다시 되돌려주면 처음에 냈던 비용을 환불해 준다고 한다.

2.2. 가격


https://secure.backblaze.com/buy.htm
한달에 $6
1년 $60 (10달러 절약)
2년 $110 (25달러 절약)
파일 버전 역사(Version History)에 대한 plan도 존재한다. 삭제되거나 변경된 파일의 경우 기본적으로 30일 동안 보존되지만, 비용을 좀 더 지불하고 1년 또는 평생(!) 보존할 수 있다. 개인적으로 1년을 추천한다. 월 2달러만 더 지불하면 1년을 보존할 수 있다.

3. Business Backup



4. B2 Cloud Storage



4.1. 특징


Amazon Web ServicesS3 Glacier과 비슷한 역할을 한다. 자연 재해라던가 하드디스크가 고장나는 등의 재난 상황을 대비해 평소에 열어보지 않고, 비상시에나 다운로드 할만한 파일들을 넣어놓고 짱박아 놓으면 된다.

4.2. 가격


10GB 의 용량이 주어지는 무료 체험 서비스의 경우 별도의 유지비용이 없고, 다운로드 비용도 없는 대신 하루에 1GB만 다운로드 가능한 제한이 걸린다. 유료 서비스의 경우 1기가당 유지비용 월 0.5센트(0.005달러), 다운로드시 1기가당 0.01달러의 요금(2019년 10월 기준)으로 서비스 하고 있다. 쉽게 말해서 보관은 200기가에 1달러, 다운로드는 100기가에 1달러인 셈이다.
Backblaze에서는 S3 Standard와 요금을 비교하고 있으나# S3 Standard는 자주 엑세스하는 데이터를 저장하는데 특화된 것으로# 단위 용량당 요금이 비싼 편이다. B2 Cloud Storage처럼 백업을 위한 것은 위에 말한 것 처럼 S3 Glacier이며 이것의 용량당 요금은 비슷하다.# 하지만 더 오래 데이터를 보존하기 위한 S3 Glacier Deep Archive는 서울 리전 기준으로 1기가당 유지비용 월 0.1센트로 용량당 가격이 20% 수준 밖에 되지 않는다. 다만, S3 Glacier과 S3 Glacier Deep Archive는 데이터 최소 유지 기간이 있다. 만약 최소 유지 기간을 지키지 않고 삭제하면 추가 요금이 발생한다. 또한, 데이터를 요청하자마자 바로 다운로드 할 수 없고 몇 시간의 대기시간이 필요하다. 만약 데이터가 긴급하게 필요한 경우 추가 요금을 내야 1~5분 내에 다운로드 할 수 있다. Deep Archive의 경우 1년에 한두 번 액세스하는 자료용인 모양.# 그러나 B2 Cloud Storage는 이러한 단점이 없고 로그인하면 바로 파일 목록을 볼 수 있고 다운로드가 가능하므로, S3 Glacier보다 편리하고 직관적이다.

4.3. 업로드 방법


Backblaze B2에 자료를 업로드할 때, 웹 인터페이스에서는 500 MB 이상 크기의 단일 파일을 전송할 수가 없는 문제가 있다. 이 때 안내를 클릭해보면 Python을 설치하여 커맨드 프롬프트에 직접 타이핑하는 명령을 사용하라는 복잡한 안내를 하는데, 커맨드 프롬프트에 왠만큼 익숙한 사람도 뭘 하나 입력할 때마다 한 페이지 분량의 에러가 나와서 정말 한숨 나온다. 이럴 때는 Cyberduck이라는 소프트웨어를 설치하고 여기 Backblaze B2를 등록하여 업로드하면 해결된다. # 왜 이런 쉬운 방법을 바로 링크해서 안내해주지 않는지 아쉬울 따름.

5. 주의사항


대부분 착각하는 것이 바로 Backblaze가 클라우드 스토리지라는 것이다. Backblaze는 구글 드라이버나 드롭박스와 같은 클라우드가 아니다. 정확히 얘기하자면 Backblaze는 '''백업 클라우드'''지 '''저장용도로 쓰이는 게 아니다.''' 게다가 백업을 한 원본 하드디스크를 지속적으로 연결해야한다. 결정적으로 '''하드디스크를 30일이상 연결을 안하면 자동으로 삭제된다'''. 이래서 한달에 $6, 일년 에 $60, 그리고 2년에 $110이란 가격을 보여주는 것이다. 당연하지만 수십테라바이트 저장장치를 일반인들이 가지고 있을리가 없을테니 현실적으로 무제한으로 백업한다는 건 불가능한 얘기다. 그러니깐 자기가 가지고 있는 하드디스크 용량만큼만 백업이 가능하며 Backblaze는 클라우드 스토리지용도론 못 쓴다.
어느정도의 용량은 있지만 usb 드라이브로 배달받기에는 애매한 파일들은 다운로더를 통해 받을 수 있다. 사실 데이터 배달이 애매한 것이, 올때는 문제가 없으나 다시 미국쪽으로 보낼 때 배송비가 좀 든다. 또, 수 테라바이트 정도의 용량은 그쪽에서도 준비하는데 시간이 며칠 걸린다고 하니, 시간 딜레이가 좀 있는 편. 그런이유로 인해 수십테라바이트 용량도 그냥 다운로더로 받는 유저도 여럿 있는 모양이다. 그런데 문제는 다운로더 상태가 그리 좋지 않다. 공돌감성적 디자인은 둘째치고, 다운로드 중에 주기적으로 응답없음이 뜨는 증상이 있어 멀쩡히 작동하는 다운로더를 끄지 않도록 주의를 요한다. 이 경우에는 인터넷 사용량 및 하드디스크 사용량은 잡히기 때문에 작업관리자를 통해 확인할 수 있다. 또, 두 개 이상의 다운로더를 동시에 쓰게 되면, 높은 확률로 맨 처음 개시한 다운로더를 제외한 나머지 다운로더가 작동중지되는 현상이 있다. 이 경우 대략 수십메가바이트 가량의 램만 사용한 채 하드디스크 사용량과 인터넷 사용량이 없이 응답없음 상태이니, 의심될 경우 마찬가지로 작업관리자를 확인하면 된다. 이 현상은 대체로 쓰레드 수가 지나치게 많아질 경우 충돌하는 현상으로 보이는데, 해외에서도 이 작동중지 관련한 문제 제기가 지속적으로 있는 것으로 보아 해결이 힘든 듯 하다. 그냥 다운로더는 하나씩만 쓰자. 대략 쓰레드 당 1-3Mbps가 나오므로, 자신의 인터넷 회선의 사양에 따라 적당히 조절해서 쓰면 되고, 기가급 인터넷을 사용중이라면 그냥 쿨하게 30쓰레드 설정하고 쓰면 대략 80-100Mbps정도는 나온다.

6. 하드드라이브 고장률 통계


자사 서버를 운영하면서 사용한 하드디스크의 회사별, 모델별 연간 고장률 통계를 공개한다.
홈페이지 내의 블로그 텝에서 찾아볼수 있으며, 한번만 공개한게 아니라 분기 데이터도 현재까지도 갱신되고 있다. 이전까지 하드드라이브는 언젠가는 고장난다는 사실을 다들 알고 있지만 정확한 고장률에 대해서는 제조사가 입을 다물고 있는데다가 통계를 모집하는 곳이 없어서 불확실한 입소문에 의지하는 바가 있었지만, 수만개 단위의 하드드라이브를 이용한 통계인데다 일반 유저들보다 사용 조건이 더 빡센 서버 사용 기준의 데이터가 풀려나온 덕분에 굉장히 신뢰성이 높은 데이터로 분류되고 있다.
사실상 근래의 하드웨어 커뮤니티에서 하드드라이브 평가를 하는데 있어서 가장 공신력있는 자료중 하나로서 쓰여지고 있다. 아주 간략하게 내용을 요약하자면 시게이트가 만든 하드드라이브가 가장 불안정하며[6], Western Digital도시바의 하드드라이브는 무난하며, HGST 브랜드가 가장 덜 고장난다. 7200rpm이 아닌 저속 저소음 하드인 점은 감안해야 하지만, 2013년에 발매된 HGST Megascale 4TB 시리즈는 2018년 3분기까지 수만 대 규모로 천만 일 이상의 Drive Days를 돌린 결과 0.6%의 연간 고장률을 보여 안정성 지존의 자리를 차지하고 있다.
더 자세한 해석을 하고자 한다면 주의해야할 부분들이 많다. 일단 Backblaze가 테스트를 위해서 준비한 데이터가 아니라, 그냥 서버에서 사용한 데이터를 정리해서 통계로 내놓은 자료라서, 하드드라이브의 안정성을 공평하게 테스트를 위한 조건이 아니다보니, 보다 상세한 분석을 하기 위해선 데이터 해석에 여러가지 주의를 해야하는 자료임을 알아두자. Backblaze의 통계를 해석할때 유의할점들을 정리해보면 다음과 같다.
  • 일부 하드 드라이브들은 드라이브 숫자가 만 단위이고, 망가진 하드 숫자들만 수십개이상이므로 통계에 신빙성이 높다. 하지만 일부 모델은 통계 표본숫자가 얼마 되지 않기 때문에 그러한 모델들의 통계 수치의 신뢰성은 낮다. 예를 들면 WD40EFRX의 경우엔 단 46개의 드라이브만 테스트 되었고, 고장난 하드는 3개밖에 되지 않는다. 모든 하드 드라이브 종류들을 다 모아서 테스트하는것도 아니므로 신뢰성 높은 데이터를 통해서
특정 모델의 하드드라이브의 고장률을 예상하기에 적합한 데이터는 아니다. 다만 표본숫자/Drive Days가 많은 모델들만큼은 상당히 믿을만할것이다.
  • 하드 드라이브는 언젠간 고장나는 부품이고, 그렇기 때문에 그냥 고장날 확률만을 지칭하면 모든 하드가 언젠간 100%로 수렴해도 이상하지 않다. Backblaze의 고장률 수치는 "연간 고장률"로서 하드 1개가 1년동안 사용했을때 1년이 지나갈때마다 고장날 확률이 얼마나 되는 수치로 Failure rate을 나타낸다. 바꿔말하면 테스트한지 얼마 되지 않은 드라이브의 고장률은 장기고장률을 참고하는데 있어서 큰 도움이 되지 않는다. Drive Days라는 수치가 공개되어있으므로 이를 Drive Counts 수치로 나누면 하드 평균 연식이 얼마나 되는지 짐작할수 있다. 다만 Drive Counts는 구매했던 전체 개수가 아니라 현재 남아있는 개수라서 이렇게 나누는 게 항상 맞지는 않는다. 신뢰성을 감안할려면 그냥 Drive Days가 높으면 높을수록 신빙성이 높은 테스트라고 보면 되겠다.
  • 조금 생각해보면 당연하지만 년단위로 테스트가 되기 마련이므로 근래에 하드드라이브 제조 라인업에 문제가[7] 발발했을 경우, 바로 그 고장률이 통계에 반영되지 않는다. 이는 BackBlaze뿐만 아니라 모든 하드드라이브 통계의 공통점이라고 봐도 무방하다. [8]
  • 전체적으로 하드 드라이브 평균 연간 고장률이 약 2% 가량이 되지만, 이 수치 또한 엄밀하게는 정확하다고 볼수 없다. 일부 하드 드라이브의 경우, Backblaze가 훨씬 많이 애용하는 것이 수치상으로도 명백하게 드러나며, 치명적인 문제가 일어났던 제품의 경우엔 Backblaze 입장에서는 추가 구매를 안할것이며, 이렇게 추가 구매를 중지한 하드드라이브가 있다면 장기적으로 통계에 반영될것이기 때문. 실제 시게이트의 문제의 3TB 모델은 추가구매가 중지되었다. 또한 위에서 언급된것만큼 많이 쓰이는 하드드라이브 모델이 한정되어있다는 점 또한 문제이다. 역으로 데이터보다 실제 고장률이 낮아질만한 요소도 있는데 BackBlaze같은 데이터 센터에서는 하드드라이브가 상시 기동 중이라는 보다 가혹한 사용환경이라는 전제가 깔린다는것도 그러한 부분이다. 다만 통계 규모와 하드드라이브 고장률이 판명되기까지 걸리는 시간과, 수많은 백업 덕분에 몇 퍼센트가량 죽는것보다 가성비가 더 중요한 데이터 센터의 특성 등을 감안한다면 실제 일반인들이 하드드라이브를 사용할때 고장률이 얼마나 될지 추측할때 정확한 통계는 못되더라도 크게 벗어나지 않는 대략적 추측을 하기엔 매우 적합하다.
  • 하드드라이브에는 현재 상태를 저장하는 SMART 데이터가 있는데, 하루 6만개 이상의 하드에서 매일 SMART 데이터를 기록하다보니 하드가 사망했을 때 며칠 전부터 어떤 전조가 SMART에 나타났는지를 통계 처리하여 발표하였다. # 가장 중요한 5가지는 Crystal Disk Info 프로그램에서 확인했을 때 05) 재할당된 섹터 수, BB) 회복 불가능 오류 보고 횟수, BC) 명령 타임아웃, C5) 보류 중인 섹터 수, C6) 회복 불가능 섹터 수라고 하며, 이 5가지 항목의 원시값이 0 이 아닌 값으로 올라가기 시작하면 하드디스크의 사망에 가까워진다고 한다. (BB 및 BC 항목은 없는 하드가 많다.) 또 C5와 C6은 상관계수 0.808로서, 한 쪽이 문제가 생기면 다른 쪽도 문제가 생길 가능성이 매우 높다. 그 다음으로 중요한 값은 BD) 높은 플라이 쓰기인데, 이 값의 경우 1년에 1 정도 상승하는 게 보통이나 급격히 상승하는 경우(1주일에 50 상승을 예로 들었다) 사망에 가까워진다고 한다.

7. 여담


  • 자사의 데이터가 100페타바이트를 돌파한 기념으로 데이터를 저장하는데 사용하는 Backblaze Storage Pod 4.0을 영상으로 공개했다.


[1] Dropbox처럼 로컬 동기화 기능이 있는 경우 로컬에 동기화한 후 로컬 사본을 백업하면 된다.[2] 네트워크 드라이브 및 NAS는 시스템에 직접 연결된 장치가 아니므로 이걸로 백업이 불가능하다.[3] 이 기능은 계정 로그인 후 "My Settings"메뉴에서 활성화 할 수 있다고 한다. 자세한 설정방법은 이쪽[4] 물론 암호화도 제공한다.[5] 2019년 10월 기준 이전에는 가격은 동일하며 각각 128GB, 4TB였다.[6] 이 부분의 자세한 내용은 씨게이트 문서 내용을 참조하자.[7] 가령 과거 시게이트의 막대한 고장률로 악명을 떨쳤던 ST3000DM001 의 경우엔 태국 홍수 문제로 인한 영향이 있을것이라는 Backblaze의 추측 글이 있었다. 이렇게 특정 기간에 생산된 하드드라이브만 문제가 있는 경우도 있다.[8] 바꿔말하면 시게이트의 경우엔 고장률이 모델마다 천차만별이고, 일부 문제가 심각한 모델을 제외하면 그래도 괜찮아보이지만, 다른 제조사들보다 문제를 여러차례 터트린 전과가 있다는걸 감안할때, "이 모델은 시게이트이지만 고장률이 낮으니 괜찮을거야" 라고 생각했다가 알지모를 제조사의 뒷사정으로 인해서 엿을 먹을 가능성도 꽤 된다는 말이다. Backblaze 이전에도 데스게이트등의 악명도 있었다는걸 고려해보자.