디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

hi guys~

묻지마갤로그로 이동합니다. 2009.01.24 10:41:22
조회 374 추천 0 댓글 3






형아는 요즘 콜라를 존나게 마셔서 콜라 중독은 안걸린다.

왜냐면 가끔 팹시와 콜라를 섞어서 먹지 않기 때문이다.



요즘 킹왕짱 파일시스템을 테스트의 경지에서 예술의 경지로 끌어 올리고 있다.

백업 전략을 제외하고는 왠만한 대용량 스토리지 시스템이랑 비교해도 절대 후달리지 않게 만들고 있다.

기본적으로 물리적인 분산 스토리지를 막 쳐 붙이면 논리적인 스토리지에 무한 용량 추가가 된다.

분산된 파일을 관리하는 인덱싱 서버가 모든 스토리지를 관장한다.

물론 인덱싱 서버 역시 레플리케이션 부하분산이 용이하도록 설계했다.

하드를 붙이던 서버를 늘리던 그건 중요한게 아니다. 인터넷 접속하는 방법이 있는 모든 컴퓨터의 하드는

로컬네트웍이던 외부 네트워크던 가리지 않는다. 걍 존나게 늘리는거다.

수많은 물리적인 스토리지를 갈아서 하나의 거대한 논리적인 디렉토리가 생성되는거다.

묻지마 쥬크박스에는 네이버 블로그에 올라와 있는 거의 모든 음악 파일(67만개) 들이 다 크롤링 되어서 이 파일 시스템에 저장되어 있는것이다.

하지만 형아는 그 음악 파일들의 내용을 모른다. 모두다 저작권이 없고 개인적인 음악들만 있을거라고 강력하게 믿고 있다.





인터넷 파일들은 정말 중복도가 너무나 높다.

초기에 인터넷 사진이나 음악을 크롤했을때 형아는 그 미친듯한 중복도에 몹시 화가난 생태였다.

그래서 생각했던게 어떻게 하면 이 중복된 파일들에 대해 스토리지용량을 줄일수 있을까 였다.

개나 소나 알듯이 중복 파일은 제거 하면 되는것이다.


하지만 어떻게 중복 파일을 제거 할거냐가 문제다. 파일마다 해시를 구해서 인덱스를 먹이면 된다고 하는데.

이걸 해결 하기 위해 해시를 사용하는데 두가지 문제가 있다.

큰수에 대한 중복없는 해시가 필요하고

대용량 파일에 대한 빠른 해시가 필요하다는것이다.

1기가나 2기가되는 파일들의 해시를  마치 문자열 몇줄 찾는것과 같이 빠르게 구할수 있는 방법을 형아는 존나게 연구해서 개발했다.

미디어 파일들은 특히 용량 변화 없이 중간에 메타 정보들이 임의로 약간 바껴서 서로 다른 파일들로 해시가 나올수도 있고
그 위치가 각각이라서 풀 해싱을 하지 않고는 이 문제를 해결 할 수 없다.
그리고 해시 알고리즘이 변경되면 모든 인덱싱을 다시 해야 하기 때문에 한번 결정된 알고리즘은 변하면 안된다...

이 해싱 알고리즘은 예전에 원더걸스 소녀시대 배틀사이트에 사용되었던 해싱 함수를 약간 업글해서 만들어진것이다.


하여튼 이 묻지마 해싱으로 각각의 파일은 아이디를 받게 되고 아이디 체크를 통해서 파일은 중복없이 각각의 분산 스토리지에 램덤으로 분산 저장하게 되고 저장된 인덱스는 인덱스 서버에 저장이 된다.



그리고 파일 중복도 정도에 따라서 파일이 자동 레플리케이션되어서 다른 서버 다른 하드들에 복사 되어 진다.
그리고 중복도가 낮아지면 다시 적절하게 조절해서 줄어들고...
예를 들어서 중첩이 100회 이상이면 2개의 서버에 복사본이 생성되고 이런식이다. 왜냐면 부하 분산을 위해서 그렇다.


거대한 스토리지 풀과 풀의 인덱스서버 어떻게 보면 네이버 OwFS 랑 비슷한 개념이라고 생각 할 수도 있겠지만..

네이버 OsFS는 형아가 봤을때는 아직 뉴비 단계의 시스템이고 좀더 튜닝이 필요한 시스템인거 같다.

비교하지 말았으면 한다.





형아는 묻지마 파일시스템을 백업 솔루션이 완성되는 대로  대용량 스토리지 서비스를 해볼 생각이다.

백업은 어떻게 보면 장애확율과 스토리지 낭비의 딜레마의 중간에 있는것 같다.

만약 장애가 나지 않는다면 백업 시스템은 엄청난 낭비를 의미하는것이고...

그렇다고 장애가 모든 곳에 동시에 나지는 않을것이다.

단지 우리는 그 장애를 예측하지 못하기 때문에 많은 자원을 낭비하고 있는것이다.

장애 예측과 백업 스토리지 용량산정의 딜레마 극복을 위해서 형아는 오늘도 콜라를 마신다.




추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
공지 프로그래밍 갤러리 이용 안내 [69] 운영자 20.09.28 34950 62
2700543 19 ) 섹카오톸 레전드 jpg ㅇㅇ(222.97) 20:53 2 0
2700542 근대 후임이 일 안하려고 하면 ㅇㅅㅇ [5] 포항의봄갤로그로 이동합니다. 20:51 19 0
2700541 프로그래머도 인턴경험 중요함? [7] ㅇㅇ(223.38) 20:50 25 0
2700540 19 ) 승무원쌕파 만든썰 jpgg ㅇㅇ(222.97) 20:50 3 0
2700539 맥북안쓰는사람 죽어죽어죽어죽어죽어죽어죽어 ㅇㅇ(221.143) 20:49 4 0
2700537 정보보안/서버관리/게임개발 쪽으로 진로 방향 정했는데 셋 중 하나로 [4] 프갤러(210.101) 20:48 11 0
2700536 아직도 윈도우 쓰면 미개하다고 해야하나 프갤러(221.143) 20:47 3 0
2700535 윈도우: 호환성 위해서 팔다리 다묶음 프갤러(221.143) 20:46 3 0
2700534 윈도우 지지한다? x86 카르텔 프갤러(221.143) 20:46 3 0
2700533 하 맥에서 잘돌아가는데 윈도우에서 안돌아가네 프갤러(221.143) 20:45 3 0
2700531 윈도우 = 호환성 지킬려고 80~90대까지 일하게 시킴 프갤러(221.143) 20:45 3 0
2700530 윈도우같은 os는 세상에 나왔으면 안됨 프갤러(221.143) 20:44 3 0
2700529 윈도우 뭐이럼?? 프갤러(221.143) 20:44 3 0
2700528 윈도우 에서 코딩하고 인생이 망함 프갤러(221.143) 20:43 4 0
2700527 반도체 발전시킬필요없음 arm 쓰면 2배 성능업 프갤러(221.143) 20:43 3 0
2700526 윈도우가 없어져야 x86 프로그램도 없어짐 프갤러(221.143) 20:42 4 0
2700525 맥만 있으면 세상이 2배는 빨라짐 프갤러(221.143) 20:42 4 0
2700523 윈도우쓰지마세요 프갤러(221.143) 20:41 4 0
2700522 윈도우의 죄악 arm의 발전을 늦춤 프갤러(221.143) 20:41 4 0
2700521 mz 후임 오면 어케해야됨 ㅇㅅㅇ [2] 포항의봄갤로그로 이동합니다. 20:40 18 0
2700520 사상최악의 os 윈도우 [2] 프갤러(221.143) 20:40 17 0
2700519 요즘 mz들은 맥북만씀 [4] 프갤러(221.143) 20:39 17 0
2700518 윈도우 = 호환지킬려고 80~90대 노인네도 살수있게함 [3] 프갤러(221.143) 20:39 10 0
2700517 나님 지금 조금 위험한 상태..✨ ♥순수퓨어냥덩♥갤로그로 이동합니다. 20:39 9 0
2700516 윈도우 쓰는 사람은 그냥 툴키디죠 [3] 프갤러(221.143) 20:38 13 0
2700515 윈도우에서 프로그래밍 하지마세요 [4] 프갤러(221.143) 20:38 18 0
2700514 코드 깔짝하는데 현타오노 ㅇㅅㅇ 포항의봄갤로그로 이동합니다. 20:38 5 0
2700513 좆소 2년 다녔는데 고참됨 [2] 프갤러(211.44) 20:38 13 0
2700512 형욱씨 잠수 왜케 오래하냐 [5] 헬마스터갤로그로 이동합니다. 20:36 19 0
2700511 소프티어 해본사람 잇음? [2] 하늘섬갤로그로 이동합니다. 20:30 27 0
2700510 crud 4시간 걸려서 완성한거 실화냐 프갤러(121.180) 20:30 19 0
2700509 노력하는자는 이길 수 없다 전회사 나올때 듣던말인데 [3] ㅈㄹㄷ(101.235) 20:30 27 0
2700508 행복하게 데이트 하는 커플들 안부럽냐?>! 포항의봄갤로그로 이동합니다. 20:26 11 0
2700507 저임금 노예경영의 달인 통정희 ㅇㅅㅇ [2] 통정희박대령갤로그로 이동합니다. 20:23 11 0
2700506 불금인데 프갤에서 죽치고 잇는 애들 뭐노 [1] 포항의봄갤로그로 이동합니다. 20:23 13 0
2700505 whitescreen.online 발명도둑잡기갤로그로 이동합니다. 20:21 9 0
2700504 강형욱이 뭔데 시끄럽냐? ㅇㅇ(114.30) 20:21 14 0
2700503 집 앞 돈가스집 퀄리티 생각보다 좋네 [14] 야프링갤로그로 이동합니다. 20:16 47 0
2700502 서류 붙고 리크루터랑 콜한 다음에는 뭔가 붙을 거 같아서 [3] 야프링갤로그로 이동합니다. 20:11 42 0
2700501 안드로이드 애니메이션 관련코드 질문좀ㅜ [1] 프갤러(58.124) 20:11 15 0
2700499 홧김에 이력서 냈는데 하루만에 서류 통과해버려서 [1] 야프링갤로그로 이동합니다. 20:09 27 0
2700498 나한테 취업사기 친 회사는 [11] 딱지(210.183) 20:08 68 0
2700497 윈도우 usb설치버전 올려져있는 사이트 아시는분? [1] 프갤러(218.147) 20:08 9 0
2700496 토일은 데이트하느라 프갤못와 ㅜㅠ [2] ㅈㄹㄷ(101.235) 20:07 30 0
2700495 강형욱씨 건은 전형적인 인사관리 시스템이 없는 회사의 문제 아니냐 [4] 프갤러(211.209) 20:05 30 0
2700494 소프티어 코테본사람? [12] 프갤러(14.37) 20:05 142 0
2700492 따당이가 회사에서 하는일 ㅇㅅㅇ [7] 따당이갤로그로 이동합니다. 20:04 45 0
2700491 오늘의 발명 실마리: 인공지능 채팅, OTT, 음악 계정 원격 공유 앱 [1] 발명도둑잡기갤로그로 이동합니다. 20:03 11 0
2700489 코딩잘하는 고졸이랑 국비대졸이공계 있으면 대졸 뽑더라 [2] ㅈㄹㄷ(101.235) 20:02 25 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2