Book : Programming Hive

Hive 2013. 4. 23. 17:33

Book : Programming Hive


Programming Hive 번역본이 출간되었다.


하이브 완벽 가이드, O'REILLY, 한빛 미디어 에드워드 카프리올로, 딘 웜플러, 제이슨 러더글렌 지음 (오세봉 외 옮김)


 회사 동료분들이 번역 했고 나는 부록A를 집필했다.

영문판을 미리 받아 봤지만 훝어보기만 하고 방치하다가 교육 자료를 만들려니 번역본을 읽었다.

그래서 출간된지 20일이 넘어서야 책을 다 읽게 되었다. 하이브가 딱히 마땅한 레퍼런스 북이 없어서 하이브 사용자들은 대부분 이 책을 구매할 것으로 예상되긴 하지만 그래도 이 책을 읽어야 되는 이유를 간단히 적고자 한다. (홍보 때문은 아니고 어둠에 경로를 통해서라도.)


 우선 하이브 오픈소스 커뮤니티가 왕성하게 활동하는 결과로 많은 기능이 추가되고 있는데 그에 비해서 문서 보강은 더디다. 그래서 문서가 최신 상태가 아닌 경우가 많은데 이때는 사용자 메일링이나 JIRA에서 이슈를 찾아보게 된다. 그래도 못 찾는 경우에는 아예 코드를 뒤져보는게 맘편하다. 하지만 아무리 이슈와 소스가 공개되어 있다고 하더라도 사용자가 직접 찾아보는 것은 시간과 수고가 드는 일이다. 그나마 이 책은 0.10 버전 기준으로 가장 최신의 하이브의 기능을 설명하고 있다.


 하이브를 사용하면서 소홀히 하게 되는 보안, 잠금, 권한에 대한 내용도 충분하진 않지만 그 어떤 문서보다 쉽게 잘 정리되어 있다.


 기능이 Case by case 동작이 달라서 직접 문제에 부딪혀봐야 알 수 있는 디테일한 정보들도 깨알같이 정리되어 있다. 매번 까먹고 삽질을 반복하던 내용들이 책을 한 번 훝어보니 깔끔하게 정리가 된다.


 물론 이제 곧 출시된 0.11에는 Decimal Type, 분석함수, ORC 파일포맷, HiveServer2, HCatalog 코드 통합 등 많은 변화가 있을 예정이다. 0.11이 출시되자마자 이 책도 outdated 되겠지만 그래도 0.11에 추가된 새로운 기능이 안정화 되려면 0.12는 되어야 할 것 같다.


기능이 많이 추가된 만큼 버그도 속출하고 있어서 하이브 커뮤니티에서 열심히 수정 중이다.

Posted by 김민우 julingks

댓글을 달아 주세요