'Hortonworks Stinger'에 해당되는 글 1건

  1. 2013.05.13 Gigaom Report - SQL-on-Hadoop platforms in 2013

Gigaom Report - SQL-on-Hadoop platforms in 2013


색터 로드맵 리포트라고 할 수 있다.

SQL-on-Hadoop 이라고 불리는 빅데이터 실시간 질의 솔루션들의 경쟁사와 제품들을 비교 분석한 리포트라고 보면 된다.


비교 벤더들은 다음과 같다.

  • Cloudera
  • Hadapt
  • Teradata (SQL-H)
  • EMC
  • Greenplum (HAWQ)
  • Citus Data
  • Splice Machine
  • JethroData
  • Concurrent (Lingual)

비교 아파치 프로젝트는

  • Apache Drill
  • Hortonworks Stinger

이다.


자세한 내용은 리포터를 참고. http://www.cloudera.com/content/dam/cloudera/Resources/PDF/GigaOM_Cloudera_Real-time_query_for_Hadoop_democratizes_access_to_big_data_analytics.pdf


리포터를 쓴 사람은 George Gilbert라는 사람인데 하버드 경제학과 나와서 MS와 Lotus Development에서 Product Manager로 일했고, 전 Credit Suisse First Boston 소프트웨어 분석가다.


Product Manager는 우리나라에서는 아직 많이 없는 포지션인데 제품의 형상을 관리하는 업무를 맡는다. (흔히 PM이라고하는 Project Manager와는 다른 개념이고 그렇다고 기획자라고 보기에도 애매하다.) 대부분 SW직군이 미국 MBA를 받으면 오라클이나 Google, IBM 같은데 Product Manager로 채용되기도 한다.


암튼 이 사람의 결론은 뭐냐 어쨌든 결론이 중요하니깐


앞으로 이 시장의 1~2년 예측 :

  • 클라우데라가 적어도 2년 정도 걸릴지라도 가장 유연하고 성공적인 솔루션 구축에 성공할 것
  • 두번째 오픈소스 대안은 Apache Drill 또는 Stinger 둘 중에 먼저 성숙한 프로젝트가 될 것 (클라우데라가 삽질하거나 모멘텀을 잃어버리면, 아파치 프로젝트 중 하나가 리더를 차지할 수 있을 것)
  • Hadapt은 틈새시장에서 이기기 위해 초점을 맞추고 연구할 것
  • EMC(Greenplum) , Teradata는 버그 없는 솔루션을 원하는 대기업의 초이스로 남을 것
  • 더 넓게 데이터베이스 시장에는, newSQL 데이터베이스가 성숙할 것이고 그러면서 사용자는 하둡에서 멀어질 것
  • NewSQL은 Strong structure를 가진 빅데이터에서 사용될 것이고 SQL-on_Hadoop 솔루션들은 semistructured 데이터에 사용될 것이다

마무리로


 모든 데이터베이스 벤더들이 제안하는 중요한 원칙은 모든 처리 포맷과 데이터 타입을 하나의 레파지토리로 통합하고 싶다는 것이다. 그렇게 되면 모든 수준의 사용자는 특별한 레파지토리 사이에 데이터 이동이 없이도 모든 포멧의 데이터를 조작할 수 있다. 예를 들면 하나의 분석 플랫폼은 SQL, Java, 통계 프로그래밍 R, 지리적 함수, 얼굴 인식, 다른 많은 종류의 데이터를 조작할 수 있어야만 한다. 이런 유연성은 야심차지다, 하지만 여전히 시간이 좀 걸릴 것 같다.


---


 마무리가 뭐 이래. 싱겁네. 원래 섹터 로드맵 보고서가 이렇긴 하지만,

어쨌든 SQL-on-Hadoop 시장에서 클라우데라가 Impala로 선전할 것이라는 분석이다. 지금은 Apache 프로젝트 진도가 더딘 면어 있지만 또 하둡 세계는 오픈소스가 강세라 어떻게 될런지 모르겠다. (이게다 지배적인 상용 솔루션이 없기 때문인데 다행이라고 생각한다.. 안그럼 재미가 없잖아.)


Posted by 김민우 julingks

댓글을 달아 주세요