RDB로는 진짜 이제 답이 안나오는것 같아서 고려중인데
허들은 있는것 같고 임원들 설득할려고 하니까
그게 왜필요한데 하는데
도입하셨던 분들은 어떤가요?? 저는 아무리 봐도
현재 RDB 쓰는 문제를 한방에 해결할 솔루션 같은데요
1개의 좋아요
어떤 시나리오를 고려하고 계신지 자세히 알 수는 없지만, 일반적으로 RDBMS는 정합성을 맞추어야 하는 종류의 데이터 관리나 트랜잭션 관리가 필요한 경우에는 대체가 불가능하고, 데이터 형태가 정형화되어있지 않은 경우에 스파크, 하둡 같은 솔루션을 생각할 수 있습니다.
지금 사용하는 RDBMS의 테이블 구조가 정형화되기 어려운 상태이거나 수시로 컬럼이 변경되는 상황이라면 RDBMS의 사용 목적에는 적합하지 않게 사용하는 것일 수 있습니다. 다만 데이터레이크 계열 솔루션으로 데이터를 관리하기 시작하면, 트랜잭션 처리를 직접 사용할 수 없고 데이터 입출력 메커니즘이 기존과 많이 달라질 수 있어서 완전히 새로운 시스템으로 보고 구축하셔야 합니다.
원하는 기능을 구현할 수 있는 것인지 충분히 PoC하고 검토하는 기간이 필요하실겁니다.
2개의 좋아요
s3에 있는걸 퀴리하려면 rdb로 불가능해서요. aws emr을 써야하죠. emr이 스파크 클러스터죠.
스파크 클러스터 운영도 직접 하면 꽤 어려워서 paas 아니면 사용하지 않는게…
2개의 좋아요