ArticlesChannelsTags
BESPIN GLOBAL Tech Blog
Aug 04, 2023

Data Lakehouse란?

aciddatalakedatalakehousedatawarehousetimetravel
viewOriginal View
Data Lakehouse란?

Data Lakehouse는 데이터 레이크와 데이터 웨어하우스를 결합한 새로운 데이터 아키텍처 패러다임입니다. 데이터 레이크는 다양한 형태의 데이터를 원시 형태로 저장하는 단일 데이터 저장소입니다. 이에 비해 데이터 웨어하우스는 데이터를 가공하여 분석이나 보고서 작성을 위해 사용되는 전형적인 데이터 저장소입니다.

Data Lakehouse는 데이터 레이크의 장점을 유지하면서도 데이터 웨어하우스의 기능을 추가합니다. 예를 들어, Data Lakehouse는 ACID 트랜잭션을 지원하고, 배치 처리와 스트림 처리를 통합할 수 있습니다. 또한, 스키마 정합성을 보장하고, 이전 데이터에 대한 조회 및 롤백 기능을 제공하는 Time Travel과 같은 기술을 사용할 수 있습니다.

Data Lakehouse는 기존의 Object Storage에 데이터 레이크하우스 모듈을 추가하여 구축할 수 있습니다. 이를 통해 기존 데이터 웨어하우스의 장점을 유지하면서도 데이터 레이크의 유연성과 확장성을 활용할 수 있습니다.

Data Lakehouse 기반 기술로는 Deltalake, Hudi, Iceberg 등이 있습니다. 이러한 기술을 활용하여 데이터 처리와 저장의 복잡성을 해결할 수 있습니다.

Data Lakehouse를 사용하면 데이터 처리와 저장의 효율성과 품질을 개선할 수 있으며, 기업의 데이터 분석과 의사 결정에 도움을 줄 수 있습니다.

    See more related articles

    Loading...🧘🏼‍♀️