Greenplum是一個關係型的分布式MPP數據庫,同樣運行於X86架構的基礎之上,具有查詢、加載效率高,支持TB/PB級大數據量的OLAP應用, Greenplum的所有數據都存儲於係統本地文件係統中
GREENPLUM適用場景:
Greenplum的架構采用了MPP(大規模並行處理)。在 MPP 係統中,每個 SMP 節點也可以運行自己的操作係統、數據庫等,它的特點主要就是查詢速度快,數據裝載速度快,批量DML處chu理li快kuai。而er且qie性xing能neng可ke以yi隨sui著zhe硬ying件jian的de添tian加jia,呈cheng線xian性xing增zeng加jia,擁yong有you非fei常chang良liang好hao的de可ke擴kuo展zhan性xing。因yin此ci,它ta主zhu要yao適shi用yong於yu麵mian向xiang分fen析xi的de應ying用yong。比bi如ru構gou建jian企qi業ye級jiODS/EDW,或者數據集市等等。
GREENPLUM運行的平台:
GREENPLUM運行在X86架構的硬件平台上,目前支持的操作係統包括32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS
GREENPLUM的過去與將來:
GREENPLUM 誕生於2003年矽穀,2010/07 EMC收購了GREENPLUM,並把GREENPLUM作為EMC麵(mian)向(xiang)分(fen)析(xi)雲(yun)的(de)戰(zhan)略(lve)核(he)心(xin)產(chan)品(pin),加(jia)以(yi)大(da)力(li)發(fa)展(zhan)。該(gai)產(chan)品(pin)不(bu)僅(jin)在(zai)國(guo)際(ji)市(shi)場(chang)發(fa)展(zhan)很(hen)快(kuai),在(zai)國(guo)內(nei)市(shi)場(chang)發(fa)展(zhan)也(ye)很(hen)快(kuai)。最(zui)著(zhu)名(ming)的(de)案(an)例(li)就(jiu)是(shi)阿(e)裏(li)巴(ba)巴(ba)集(ji)團(tuan),經(jing)過(guo)多(duo)種(zhong)產(chan)品(pin)的(de)精(jing)心(xin)選(xuan)型(xing),最(zui)終(zhong)選(xuan)擇(ze)GREENPLUM作為它們的數據倉庫平台存放數百TB的業務數據去高效支持各種分析應用。
隨著雲計算、大數據迅速發展,亟需用hadoop解決大數據量高並發訪問的瓶頸。穀歌、淘寶、百度、京東等底層都應用hadoop。
Greenplum Hadoop大數據分析平台:
大(da)量(liang)的(de)半(ban)結(jie)構(gou)化(hua)和(he)非(fei)結(jie)構(gou)化(hua)信(xin)息(xi)無(wu)法(fa)管(guan)理(li)和(he)存(cun)儲(chu),大(da)數(shu)據(ju)增(zeng)長(chang)速(su)度(du)驚(jing)人(ren),每(mei)年(nian)以(yi)幾(ji)何(he)級(ji)數(shu)速(su)度(du)增(zeng)長(chang),需(xu)要(yao)有(you)專(zhuan)業(ye)化(hua)的(de)解(jie)決(jue)方(fang)案(an)應(ying)對(dui)大(da)數(shu)據(ju)挑(tiao)戰(zhan)。EMC收購了Greenplum之後,推出的針對Hadoop的Greenplum的數據庫軟件。采用Greenplum HD技術管理半結構化和非結構化信息,整體TCO更低,除了進行有效存儲和管理,可以通過MapReduce技術進行並行的分析和挖掘,把大量的數據存儲變成有價值的數據資產。