青草青永久在线

Greenplum 大數據平臺的優勢

2019-12-09



一次打包到處運行的平臺:部署靈活,不受限于硬件環境和平臺,無論裸機、私有云、公有云均可部署。硬件環境的普適性,提供了極大的靈活性,解放了硬件平臺的制約和綁定,從而允許客戶靈活選擇最適合的方案,降低未來的遷移代價,而開發、運維人員無需要學習新的數據庫處理技術,人力成本也能夠大大降低。

處理和分析各種數據源的數據的平臺:支持各種數據源,包括 Kafka、Hadoop、HIVE、HBase、S3、Gemfire、各種數據庫和文件等,不需要移動數據,避免了數據加載的復雜性,和其帶來的數據不一致的問題。

支持各種數據格式的平臺:不管是結構化、半結構化(XML、JSON、KV)還是非結構化,譬如文本數據、GIS 數據、圖數據等。

具有強大內核的平臺Greenplum 具有強大的內核技術,包括數據水平分布、并行查詢執行、專業優化器、線性擴展能力、多態存儲、資源管理、高可用、高速數據加載等。

具備強大靈活性和可擴展性的平臺 支持擴展(Extension)、自定義類型和函數、PXF和外部表技術。可以使用多種語言實現用戶自定義函數和聚集,包括 PL/PythonPL/R、PL/Java、PL/Perl、PL/PGSQL 和 C 等。

支持標準的平臺:支持 SQL、JDBC 和 ODBC 等行業標準。經過半個多世紀的發展,SQL 成為了數據平臺的萬向頭,向上可以連接各種 BI 工具、可視化工具和數據分析工具,向下可以連接各種 ETL 工具、各種數據源和各種格式的數據等。

集成數據分析平臺:支持商業智能(BI)、文本、GIS、圖、圖像等。流式支持也在開發中。通過 Pivotal 開源的 Apache 頂級項目 MADlib,Greenplum 可以在數據內部運行 50多種數據分析和機器學習算法。MADlib 提供 SQL 接口進行數據分析,大大降低了數據分析的門檻;MADlib 內建于數據庫內,使用 MPP 的優勢,提高了分析的效率;MADlib 可以在全量數據而不是抽樣數據上進行分析,提高了精度。

開放源代碼且持續大力投入的平臺 2017 年 Pivotal 在 github 的開源貢獻列表中全球排名第四左右。 采用開源方案,不擔心后門問題,不擔心被鎖定。開源還可以構建更好的生態。

采用敏捷軟件開發方法開發的平臺Greenplum 采用敏捷方法開發,實現了快速迭代、持續發布和質量內建。2017 年 Greenplum 發布了 10 個版本,以前發布一個版本需要 1 個月左右,現在只需要十幾個小時。

具備企業級穩定性的平臺Greenplum 經過十多年發展,有大量活躍客戶,大量數百節點集群為全球 2000 強企業生產系統提供服務,穩定性非常高。

具備成熟生態系統的平臺Greenplum 生態非常完善,有大量的合作伙伴。