轉(zhuǎn)帖|其它|編輯:陳津勇|2019-10-23 16:38:42.967|閱讀 530 次
概述:本文詳細介紹了SQL Server大數(shù)據(jù)群集的功能、體系結(jié)構(gòu)、Kubernetes的概念等內(nèi)容。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
從SQL Server 2019 (15.x)開始,SQL Server大數(shù)據(jù)群集使你可以部署在Kubernetes上運行的SQL Server、Spark和HDFS容器的可縮放群集。這些組件并行運行以確保可讀取、寫入和處理Transact-SQL或Spark中的大數(shù)據(jù),這樣你就可以借助大量大數(shù)據(jù)輕松合并并分析高價值關(guān)系數(shù)據(jù)。
方案
SQL Server大數(shù)據(jù)群集在與大數(shù)據(jù)交互方面提供了靈活性。可查詢外部數(shù)據(jù)源,存儲通過SQL Server管理的HDFS中的大數(shù)據(jù),或通過群集查詢來自多個外部數(shù)據(jù)源的數(shù)據(jù)。然后,可以將數(shù)據(jù)用于AI、機器學(xué)習(xí)和其他分析任務(wù)。下列各部分提供了有關(guān)這些方案的詳細信息。
數(shù)據(jù)虛擬化
通過利用SQL Server PolyBase,SQL Server大數(shù)據(jù)群集可以在不移動或復(fù)制數(shù)據(jù)的情況下查詢外部數(shù)據(jù)源。SQL Server 2019 (15.x) 引入了數(shù)據(jù)源的新連接器。

Data Lake
SQL Server大數(shù)據(jù)群集包括可縮放的HDFS存儲池。 這可用于存儲可能來自多個外部源的大數(shù)據(jù)。 大數(shù)據(jù)存儲在大數(shù)據(jù)群集中的HDFS中后,便可分析和查詢數(shù)據(jù)并將其與關(guān)系數(shù)據(jù)相結(jié)合。

橫向擴展數(shù)據(jù)市場
SQL Server大數(shù)據(jù)群集提供了向外擴展計算和存儲,以提高分析任何數(shù)據(jù)的性能。來自各種源的數(shù)據(jù)可作為緩存跨數(shù)據(jù)池節(jié)點進行引入和分布以供進一步分析。

集成的AI和機器學(xué)習(xí)
SQL Server大數(shù)據(jù)群集在HDFS存儲池中存儲的數(shù)據(jù)和數(shù)據(jù)池中啟用AI和機器學(xué)習(xí)任務(wù)。使用R、Python、Scala或者Java可在SQL Server中使用Spark以及內(nèi)置的AI工具。

管理和監(jiān)視
通過命令行工具、API、門戶和動態(tài)管理視圖的組合提供管理和監(jiān)視。
可以使用Azure Data Studio在大數(shù)據(jù)群集上執(zhí)行各種任務(wù)。這是由新的SQL Server 2019擴展(預(yù)覽版)啟用的。 此擴展提供:
用于常見管理任務(wù)的內(nèi)置片段。
瀏覽HDFS、上傳文件、預(yù)覽文件和創(chuàng)建目錄的能力。
創(chuàng)建、打開和運行與Jupyter兼容的筆記本的能力。
用于簡化外部數(shù)據(jù)源的創(chuàng)建的數(shù)據(jù)虛擬化向?qū)А?/p>
體系結(jié)構(gòu)
SQL Server大數(shù)據(jù)群集是由Kubernetes編排的Linux 容器群集。
Kubernetes的概念
Kubernetes是一個開放源代碼容器業(yè)務(wù)流程協(xié)調(diào)程序,可以根據(jù)需要縮放容器部署。下表定義了一些重要的Kubernetes術(shù)語:
| Cluster Kubernetes | 群集是一組稱為節(jié)點的計算機。一個節(jié)點控制群集并被指定為主節(jié)點,其余節(jié)點是工作器節(jié)點。Kubernetes主節(jié)點負責(zé)在工作器節(jié)點之間分配工作,并負責(zé)監(jiān)視群集的運行狀況。 | 
| Node | 節(jié)點運行容器化應(yīng)用程序。 它可以是物理計算機或虛擬機。 Kubernetes 群集可以混合包含物理計算機節(jié)點和虛擬機節(jié)點。 | 
| Pod | Pod是Kubernetes的原子部署單元。Pod是運行應(yīng)用程序所需的一個或多個容器和相關(guān)資源的邏輯組。一個Pod只能在一個節(jié)點上運行,一個節(jié)點可以運行一個或多個Pod。Kubernetes主節(jié)點自動將Pod分配給群集中的其余節(jié)點。 | 
在SQL Server大數(shù)據(jù)群集中,Kubernetes負責(zé)SQL Server大數(shù)據(jù)群集的狀態(tài),Kubernetes構(gòu)建和配置群集節(jié)點,將pod分配給節(jié)點,并監(jiān)視群集的運行狀況。
大數(shù)據(jù)群集體系結(jié)構(gòu)
下圖顯示了SQL Server的大數(shù)據(jù)群體的組件。

控制器
控制器為群集提供管理和安全性。它包含控制服務(wù)、配置存儲和其他群集級服務(wù),例如Kibana、Grafana和彈性搜索。
計算池
計算池為群集提供計算資源。它包含在Linux上的SQL Server Pod上運行的節(jié)點。計算池中的Pod分為用于特定處理任務(wù)的SQL Compute實例。
數(shù)據(jù)池
數(shù)據(jù)池用于數(shù)據(jù)暫留和緩存。數(shù)據(jù)池由一個或多個運行Linux上的SQL Server的Pod組成。它用于從SQL查詢或Spark作業(yè)中提取數(shù)據(jù)。SQL Server大數(shù)據(jù)群集數(shù)據(jù)市場持久保留在數(shù)據(jù)池中。
存儲池
存儲池由Linux上的SQL Server、Spark和HDFS組成的存儲池Pod組成。SQL Server大數(shù)據(jù)群集中的所有存儲節(jié)點都是HDFS群集的成員。
后續(xù)步驟
有關(guān)部署SQL Server大數(shù)據(jù)群集的詳細信息,請參閱SQL Server大數(shù)據(jù)群集入門。
*想要獲得Microsoft SQL Server更多資源或正版授權(quán)的朋友,可以咨詢了解哦~
慧都網(wǎng)·1024程序員節(jié),DevExpress、MyEclipse、Axure RP、Aspose、FastReport等產(chǎn)品限時放“價”,給你專屬寵愛!點擊下方圖片查看活動詳情↓↓↓
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@ke049m.cn
文章轉(zhuǎn)載自: