Hadoop是一個(gè)允許跨集群的分布式處理大型數(shù)據(jù)集的開(kāi)源軟件
標(biāo)簽:開(kāi)源Hadoop開(kāi)發(fā)商: Apache
當(dāng)前版本: v2.6.1
產(chǎn)品類型:軟件
產(chǎn)品功能:工業(yè)數(shù)據(jù)采集軟件
平臺(tái)語(yǔ)言:
開(kāi)源水平:提供源碼
本產(chǎn)品的分類與介紹僅供參考,具體以商家網(wǎng)站介紹為準(zhǔn),如有疑問(wèn)請(qǐng)來(lái)電 023-68661681 咨詢。
* 關(guān)于本產(chǎn)品的分類與介紹僅供參考,精準(zhǔn)產(chǎn)品資料以官網(wǎng)介紹為準(zhǔn),如需購(gòu)買請(qǐng)先行測(cè)試。
HDFS——對(duì)外部客戶機(jī)而言,HDFS就像一個(gè)傳統(tǒng)的分級(jí)文件系統(tǒng)。可以創(chuàng)建、刪除、移動(dòng)或重命名文件,等等。但是HDFS的架構(gòu)是基于一組特定的節(jié)點(diǎn)構(gòu)建的,這是由它自身的特點(diǎn)決定的。這些節(jié)點(diǎn)包括 NameNode,它在HDFS內(nèi)部提供元數(shù)據(jù)服務(wù);DataNode,它為HDFS提供存儲(chǔ)塊。
NameNode——NameNode是一個(gè)通常在HDFS實(shí)例中的單獨(dú)機(jī)器上運(yùn)行的軟件。它負(fù)責(zé)管理文件系統(tǒng)名稱空間和控制外部客戶機(jī)的訪問(wèn)。NameNode決定是否將文件映射到DataNode上的復(fù)制塊上。對(duì)于最常見(jiàn)的3個(gè)復(fù)制塊,第一個(gè)復(fù)制塊存儲(chǔ)在同一機(jī)架的不同節(jié)點(diǎn)上,最后一個(gè)復(fù)制塊存儲(chǔ)在不同機(jī)架的某個(gè)節(jié)點(diǎn)上。
DataNode——ataNode 也是一個(gè)通常在HDFS實(shí)例中的單獨(dú)機(jī)器上運(yùn)行的軟件。Hadoop 集群包含一個(gè)NameNode 和大量 DataNode。DataNode通常以機(jī)架的形式組織,機(jī)架通過(guò)一個(gè)交換機(jī)將所有系統(tǒng)連接起來(lái)。Hadoop 的一個(gè)假設(shè)是:機(jī)架內(nèi)部節(jié)點(diǎn)之間的傳輸速度快于機(jī)架間節(jié)點(diǎn)的傳輸速度。
Linux 集群——Hadoop框架可在單一的Linux平臺(tái)上使用。
Hadoop Common——常見(jiàn)的實(shí)用程序,支持其他Hadoop模塊。
Hadoop Distributed File System (HDFS™)——一個(gè)分布式文件系統(tǒng),它提供了高通量訪問(wèn)應(yīng)用程序數(shù)據(jù)。
Hadoop YARN——一個(gè)集群作業(yè)調(diào)度和資源管理的框架。
Hadoop MapReduce——YARN-based系統(tǒng)并行處理大型數(shù)據(jù)集。
更新時(shí)間:2016-01-22 14:27:59.000 | 錄入時(shí)間:2014-06-04 10:55:28.000 | 責(zé)任編輯:陳俊吉