基于Hadoop平臺的數(shù)據(jù)遷移系統(tǒng)的設計與實現(xiàn)
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
圖2-1數(shù)據(jù)遷移系統(tǒng)流程圖(Teradata到Hadoop)??
?山東大學碩士學位論文???主要功能和流程如圖2-1。??r ̄^?r ̄^????????????????>????Tijaia?-?數(shù)據(jù)抽取+數(shù)據(jù)溝洗—數(shù)賺數(shù)雛驗?數(shù)據(jù)臓—?Hado叩??數(shù)據(jù)庫?|丨?[__?1丨?平臺???數(shù)鮰傳???圖2-1數(shù)據(jù)遷移系統(tǒng)流程圖(Teradat....
圖2-2系統(tǒng)業(yè)務架構(gòu)圖??本系統(tǒng)研究的重點是把Teradata中的部分數(shù)據(jù)遷移至Hadoop,需要特別注??意的是系統(tǒng)連接和文件讀取
?山東大學碩士學位論文???2.4系統(tǒng)業(yè)務流程分析??結(jié)合企業(yè)現(xiàn)有系統(tǒng)的實際情況,本系統(tǒng)的處理流程分為三個域:源數(shù)據(jù)域、??數(shù)據(jù)處理域、目標數(shù)據(jù)域,具體架構(gòu)如圖2-2所示。源數(shù)據(jù)域是指待遷移數(shù)據(jù)??所在的業(yè)務系統(tǒng),在本文中具體是指Teradata數(shù)據(jù)庫中的接口詳單表、中間匯??總....
圖3-2?MapReduce數(shù)據(jù)處理流程圖??(1)?Ma階段運行開始前,計算文件數(shù)量并進行分片,每個分片對應于一??
源。??3丄2?MapReduce數(shù)據(jù)處理流程??MapReduce是一種編程范式,使應用程序不需要進行復雜的分布式編程便??可以在分布式系統(tǒng)上執(zhí)行?梢詫ⅲ停幔穑遥澹洌酰悖謇斫鉃楦鶕(jù)某些特征對無序數(shù)據(jù)??進行歸納匯總,然后按需求進行處理以獲得最終結(jié)果。Map階段的任務主要是??....
圖3-3?Hive數(shù)據(jù)倉庫架構(gòu)圖??用戶接口:最常見的用戶接口是Cli,它通過命令行方式訪問Hive,啟動時會??在Hive中生成一個副本
?山東大學碩士學位論文???用戶接口??(、Shell/CLI?j?I^IDBC客戶端?j?l〇DB客戶端^?(?WEI接口?^??\?'Zff?乂」??Thrift?服務器?Z??\?(?解析器?)?、/????(?編譯器?)?、??(?^元數(shù)據(jù)庫??(執(zhí)行器)?^??w??J....
本文編號:3991981
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3991981.html