一、項目簡介
大數(shù)據(jù)治理工程師是由工業(yè)和信息化部教育與考試中心推出的一套針對大數(shù)據(jù)治理領(lǐng)域?qū)I(yè)人才的考核體系,涵蓋了從基礎(chǔ)到高級的全面技能要求,旨在培養(yǎng)能夠在互聯(lián)網(wǎng)、金融等眾多行業(yè)中,運用大數(shù)據(jù)治理技術(shù)進行數(shù)據(jù)整合、處理、分析與應用的專業(yè)人才,以提升企業(yè)數(shù)據(jù)管理水平,挖掘數(shù)據(jù)價值,助力企業(yè)數(shù)字化轉(zhuǎn)型和決策優(yōu)化。
“大數(shù)據(jù)治理工程師”證書分為初級、中級、高級三個等級,每個等級對相關(guān)從業(yè)人員的知識和技能要求逐步提升,形成了一套完整的人才培養(yǎng)和評估體系。
二、能力標準
1、大數(shù)據(jù)治理工程師(初級)
掌握Linux操作系統(tǒng)的基本操作,具備一定的Python數(shù)據(jù)分析基礎(chǔ)知識,了解數(shù)據(jù)分析的基本流程,能夠進行簡單的數(shù)據(jù)預處理和分析任務。
對ETL大數(shù)據(jù)整合與處理有初步認識,理解數(shù)據(jù)抽取、轉(zhuǎn)換和加載的基本概念,能夠在指導下完成簡單的數(shù)據(jù)處理任務,如創(chuàng)建數(shù)據(jù)庫連接、進行基礎(chǔ)的數(shù)據(jù)處理操作等。
2、大數(shù)據(jù)治理工程師(中級)
熟練掌握?Linux 操作系統(tǒng)的進階技能,能夠編寫簡單的腳本實現(xiàn)自動化任務,提升工作效率。深入理解?Python 數(shù)據(jù)分析與挖掘技術(shù),能夠運用數(shù)據(jù)分析工具和技術(shù)解決實際業(yè)務問題。
熟練掌握?ETL 大數(shù)據(jù)整合與處理流程,能夠獨立完成數(shù)據(jù)處理任務。具備一定的數(shù)據(jù)存儲和管理知識,了解數(shù)據(jù)倉庫的基本概念,能夠進行數(shù)據(jù)庫的簡單管理和維護。
3、大數(shù)據(jù)治理工程師(高級)
精通?Linux 操作系統(tǒng),能夠?qū)ο到y(tǒng)進行優(yōu)化配置,解決復雜的系統(tǒng)故障和性能問題,確保大數(shù)據(jù)處理環(huán)境的穩(wěn)定運行。能夠運用高級數(shù)據(jù)分析算法和技術(shù)進行深度數(shù)據(jù)挖掘,為企業(yè)提供數(shù)據(jù)驅(qū)動的決策建議。
熟練掌握?ETL 大數(shù)據(jù)整合與處理技術(shù),能夠設計和優(yōu)化大型數(shù)據(jù)處理流程,處理海量數(shù)據(jù)的集成和轉(zhuǎn)換任務。深入理解數(shù)據(jù)存儲技術(shù),能夠構(gòu)建高效的數(shù)據(jù)存儲和管理系統(tǒng)。
掌握多種大數(shù)據(jù)實時處理框架,滿足企業(yè)對實時數(shù)據(jù)處理的需求。在機器學習進階知識領(lǐng)域,熟悉各類算法、集成學習和強化學習等技術(shù),能夠?qū)⑦@些技術(shù)應用于實際項目中,解決復雜的業(yè)務問題。
具備大數(shù)據(jù)治理項目的整體規(guī)劃和管理能力,能夠帶領(lǐng)團隊完成大數(shù)據(jù)治理項目的實施,確保項目目標的達成。
三、課程內(nèi)容
階段 | 課程 | 知識模塊 |
基礎(chǔ)知識 | Linux操作系統(tǒng)基礎(chǔ) | Linux概述與系統(tǒng)安裝 Linux基本命令 Linux Vi 編輯器 Linux Shell 編程 |
Python數(shù)據(jù)分析與挖掘技術(shù) | 數(shù)據(jù)分析概述 NumPy數(shù)值計算基礎(chǔ) Pandas統(tǒng)計分析基礎(chǔ) Pandas數(shù)據(jù)預處理 | |
ETL大數(shù)據(jù)整合與處理 | 認識ETL 創(chuàng)建數(shù)據(jù)庫連接 數(shù)據(jù)處理 特征字段構(gòu)建 記錄集連接 數(shù)據(jù)輸出 數(shù)據(jù)檢查 | |
大數(shù)據(jù)治理技術(shù) | 數(shù)據(jù)存儲技術(shù) | 數(shù)據(jù)倉庫 數(shù)據(jù)庫管理系統(tǒng)與數(shù)據(jù)存儲 查詢事務管理與系統(tǒng)結(jié)構(gòu) 分布式文件系統(tǒng)概述 環(huán)境配置 Hadoop集群配置與啟動 Hadoop安全模式與HDFS操作 非關(guān)系型數(shù)據(jù)庫概述 MongoDB部署模式與數(shù)據(jù)分片 系統(tǒng)部署單節(jié)點MongoDB Linux系統(tǒng)部署MongoDB副本集與分片集群 數(shù)據(jù)庫管理工具 |
Zookeeper分布式服務框架 | 大數(shù)據(jù)傳輸 分布式服務框架Zookeeper基礎(chǔ)及安裝 Znode創(chuàng)建與查看 權(quán)限設置與查看 | |
Storm大數(shù)據(jù)實時處理 | 大數(shù)據(jù)實時處理框架Storm簡介及安裝 Storm開發(fā)環(huán)境配置實戰(zhàn) Storm集群運行介紹及相關(guān)命令實戰(zhàn) Storm集成Hadoop API Storm集成Kafka | |
Flink大數(shù)據(jù)實時處理 | 大數(shù)據(jù)實時處理框架Flink概念及應用場景 Flink數(shù)據(jù)模型/時間窗口及核心概念 Flink安裝啟動與監(jiān)控 Flink基礎(chǔ)API及核心數(shù)據(jù)結(jié)構(gòu) Flink開發(fā)環(huán)境配置及運行實例 Flink DataStream API編程 Flink與Kafka整合實例 | |
機器學習進階知識 | 分類與回歸 | 回歸分決策樹算法介紹 泰坦尼克號生還者預測 人工神經(jīng)網(wǎng)絡介紹 單樣本網(wǎng)絡訓練 全樣本網(wǎng)絡訓練 K近鄰算法 樸素貝葉斯 支持向量機算法介紹 支持向量機代碼實現(xiàn) 市財政收入分析及預測析 |
聚類分析 | 聚類分析概述密度與層次聚類 根據(jù)刷卡經(jīng)緯度信息分析乘客上車站點與實現(xiàn) | |
推薦算法 | 智能推薦系統(tǒng)簡介 關(guān)聯(lián)規(guī)則 協(xié)同過濾 FM&Ranking模型 | |
時間序列 | 時間序列原理與實現(xiàn) 腦卒中發(fā)病環(huán)境因素分析及干預 金融服務機構(gòu)資金流量預測 | |
集成學習與強化學習 | 集成學習概述與實現(xiàn) 強化學習概述與實現(xiàn) 網(wǎng)絡入侵用戶自動識別 | |
職業(yè)技術(shù)考核 | 大數(shù)據(jù)治理工程師(高級)職業(yè)技術(shù)考試 |
四、報考條件
初級:無要求 ,皆可報考。
中級:(滿足其中一個條件即可)
1.獲得初級證書。
2.年滿18周歲,具備高中以上學歷,工作年限滿1年
高級:(滿足其中一個條件即可)
1.獲得中級證書。
2.年滿20周歲以上,工作年限滿2年
3.年滿20周歲以上,具備大專及以上學歷
五、考試方式
考試方式分為線下考試站點或線上考試系統(tǒng)統(tǒng)考兩種方式,考試形式為上機答題,閉卷。
考試題型:
初級:120 分鐘,單選題+多選題+判斷題+操作題+簡答題,上機答題。
中級:120 分鐘,單選題+多選題+判斷題+操作題+簡答題,上機答題。
高級:120 分鐘,單選題+多選題+判斷題+操作題+簡答題,上機答題。
六、成績評分
考試最終成績滿分為100分,成績80-100分為優(yōu)秀;成績60-79分為合格;成績60分以下為不合格。
七、證書樣本
學員經(jīng)考核合格,由工業(yè)和信息化部教育與考試中心頒發(fā)大數(shù)據(jù)治理工程師職業(yè)技術(shù)證書 ,證書可登錄國家工信部教育與考試中心官網(wǎng)查詢。
據(jù)治理工程師.png)
八、官方指定報名渠道www.xmqqs.cn,詳情可咨詢:
必須備注:大數(shù)據(jù)治理工程師
