大數據架構師的基本職責(通用15篇)
大數據架構師的基本職責 篇1
職責:
1.負責整個大數據平臺架構的設計和構建;
2.負責構建大數據平臺的數據交換、任務調度等通用平臺;
3.制定開發、測試、實施、維護的標準和規范,指導和培訓工程師,不斷提升團隊能力。
4.參與系統需求分析、架構設計、技術選型、應用設計與開發以及測試與部署,負責編寫核心部分代碼。
5.持續挑戰新的技術方向,攻克大數據量、高并發、高可用、可擴展等技術難點。
任職要求:
1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗
2.大規模數據處理的架構和設計實戰經驗
3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,并具有豐富的大型數據平臺工程經驗
4.深刻理解大數據處理(流計算,分布式計算,分布式文件系統,分布式存儲等)相關技術和實現方法
5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平臺上的開發環境
6.本科或以上學歷,計算機軟件或相關專業,豐富的java開發經驗和互聯網背景優先。
7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精
大數據架構師的基本職責 篇2
職責:
1、負責大數據平臺的架構設計、核心代碼開發等任務;根據項目要求編寫相關技術文檔;
2、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
3、負責核心模塊研發,負責大數據平臺的搭建,完成系統調試、集成與實施;
4、負責建立和維護大數據平臺技術標準規范,指導開發人員編寫代碼;
任職要求:
1、本科及以上計算機相關專業畢業;
2、精通離線和實時數據處理流程,掌握離線數據處理框架hive、impala、spark-sql等,掌握實時數據處理常用技術工具,包括Storm、SparkStreaming等;
3、熟悉大數據技術生態圈,精通大數據技術架構,有大數據平臺構建經驗;
4、掌握常見數據流接入工具,包括Flume、kafka等;
5、熟練掌握基本的Linux操作系統和某種腳本語言編程(如Shell等);
6、掌握一種或以上實時處理語言,如JAVA、SCALA、PYTHON等,有SCALA經驗者優先;
7、有實際大規模數據(TB級以上)處理經驗優先;
大數據架構師的基本職責 篇3
職責:
1. 深刻理解政府行業業務模式,構建政府行業的數據模型,制定公司大數據技術發展路線;
2. 對接業務研究和技術部門,主動搜集和轉化需求,組織數據中心業務開發,進行數據相關產品需求分析和設計;
3. 搭建數據倉庫,研發數據庫管理系統,搜集、提取、處理業務積累的海量數據,開展數據分析和挖掘;
4. 根據公司戰略和發展需要,規劃數據中心重點工作和任務;落實部門人員、事務管理,開展跨部門、跨地區協作,協助對外交流與合作。
職位要求:
1. 5年以上相關工作經驗,有團隊管理和項目管理經驗者優先;
2.了解政府運作機制,掌握財政行業知識,有電子政務行業經驗者優先;
3. 熟練掌握使用Java或Python,精通數據庫查詢語言如SQL,Oracle等,在機器學習模型和算法方向有應用經驗者優先;
4. 具備數據中心產品策劃整體思維,有大數據處理、分析、挖掘經驗者優先;
5. 邏輯思維嚴密,具備業務抽象、分解和標準化的能力,口頭和書面表達優秀;
6. 有較強的大局意識和良好的團隊合作意識,富有領導力,具備優秀的人際交往和溝通能力。
大數據架構師的基本職責 篇4
職責:
1、從事電信行業大數據項目相關業務調研、產品標準建設、核心模型設計和優化、系統測試等相關工作
2、與數據專業委員會一起研究數據建模方案和建模工具,負責產品線產品的數據架構、數據模型設計
3、參與研究數據庫之間的數據轉換方式,參與項目中的數據移植工作,收集在項目中的數據移植經驗,優化產品的數據模型
4、負責培訓本部門隊伍的數據模型基礎理論工作,建立數據模型團隊
崗位要求:
1、統招本科學歷,3年以上主流數據上(DB2、Oracle、SQLServer、Mysql等)ETL設計、開發經驗,具備大型數據倉庫邏輯模型和物理模型設計經驗,精通SQL,有較好的SQL性能調優經驗;
2、擁有Python,R等數學建模工具的使用經驗,并具備一定的數據處理和建模經驗,可以輸出相應的模型分析結果、模型比較、模型效率以及對模型的理論和判斷依據方法并對其進行完整的解釋和說明;
3、熟悉統計學基本原理,做過實戰的數據建模項目;
4、有分布式數據倉庫建設相關經驗者優先,具備電信行業數據倉庫建設相關經驗者優先;
大數據架構師的基本職責 篇5
職責:
1、負責公司的大數據處理框架的研發設計工作,梳理可實現方案和技術規范;
2、開發、完善公司大數據平臺;參與公司離線、實時大數據處理系統的設計、開發、測試及多個業務模塊的自動化集成;
3、負責業務平臺數據統計分析模塊的設計與規劃;
4、負責公司產品研發過程中的數據及存儲設計;
5、帶領和培養團隊完成組織分解的目標;
任職要求:
1、統招本科及以上學歷,計算機、軟件工程相關專業,至少8年以上工作經驗,5年以上大數據開發經驗;
2、熟悉Java、Hadoop、HDFS、Hive、HBase、Spark、Storm、Flume等相關技術的基礎架構
3、熟悉數據倉庫,數據算法,分布式計算技術理論,具有大數據整體系統架構設計經驗;
4、熟悉Linux系統,熟練使用shell/perl/python腳本處理問題;
5、對深度學習框架(Tensorflow)和機器學習(svm 隨機深林貝葉斯等)有一定了解的優先;
6、能夠組織項目開發組協同工作,包括團隊溝通、計劃、開發環境管理等
大數據架構師的基本職責 篇6
1、建設大數據平臺,主要技術為k8s, docker;
2、跟進開源社區的更新,閱讀文檔,驗證feature;
3、閱讀容器生態圈各組件的開源項目代碼,開發新功能;
4、持續提升平臺的性能和穩定性。
大數據架構師的基本職責 篇7
職責:
1、負責大數據項目或產品中架構設計、數據倉庫公共層與應用層建模;
2、負責大數據項目或產品中業務需求的需求理解、數據指標維度需求梳理、數據探查和分析,指導技術團隊進行工作;
3、負責大數據項目中的具體技術管理工作,完成驗收目標。
4、發現并解決數據質量問題,推動整體數據質量提升。
任職要求:
1、計算機相關專業,3年以上數據研發與數據倉庫相關開發經驗;
2、熟練掌握維度建模方法,有大型數倉構建經驗優先;
3、精通Oracle/DB2/Teradata等主流數據庫編程,有較好的SQL性能調優經驗;
4、扎實的編程基礎和動手能力,精通至少一門編程語言,有大數據、分布式開發經驗尤佳;
5、有良好溝通協調能力,有帶領小團隊或項目管理工作經驗;
6、具備很強的責任心,做事細致、嚴謹,同時需要具備較強的溝通和學習能力,能快速理解行業的需求,對農業等行業數據應用有經驗者優先;
7、能夠接受出差。
大數據架構師的基本職責 篇8
職責:
1、負責公司大數據產品的架構設計,包含數據收集、數據存儲、數據應用,并完成相關架構設計文檔的撰寫;
2、參與規劃從數據源到數據應用的整體流程,并參與相關產品的決策;
3、負責解決核心技術問題,對技術方案進行決策;
4、負責大數據研發團隊建設、人才梯隊培養和技術團隊管理;
5、積極了解業界發展,研究與跟蹤大數據新技術發展方向。
任職要求:
1、精通GoldenGate For BigData相關理論,具備大型數據利用的生產實戰經驗;
2、精通數據驅動的理論,設計并生產上線相關數據驅動的產品;
3、精通常用消息中間件的使用,例如kafka/RocketMQ/Apache Pulsar,有解讀相關源碼者優先;
4、掌握hadoop、spark生態體系相關產品的使用,掌握MapReduce編程或Spark編程;
5、了解傳統數據倉庫理論及相關ETL工具,例如kettle/datastage;
6、熟悉Oracle、Mongodb、Mysql數據庫的使用;
7、扎實的Java語言基礎,熟悉Java開發工具和調試工具的使用;
8、良好的團隊協作精神,有能力對團隊在軟件設計、實現和測試方面進行指導;
9、良好的邏輯分析能力和溝通能力,執行力強、對待工作認真嚴謹、責任心強、具備出色的學習能力和團隊合作精神,有一定的推動能力;
10、計算機科學、信息技術或相關領域本科以上學歷,具有5年以上數據平臺項目開發經驗,3年以上的架構設計經驗,具有大數據平臺應用大型項目架構設計經驗優先;
大數據架構師的基本職責 篇9
職責:
1、負責大數據開發團隊建設;
2、負責行業大數據產品架構設計與研發;
3、負責帶領團隊進行行業大數據產品關鍵技術攻關。
任職要求:
1、有三年以上大數據應用、開發經驗;具備海量數據加工處理(ETL)相關經驗,對數據挖掘及機器學習有較為深刻的理解;
2、熟悉Hadoop相關技術,對HDFS、MapReduce、Hive、HBase有一定的使用和開發經驗;
3、熟悉Linux,熟練使用Shell或Python,進行腳本編寫;
4、對數據結構和數據統計分析算法有較為深刻理解;
5、掌握至少一種主流關系數據庫開發技術:Oracle、SQL Server、MySQL等;
6、掌握實時流計算技術,有Spark、Storm開發經驗者優先;
7、需要具備2年以上研發團隊管理經驗。
大數據架構師的基本職責 篇10
職責:
1.負責過多個大數據項目的架構;
2.精通Hadoop、Spark, HBase等主流的大數據平臺、精通各組件優化設計原理;
3.精通大數據實時流式處理的設計和應用;
3.熟悉大數據平臺調優,具備大數據生產平臺調優經驗;
4.金融行業,運營商行業大數據架構經驗更優;
5.研究大數據技術的最新發展,并引入到公司技術架構;
6.指導大數據工程師的日常工作,并培養技術骨干。
任職資格:
1.計算機相關專業本科或以上學歷;
2.具有5年以上大數據相關開發經驗;
3.具有2年以上帶團隊經驗
4.對Hadoop/Hive/Spark/HBase/ES等等大數據常用技術有深刻理解,能夠帶領團隊進行技術攻堅,完成中間件的實施、改造、調優;
5.精通海量數據和實時數據的分析處理,能對線上的數據處理性能問題做調優;
6.精通數據倉庫以及維度建模原理,有大型數據倉庫建設經驗;
7.精通關系型數據庫和NoSQL數據庫的使用,熟悉相關理論;
8.溝通順暢,重點突出,高效。
大數據架構師的基本職責 篇11
職責:
1. 負責大數據基礎平臺、海量數據存儲/處理分布式平臺、數據分析系統架構設計和研發;
2. 負責實時計算平臺基礎架構設計、部署、監控、優化升級;
3. 制定項目/數據倉庫設計及實現規范,指導設計研發和部署;
4. 協助策略和算法團隊工作,保障數據挖掘建模和工程化;
5. 深入研究大數據相關技術和產品,跟進業界先進技術;
任職要求:
1. 全日制本科及以上學歷,5年以上軟件和分布式系統研發經驗,3年以上大數據系統架構經驗;
2. 精通Hadoop/HBase/Spark/Storm/Redis技術及其生態圈;
3. 具備良好的系統分析能力、故障診斷能力;
4 有大數據策略、算法、可視化經驗優先。
大數據架構師的基本職責 篇12
職責:
1、負責面向政府信領域的企業(不限于)大數據平臺、大數據應用等系統的架構設計、技術規劃、技術選型
2、跟進業界大數據技術發展動態,匹配行業應用訴求,制定大數據策略,提前識別關鍵技術并完成技術驗證;
3、支撐售前完成項目解決方案技術架構的設計及重要客戶的交流;
4、負責指導研發完成大數據產品的開發
5、帶領團隊進行產品核心技術的創新和積累
崗位要求:
1、熟悉BI和大數據領域的解決方案,具備該領域全面的技術積累,包括報表平臺,OLAP引擎和DB,ETL,數據倉庫建模和設計,海量分布式數據處理分析架構;
2、在大數據處理和分析領域具有3年或者以上的技術規劃、架構設計經驗,并有成功的項目實踐;
3、4年以上Hadoop實戰經驗,熟悉Hadoop底層文件系統及分布式計算框架,具備傳統數據倉庫、MPP、Hadoop等混搭平臺架構的設計能力和數據建模能力,對大規模數據并行計算、傳輸、處理等有豐富的經驗;
4、有實際應用storm、spark、flume、kafka等項目經驗優先;
5、卓越的技術領導力,善于溝通、發現和解決產品需求階段、開發階段和測試階段的問題,并能提供合理解決方案,有大中型互聯網企業工作背景優先。
大數據架構師的基本職責 篇13
職責:
1、負責大數據平臺架構的評估、規劃和設計 ;負責海量數據采集、處理及存儲、應用方案的技術選型及架構實現;
2、開發大數據平臺的核心代碼,負責大數據平臺的搭建,完成系統調試、集成與實施,技術難題的解決,保證大數據產品的上線運行 ;
3、根據業務需求持續優化數據架構,保證產品的可靠性、穩定性 ;
4、指導開發人員完成數據模型規劃建設,分析模型構建及分析呈現 ,分享技術經驗;
5、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
6、深入研究大數據相關技術和產品,跟進業界先進技術;
任職資格:
1.本科及以上學歷,數學或計算機相關專業畢業,不少于5年的工作經驗,具有扎實的計算機基礎理論知識;
2.有3年以上Hadoop、Spark、Hbase平臺性能調優經驗;熟悉sparkstreaming等實時計算技術
3.熟悉hive、hbase、storm、mahout、flume、ElasticSearch、Spark、Kafka等,具備實際項目設計及開發經驗;
4.熟悉sparkstreaming等相關的實時計算技術;
5.熟悉大規模數據挖掘、機器學習、自然語言處理、分布式計算中一項或多項技術,并具備多年的實際工作經驗;
6.熟悉主流關系型數據庫(Oracle、MySql)、NoSql數據庫,熟悉pl/sql編程;精通Linux操作系統,熟練使用Java;熟悉常用框架.如Spring、MyBatis等;
7.具有較強的執行力,高度的責任感、很強的學習、溝通能力,能夠在高壓下高效工作;
大數據架構師的基本職責 篇14
職責:
1. 負責大數據基礎和應用平臺的整體規劃和架構設計,參與需求分析,架構設計,詳細設計以及技術選型決策
2. 參與數據挖掘和建模相關核心算法的代碼實現
3. 負責大數據算法平臺的技術把關,性能調優,控制架構質量,解決項目技術難題;對研發項目和任務需求進行評估和方案設計、拆分任務并指導工程師完成開發
4. 帶領團隊提供并實現大數據算法平臺上各項數據接入、數據挖掘分析及數據可視化的架構設計與能力,支持解決方案實施
5. 負責數據庫設計、應用架構設計、核心技術選型等工作
6. 協調解決開發中的技術問題、設計和監控運營指標,保障系統穩定運行
7. 培養,指導有能力的員工,指導工程師進行技術驗證實現,核心技術攻關,解決開發過程中的技術難題
任職要求:
1. 熟悉大數據和數據倉庫的系統架構設計方法
2. 熟練使用并理解HadoopSpark架構及生態。(Hadoop,Hive,Hbase,Elasticsearch,Kafka,SparkFlink等)
3. 熟悉分布式系統架構,有分布式實時、離線和機器學習平臺的架構和開發經驗,具備海量數據清洗、分析處理及存儲的實踐經驗
4. 熟練使用JAVA,具有大規模分布式系統調優經驗
5. 熟悉AI相關算法,熟悉機器學習、深度學習。熟悉AI學習開源框架(Tensorflow、PyTorch等)者優先;
6. 具備良好的團隊合作精神,對工作充滿激情。
7. 熟悉FusionInsight平臺開發經驗者優先
大數據架構師的基本職責 篇15
職責:
1、負責大數據基礎平臺的整體規劃和架構設計,參與需求分析、技術決策以及詳細設計;
2、為現有大數據集群Hadoop、hive平臺提供性能調優、架構優化重組,解決系統中的關鍵問題和技術難題;
3、把握基礎業務復雜系統的設計,確保系統的架構質量,編寫核心部分代碼;
4、持續挑戰新的技術方向,攻克大數據量,高并發,穩定性等各種技術難點。
任職資格:
1、計算機或相關專業本科及以上學歷;
2、5年以上hadoop的應用開發經驗,5年以上數據倉庫開發實踐經驗,至少一個企業級數據倉庫項目開發經驗或者大數據處理項目經驗;
3、良好的編程開發能力,精通PHP及其他開發語言;
4、熟悉mysql等數據庫經驗,具備優秀的SQL編寫、調優能力;
5、熟練掌握Linux常規命令與工具,精通shell, perl, python等腳本語言至少一種;
6、軟件基礎理論知識扎實,具有良好的數據結構、算法功底;
7、對新技術敏感,學習能力強,樂于接受挑戰,具有良好的團隊合作精神;