大數據架構師工作的崗位職責(通用19篇)
大數據架構師工作的崗位職責 篇1
職責
1、負責大數據架構設計,包括定義數據的存儲、集成(ETL)、應用,支撐業務運營和數據分析類需求實現;
2、制定數據治理領域的數據體系化管理措施,包括元數據設計、數據標準、數據質量、數據處理、數據安全等工作,確保數據可信與安全;
3、基于行業數據積累,滿足業務的數據挖掘需求,實現從數據到資產的轉變,根據目標行業建立具有前瞻性的數據模型;
4、對各產品的數據安全負責,主導制定和實施數據庫系統安全策略,保證整體方案數據安全;
崗位要求
業務技能要求:
1、深入理解云化、數據倉庫,在參與過的系統設計中,必須涉及這兩項關鍵技術;
n2、精通或者熟悉Hadoop體系架構,以及HDFS/HBase/Hive/MapReduce/Spark等技術,了解體系架構各組件的優缺點,有直接的產品設計與開發、部署、調優的經驗;
3、精通或熟悉常見RDBMS(Oracle / PostgreSQL / MySql)、NoSQL(Redis / Memcached/ MongoDB)、全文搜索引擎(Solr/ElasticSearch)的使用及開發,了解各數據庫優缺點, 熟悉與架構設計相關的數據存儲、性能調優等相關領域知識,有相關項目經驗尤佳;
4、熟悉業界常用的數據采集、集成、數據存儲、計算、數據模型、數據分析的技術方案,具有數據分析或數據挖掘相關經驗者優先;
n5、熟悉數據治理相關流程,包括數據接入、數據處理、數據治理、數據組織、數據服務等。
專業知識要求:
1、具備數據治理的知識與體系方案,包含政策、組織、角色、流程、規范等,以及規劃相應的支撐方案。了解業界的數據管理方法論;
2、具備數據用例設計和開發能力。能夠基于業務相關數據進行業務需求分析和痛點識別,將業務需求轉化為數據的需求,完成數據用例的設計和開發;
3、精通海量數據(日增量百億)級別數據倉庫、數據集市的構建流程。熟悉公安、政務、工業、交通、醫療等多行業業務者優先。
大數據架構師工作的崗位職責 篇2
職責:
1. 負責大數據平臺的基礎技術規劃,編制相關規范文檔。
2. 負責大數據平臺的數據采集,處理,存儲以及挖掘分析的架構實現。
3. 負責大數據平臺的實際規劃建設,包括環境和框架的規劃搭建以及部分核心編碼工作。
4. 負責大數據相關技術發展方向的預研。
5. 參與業務需求調研,根據需求及行業特點設計大數據解決方案并跟進具體實施項目。
6. 制定大數據平臺中數據質量,業務質量監控及管理辦法。
崗位要求:
1. 全日制本科及以上學歷,5年以上工作經驗,4年及以上大數據架構設計經驗,熟悉大數據解決方案,包括Hadoop平臺、Spark、storm、機器學習、深度學習等大數據解決方案。
2. 深刻理解大數據處理(流計算、分布式計算、分布式文件系統、分布式存儲等相關技術)實現方法。有架構和設計實踐經驗。
3. 精通大型數據庫Oracle、SqlServer等的開發。
4. 精通java,Python中的一種或多種語言。
5. 熟悉容器、虛擬化、微服務框架等相關技術。
6. 對數據敏感,有嚴謹的工作思路,良好的溝通能力和團隊合作精神。
7. 熟悉R,Python,SAS、SPSS等數據挖掘經驗者優先。
8. 高寬展性,高性能,和分布式系統的實踐及運維經驗者優先。
9. 有大型數據倉庫實施、大數據平臺數據開發經驗,熟悉運營商業務者優先。
大數據架構師工作的崗位職責 篇3
職責:
1、負責DMP技術架構設計與構建,根據業務規劃及技術規劃制定應用架構方案;
2、負責設計構建DMP數據采集、存儲及分析框架,設計數據處理的技術流程和規范;
3、負責核心功能的架構與代碼模板編寫,開發與維護系統公用核心模塊;
4、負責基于大數據技術的海量數據的自動化分析處理和統計工作。
崗位要求:
1、計算機或相關專業本科以上學歷,三年以上的開發經驗,二年以上大數據相關軟件架構的實際經驗;
2、精通大數據處理技術,熟悉Hadoop/Storm技術體系,有Hadoop、Hive、Hbase項目經驗;
3、具有較強的架構能力,具有分布式計算、實時計算、數據倉庫、數據挖掘系統的架構經歷優先;
4、對數據敏感,洞察力強,了解國內外廣告發展趨勢;
5.、擅長系統分析與設計,精通常用的設計模式,擅長性能調優;
6、熟悉DMP/RTB技術原理,了解用戶的行為分析及建模;有RTB/DSP/SSP/EXCHANGE/DMP等廣告行業從業經歷。
大數據架構師工作的崗位職責 篇4
職責:
1、負責spark, hadoop, flink等開發和優化。
2、參與前期需求溝通和分析,以產品化開發的思維,完成需求分解和數據架構設計。
3、與研發和數據科學家合作保證產品定義清晰,按時完成產品上線。
4、能夠洞察市場狀況,與各部門合作轉化為基于大數據挖掘的新策略或方案.
5、主動創造和發掘新的基于大數據挖掘產品商業模式.
任職要求:
1、全日制本科及以上學歷,計算機軟件相關專業,5年以上開發經驗,3年以上架構經驗
2、精通hadoop/MapReduce/Spark/Hbase/Flink/Hive/R/Mahout等分布式數據存儲和分布式計算平臺原理,流式計算開發,有開源二次開發經驗者優先。
3、精通大數據挖掘、機器學習.熟練掌握Java/Perl/Python至少一種編程語言。
4、具有數據挖掘和分析、機器學習等項目實施相關經驗者優先;
5、良好的跨部門溝通合作能力,解決不同觀點能力并取得結果。具備敏銳的互聯網產品理解力,學習能力和邏輯思維能力強;
6、較強的自我驅動力、推動和協調能力,強烈的責任心和團隊合作精神;
大數據架構師工作的崗位職責 篇5
職責:
1、負責大數據平臺技術框架的技術選型和搭建;
2、負責核心技術問題公關,建設高可靠性,擴展性及高性能大數據/數據應用平臺;
3、負責規劃數據挖掘的整體流程,負責大數據開發團隊業務需求開發;
4、與其他團隊密切配合,尋求數據層面的業務價值,利用數據分析結論推動產品優化;
5、研究和分享大數據架構領域新技術。
任職要求:
1、計算機相關專業全日制統招本科及以上;
2、5年以上工作經驗,至少3年以上大數據項目相關工作經驗,能夠設計大型大數據系統的架構和技術方案;
3、精通Hadoop/Spark/Hbase/Hive等大數據技術,精通ETL技術;
4、熟悉數據挖掘,了解典型大數據算法和策略;
5、熟悉主流Java技術框架,精通關系型數據庫及SQL語言,熟悉NoSQL/JSON/XML;
6、有較強的學習能力和問題解決能力,邏輯嚴密、思路清晰;
7、有數據倉庫經驗者優先,有金融行業項目經驗者優先。
大數據架構師工作的崗位職責 篇6
職責:
負責大數據平臺的規劃和搭建、完成大數據平臺的日常運營工作,為數據分析和展現提供支持;
對系統框架相關技術和業務進行培訓,并負責核心代碼編寫,指導團隊開發及解決出現的系統問題;
參與基于大數據平臺的創新業務場景進行數據產品的架構設計,負責數據產品的研發交付;
負責處理大數據平臺的疑難問題,為數據團隊提供可靠的技術支持;
負責數據質量、穩定性等數據管理,數據內部共享融通的數據平臺,讓數據標準更規范、數據獲取更高效;
及時跟進大數據領域新技術并分享,提升團隊技術能力。
任職要求:
本科或以上學歷,5年以上數據系統建設經驗,3年以上大數據架構設計經驗;
精通 java,python,scala 等一種大數據開發語言,熟悉Hadoop生態圈,包括但不限于hdfs,hive,spark, 有豐富的大數據項目的實踐經驗;
具備創新精神,條理清晰,溝通表達和邏輯思維能力強;
熟悉數據倉庫的設計和開發,對數據架構有深入的了解和具備相關的項目實踐經驗優先;
對SQL on Hadoop 的開源查詢引擎(如Presto、 Apache Drill ) 原理有深入研究優先;
有敏捷大數據和數據可視化實踐經驗優先。
大數據架構師工作的崗位職責 篇7
職責:
1、 負責大數據倉庫、數據集市的規劃及實現,負責大數據中臺的設計和核心開發工作;
2、 負責數據基礎架構和數據處理體系的升級和優化,不斷提升系統的穩定性和效率,為公司的業務提供大數據底層平臺的支持和保證;
3、 大數據平臺的數據采集、處理、存儲以及挖掘分析的架構實現;
4、 研究未來數據模型和計算框架的創新與落地,包括但不限于以下領域:大規模數據實時化、研發模式敏捷化、數據計算框架輕量化、數據模型組織方式業務化等方面,參與制定并實踐團隊的技術發展路線
任職資格:
1、 精通數據建模、數據標準管理、元數據管理、數據質量管理;
2、 有作為技術負責人系統化解決問題的成功案例;有海量數據實踐經驗優先;
3、 熟悉目前正在發展的大數據分布式平臺前沿技術的應用;包括但不僅僅限于:hadoop、flink、spark等;
4、 性格積極樂觀,誠信,能自我驅動,有較強的語言表達能力;具備強烈的進取心、求知欲及團隊合作精神;具有良好的溝通、團隊協作、計劃和創新的能力; 在數據業界有一定的影響力優先,具有風控經驗背景的人優先;
5、 具備獨立的深度思考能力,給出結合實際情況的較為理想的技術解決方案。
大數據架構師工作的崗位職責 篇8
職責:
1、大數據平臺的規劃、設計、實施,并優化數據庫;
2、對數據庫進行管理,負責數據庫應用系統的運營及監控;
3、對數據庫性能分析與調優,排錯,保證數據正確率;
4、配合其他部門進行的數據處理、查詢,統計和分析工作;
5、完成公司下達的項目開發任務。
任職要求:
1、計算機及相關專業本科以上學歷,5年以上軟件開發從業經驗,其中包括至少2年以上的大數據開發工作經驗;
2、熟悉hive,hadoop/spark,hbase等大數據相關技術架構,有管理或優化大型分布式集群經驗;
3、熟悉linux基本命令,精通SQL腳本的編寫,有豐富的數據庫管理、運維調優經驗;
4、熟悉C++、Java、C#等開發語言;
5、有互聯網電商行業大數據分析處理和大型數據倉庫的設計和實施經驗;
6、有分布式系統分析及架構設計經驗和大型計算集群的基礎設施開發維護經驗;
7、快速處理系統突發事件的能力,較強的學習和創新能力;
8、良好的溝通能力和團隊合作精神。
大數據架構師工作的崗位職責 篇9
職責:
1、負責自然語音交互、IOT家電物聯控制、知識圖譜等相關模塊和系統的開發;
2、負責掌握第三方接口的調用和功能實現,持續優化服務性能和容量,并保證產品的兼容性和執行效率;
3、根據設計文檔和需求說明完成代碼編寫、調試、單元測試與維護,確保項目進度和質量;
4、協助制定測試計劃,及時發現并修復BUG,實現服務端的性能優化。
任職資格:
1、大學本科3年以上工作經驗,計算機相關專業;
2、熟悉軟件項目開發流程,具有良好編碼風格及文檔編寫能力;
3、熟悉Linux服務器相關技術,能夠獨立完成服務器部署,具有相關經驗;
4、熟悉Hadoop/Spark框架,JAVA基礎扎實;
5、熟練使用Mysql數據庫,了解MongoDB或neo4j等分布式數據庫;
6、熟悉SpringCloud,SSM,Docker,redis開發者優先;
7、熟悉前端(包括但不限于Html5、css、Angularjs、ajax、jquery等)開發技術優先;
8、了解Socket網絡編程、MQTT等,有相應實踐經驗者優先;
9、有智能語音語義、知識圖譜服務端開發經驗者優先。
大數據架構師工作的崗位職責 篇10
職責:
1.負責整個大數據平臺架構的設計和構建;
2.負責構建大數據平臺的數據交換、任務調度等通用平臺;
3.制定開發、測試、實施、維護的標準和規范,指導和培訓工程師,不斷提升團隊能力。
4.參與系統需求分析、架構設計、技術選型、應用設計與開發以及測試與部署,負責編寫核心部分代碼。
5.持續挑戰新的技術方向,攻克大數據量、高并發、高可用、可擴展等技術難點。
任職要求:
1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗
2.大規模數據處理的架構和設計實戰經驗
3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,并具有豐富的大型數據平臺工程經驗
4.深刻理解大數據處理(流計算,分布式計算,分布式文件系統,分布式存儲等)相關技術和實現方法
5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平臺上的開發環境
6.本科或以上學歷,計算機軟件或相關專業,豐富的java開發經驗和互聯網背景優先。
7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精
大數據架構師工作的崗位職責 篇11
職責:
1、負責規劃科技大數據平臺及科技數據入庫自動化的方案設計;
2、負責大數據平臺的開發和維護,以及對外服務接口的開發;
3、負責大數據平臺的優化和改進工作。
任職要求
1、計算機相關專業本科及以上學歷,5年以上開發經驗,其中3年以上為互聯網、大數據相關的開發經驗;
2、熟知Hadoop生態圈體系,精通Hadoop/Spark/Storm/Kafka中的一項或幾項,深刻理解MapReduce的運行原理和機制,有MPI經驗者尚佳;
3、熟悉Elasticsearch、Redis、Hbased等相關數據庫的構建和操作,尤其是數據庫集群的構建和操作,熟悉Neo4j者尚佳;
4、具有機器學習相關項目經驗者優先。
大數據架構師工作的崗位職責 篇12
職責
1、負責企業級大數據平臺、數據云服務的設計與開發;
2、基于大數據生態圈,支持智慧交通等大數據場景應用實現;
3、負責公司大數據產品的設計、封裝與落地;
4、負責學習大數據相關算法研究、實現與應用
任職要求
1、統招本科及以上學歷;2年以上智慧城市建設或交通行業信息化相關工作經驗,3年以上大數據架構設計、開發經驗;
2、精通大數據生態圈的技術,包括但不限于MapReduce、Spark、Hadoop、Kafka、Mongodb、Redis、Flume、Storm、Hbase、Hive,具備源碼級問題解決和集群優化改造能力;
3、熟悉常用編程語言,包括Java、Python、Scala等;
4、具有很強的技術研發和創新能力,能有效把握技術發展方向,有較強的執行能力、學習能力、溝通能力、適應能力,責任心強;
大數據架構師工作的崗位職責 篇13
職責:
1、負責大數據項目平臺架構的評估、規劃和設計
2、開發大數據平臺的核心模塊代碼,負責大數據平臺的搭建,完成系統調試、集成與實施,保證大數據產品的上線運行
3、根據業務需求整合優化數據架構,保證產品的可靠性、穩定性
4、指導開發人員完成數據模型規劃建設,分析模型構建及分析呈現
5、深入研究大數據相關技術和產品,跟進業界先進技術;
6、根據項目要求編寫相關技術文檔;
7、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
8、負責核心模塊研發,負責大數據平臺的搭建,完成系統調試、集成與實施;
9. 負責關鍵功能的開發,技術難題的解決,以及輸出代碼的關鍵把控;
10. 負責對使用關鍵技術的預研和選型,完成 PoC ;
11. 指導工程師完成開發工作,并能分享技術經驗。
任職資格:
1、精通Linux操作系統,熟練使用Java;
2、3年以上大數據項目實戰經驗,兩個項目的架構設計經驗,熟悉Hadoop、Hbase、Storm、Spark、Pig等開源框架,并熟悉其工作原理;
3、有Hadoop、Spark、Hbase平臺性能調優經驗;
4、熟悉其它分布式存儲相關技術,包括HDFS,Hive、Redis、Mongodb、 Flume、Kafaka、Sqoop、Zookeeper、ElasticSearch等;
5、熟悉Java開發常用框架.如Spring、MyBatis等;
6、熟悉關系型數據庫如oracle及數據庫編程。
7、能夠根據項目情況安排人力、分配任務,具有較強的團隊管理能力。
8、碩士以上學歷,20xx年以上的工作經驗。
大數據架構師工作的崗位職責 篇14
職責:
1.負責過多個大數據項目的架構;
2.精通Hadoop、Spark, HBase等主流的大數據平臺、精通各組件優化設計原理;
3.精通大數據實時流式處理的設計和應用;
3.熟悉大數據平臺調優,具備大數據生產平臺調優經驗;
4.金融行業,運營商行業大數據架構經驗更優;
5.研究大數據技術的最新發展,并引入到公司技術架構;
6.指導大數據工程師的日常工作,并培養技術骨干。
任職資格:
1.計算機相關專業本科或以上學歷;
2.具有5年以上大數據相關開發經驗;
3.具有2年以上帶團隊經驗
4.對Hadoop/Hive/Spark/HBase/ES等等大數據常用技術有深刻理解,能夠帶領團隊進行技術攻堅,完成中間件的實施、改造、調優;
5.精通海量數據和實時數據的分析處理,能對線上的數據處理性能問題做調優;
6.精通數據倉庫以及維度建模原理,有大型數據倉庫建設經驗;
7.精通關系型數據庫和NoSQL數據庫的使用,熟悉相關理論;
8.溝通順暢,重點突出,高效。
大數據架構師工作的崗位職責 篇15
1、負責公司大數據處理框架研發工作,設計與開發分布式存儲、數據處理與分析架構。
2、負責大數據平臺與產品和相關技術的追蹤及研究。
3、負責大數據的處理工作,以及業務數據提取、加載、轉換處理流程的開發和優化。
4、利用大數據平臺工具對數據維護。
5、負責相關項目的技術支持和服務。
6、持續對系統的技術架構進行改進和優化。
大數據架構師工作的崗位職責 篇16
職責:
1、搭建基于Hadoop/Spark的數據挖掘體系和大數據分析系統架構;
2、研究大數據領域前沿數據挖掘技術,并引入相應技術在數據中心的使用;
3、進行大數據系統框架設計、模型算法開發;
4、負責大型數據挖掘項目方案制定、項目實施落地及優化等 ;
5、開展數據爬取、聚類分析、輿情分析、魚骨圖分析、定價策略等領域數據挖掘工作;
任職資格:
1、本科以上學歷(持有學士學位)(985,211優先),計算機相關專業,五年工作經驗;
2、二年以上數據挖掘項目經驗,完整參與過數據挖掘大數據平臺的架構開發過程,具備互聯網行業背景優先;
3、精通分布式計算框架(hadoop、spark、Storm等)及相關經驗,熟練掌握Hive/SQL,Python,熟悉Python、R相關數值科學計算庫(NumPy,SciPy等);
4、了解傳統的BI/DW 理論,能結合傳統BI實踐設計大數據平臺;
5、熟悉常用機器學習算法(如分類、回歸、聚類、關聯規則等)及其原理,具備應用場景經驗,如用戶畫像、商品關聯度分析、輿情分析;
6、熟悉主數據、元數據、數據質量、和數據建模等數據治理相關的體系和方法;
7、具備較強的邏輯思維能力、數據敏感度,擅于利用數據發現問題及解決問題;
大數據架構師工作的崗位職責 篇17
職責:
1、負責公司大數據底層框架的整體架構設計,結合公司實際業務情況進行技術選型及大數據戰略規劃;
2、負責公司項目的整體評估、設計、架構及關鍵模塊的開發;
3、負責架構優化,協助團隊解決開發過程中遇到的技術難題;
4、負責新技術的調研和大數據相關開源組件的研究,并能在團隊進行推廣應用;
5、參與數據分析、數據建模、項目核心模塊及核心框架的開發;
6、負責大數據平臺的性能條有和問題診斷。
任職要求:
1、計算機相關專業,本科及以上學歷,3-5年以上工作經驗,2-3年大數據相關經驗;
2、具有扎實的大數據和數據倉庫理論功底,負責過大數據平臺或數據倉庫設計;
3、對基于Hadoop的大數據體系有深入的認識,具備相關產品(Hadoop、Hive、HBase、Spark、Storm、Flume、Kafka、Redis、ES等)項目應用研發經驗,有Hadoop集群搭建和管理經驗,度過Hadoop和Spark源碼;
4、熟悉Linux和Python語言,了解Scala原理和底層技術;
5、熟悉分布式系統的架構及對其進行設計和優化,對海量數據的清晰、分析處理及存儲有相關的實戰經驗;
6、算法基礎扎實,熟悉常見的數據結構,深入理解分布式算法和以上提到的分布式系統,
7、必須有一線coding的能力;
8、有統計學、數學知識,海量數據處理、分析和挖掘,大型互聯網公司從業經歷著優先。
大數據架構師工作的崗位職責 篇18
職責:
1. 負責產品級業務系統架構(如業務數據對象識別,數據實體、數據屬性分析,數據標準、端到端數據流等)的設計與優化。協助推動跨領域重大數據問題的分析、定位、解決方案設計,從架構設計上保障系統高性能、高可用性、高安全性、高時效性、分布式擴展性,并對系統質量負責。
2.負責云數據平臺的架構設計和數據處理體系的優化,推動云數據平臺建設和持續升級,并制定云數據平臺調用約束和規范。
3. 結合行業應用的需求負責數據流各環節上的方案選型,主導云數據平臺建設,參與核心代碼編寫、審查;數據的統計邏輯回歸算法、實時交互分析;數據可視化方案等等的選型、部署、集成融合等等。
4. 對云數據平臺的關注業內技術動態,持續推動平臺技術架構升級,以滿足公司不同階段的數據需求。
任職要求:
1. 熟悉云計算基礎平臺,包括 Linux(Ubuntu/CentOS)和 KVM、OpenStack/K8S 等基礎環境,熟悉控制、計算、存儲和網絡;
2. 掌握大型分布式系統的技術棧,如:CDN、負載均衡、服務化/異步化、分布式緩存、NoSQL、數據庫垂直及水平擴容;熟悉大數據應用端到端的相關高性能產品。
3. 精通 Java,Python,Shell 編程語言,精通 SQL、NoSQL 等數據庫增刪改查的操作優化;
4. PB 級別實戰數據平臺和生產環境的實施、開發和管理經驗;
5. 熟悉 Docker 等容器的編排封裝,熟悉微服務的開發和日常調度;
6.計算機、軟件、電子信息及通信等相關專業本科以上學歷,5 年以上軟件工程開發經驗,2 年以上大數據架構師工作經驗。
大數據架構師工作的崗位職責 篇19
職責:
1.負責數據倉庫建設,基于數據驅動構建企業級數據模型,根據架構設計進行各層數據模型開發。
2.面向PB級別超大規模數據處理和查詢需求,設計適合業務變化的合理的多維數據分析系統架構,滿足多樣性需求。
3.構建設計良好的數據流、調度系統、查詢引擎、監控系統,保證系統穩定高效運行,以實現數據的最大價值。
4.指導團隊成員開展數據倉庫建設。
5.參與重點項目的評審,參與企業數據管理體系建設。
任職要求:
1.統招本科及以上學歷。
2.從事數據倉庫領域至少5年以上,熟悉數據倉庫模型設計與ETL開發經驗 ,掌握Kimball的維度建模設計方法,具備海量數據加工處理(ETL)相關經驗 。
3.具有一定數據模型和數據架構基礎,熟悉hadoop\hive和常用數據庫。
4. 精通SQL,有一定的SQL性能調優經驗,熟悉hive sql的開發。
5.具有管理團隊開發經驗,具備良好的組織能力、協調能力及項目管理能力。
6.具有較好的文字功底及語言表達能力,能夠快速、準確地理解需求。
7.具有專研、快速學習和創新精神,具備獨立分析問題和解決問題的能力。
8.具有責任心,時間觀念強,工作獨立性強,有良好的團隊合作精神。
9.全日制普通本科畢業。