大數據架構師的主要職責說明(精選15篇)
大數據架構師的主要職責說明 篇1
職責:
1. 負責大數據基礎和應用平臺的整體規劃和架構設計,參與需求分析,架構設計,詳細設計以及技術選型決策
2. 參與數據挖掘和建模相關核心算法的代碼實現
3. 負責大數據算法平臺的技術把關,性能調優,控制架構質量,解決項目技術難題;對研發項目和任務需求進行評估和方案設計、拆分任務并指導工程師完成開發
4. 帶領團隊提供并實現大數據算法平臺上各項數據接入、數據挖掘分析及數據可視化的架構設計與能力,支持解決方案實施
5. 負責數據庫設計、應用架構設計、核心技術選型等工作
6. 協調解決開發中的技術問題、設計和監控運營指標,保障系統穩定運行
7. 培養,指導有能力的員工,指導工程師進行技術驗證實現,核心技術攻關,解決開發過程中的技術難題
任職要求:
1. 熟悉大數據和數據倉庫的系統架構設計方法
2. 熟練使用并理解HadoopSpark架構及生態。(Hadoop,Hive,Hbase,Elasticsearch,Kafka,SparkFlink等)
3. 熟悉分布式系統架構,有分布式實時、離線和機器學習平臺的架構和開發經驗,具備海量數據清洗、分析處理及存儲的實踐經驗
4. 熟練使用JAVA,具有大規模分布式系統調優經驗
5. 熟悉AI相關算法,熟悉機器學習、深度學習。熟悉AI學習開源框架(Tensorflow、PyTorch等)者優先;
6. 具備良好的團隊合作精神,對工作充滿激情。
7. 熟悉FusionInsight平臺開發經驗者優先
大數據架構師的主要職責說明 篇2
職責:
1、負責大數據平臺的技術選型,基于Spark、Hadoop大數據平臺建設和開發;
2、完成包括數據模型設計、數據采集、數據存儲等方面的大數據系統架構的設計和數據層架構設計;
3、構建數據中臺,為多種行業應用提供主數據(畫像標簽/關系圖譜)、數據模型、人工智能業務算法及數據服務。
4、對海量數據處理的業務需求進行評估和方案設計、拆分任務并指導工程師完成開發;
5、帶領大數據技術團隊提供并實現大數據平臺上各項數據分析和數據可視化的架構設計,支撐解決方案實施。
任職要求:
1、本科及以上學歷,具有5年及以上大數據架構設計和開發經驗;2年及以上帶領團隊經驗;溝通能力強。在大型互聯網企業從事大數據架構設計者優先考慮;有分布式大型商業軟件系統設計經驗、主導過大型商業軟件的架構設計并取得過市場商業成功者優先考慮;
2、熟悉整個大數據的完整處理流程,包括數據的采集、清洗、預處理、存儲、分析挖據、機器學習和數據可視化;
3、精通Oracle/MySQL/PostgreSQL/Greenplum/MongoDB等其中至少一種主流數據庫的使用,并能進行性能調優;
4、具備優秀的團隊意識和溝通能力,學習能力和主動性強,具有鉆研精神,充滿激情,樂于接受挑戰。
大數據架構師的主要職責說明 篇3
職責:
1、負責公司大數據底層框架的整體架構設計,結合公司實際業務情況進行技術選型及大數據戰略規劃;
2、負責公司項目的整體評估、設計、架構及關鍵模塊的開發;
3、負責架構優化,協助團隊解決開發過程中遇到的技術難題;
4、負責新技術的調研和大數據相關開源組件的研究,并能在團隊進行推廣應用;
5、參與數據分析、數據建模、項目核心模塊及核心框架的開發;
6、負責大數據平臺的性能條有和問題診斷。
任職要求:
1、計算機相關專業,本科及以上學歷,3-5年以上工作經驗,2-3年大數據相關經驗;
2、具有扎實的大數據和數據倉庫理論功底,負責過大數據平臺或數據倉庫設計;
3、對基于Hadoop的大數據體系有深入的認識,具備相關產品(Hadoop、Hive、HBase、Spark、Storm、Flume、Kafka、Redis、ES等)項目應用研發經驗,有Hadoop集群搭建和管理經驗,度過Hadoop和Spark源碼;
4、熟悉Linux和Python語言,了解Scala原理和底層技術;
5、熟悉分布式系統的架構及對其進行設計和優化,對海量數據的清晰、分析處理及存儲有相關的實戰經驗;
6、算法基礎扎實,熟悉常見的數據結構,深入理解分布式算法和以上提到的分布式系統,
7、必須有一線coding的能力;
8、有統計學、數學知識,海量數據處理、分析和挖掘,大型互聯網公司從業經歷著優先。
大數據架構師的主要職責說明 篇4
職責:
(1) 負責公司大數據平臺搭建,相關的設計和技術開發工作,負責大數據存儲系統、分布式計算系統、數據集成、挖掘算法等的設計、研發以及維護、優化工作;
(2) 通過數據分析技術,挖掘有利于營銷中各業務場景的變量或規則類標簽,以提升模型效果,為文旅、教育業務提供數學模型理論及編程支撐;
(3) 對接溝通業務系統研發團隊和產品部門,提供數據驅動方面的專業咨詢方案,并對業務的大數據應用場景提出建設性意見;
(4) 配合部門領導進行項目需求分析、設計開發工作。
任職要求:
(1) 計算機、統計學,數學等相關專業本科以上學歷,5年以上大數據或文旅、教育數據產品設計開發經驗,高效高質量產出需求和技術文檔;
(2) 精通Hadoop,熟悉大數據生態技術,如Storm、Spark、Scala、Flume、Kafka、Zookeeper、Hive、Hbase、Kerberos等,有大規模集群架構、開發及運維經驗;熟悉HDFS/MapReduce等;
(3) 熟悉Java,能夠獨立應用python、R、SAS或類似分析工具進行數據分析;
(4) 熟悉大數據挖掘、可視化分析,各種BI算法和產品等,在計算廣告、搜索引擎、推薦系統、用戶畫像等有一個或多個算法領域的研發經驗,能夠運用數據作為產品解決業務方運營及決策問題;
(5) 有互聯網行業工作經驗者優先,有海量數據的機器學習算法實踐經驗優先;
(6) 工作認真、負責,有良好的團隊合作精神,良好的分析能力、溝通技巧。
大數據架構師的主要職責說明 篇5
職責:
1. 負責公司大數據平臺的設計和開發,負責spark, hadoop, flink等云計算平臺的開發和優化;制定數據架構規范,進行核心代碼編寫,指導團隊落地;
2. 負責數據基礎架構和數據處理體系的升級和優化,技術難題攻關,持續提升核心系統性能,保證系統的安全、穩定、高效運行
3. 設計并實現對BI分析、數據產品開發、算法開發的系統性支持
4. 研究未來數據模型和計算框架的創新與落地,包括但不限于以下領域:大規模數據實時化、研發模式敏捷化、數據計算框架輕量化、數據模型組織方式業務化等方面參與制定并實踐團隊的技術發展路線
5. 建立良好的公司內外的業界技術影響力;參與培養未來數據人才;有效輔導團隊,提升數據研發能力
任職要求:
1. 有很強的數據設計抽象能力,善于從復雜的數據問題中找到關鍵路徑,能夠開發創新而實際的分析方法以解決復雜的商業問題
2. 有作為技術負責人系統化解決問題的成功案例;有海量數據建模實踐經驗優先
3. 熟練掌握Hadoop、Spark、Flink、HBase的原理特性以及適用場景,精通流式計算開發,有開源二次開發經驗者優先,有NLP數據處理經驗者優先
4. 性格積極樂觀,誠信,能自我驅動,有較強的語言表達能力;具備強烈的進取心、求知欲及團隊合作精神;具有良好的溝通、團隊協作、計劃和創新的能力
5. 本科以上學歷,扎實的計算機專業基礎,有5年以上大數據平臺開發經驗;
大數據架構師的主要職責說明 篇6
職責:
1、負責相關開源系統/組件的性能、穩定性、可靠性等方面的深度優化;
2、負責解決項目上線后生產環境的各種實際問題,保障大數據平臺在生產上的安全、平穩運行;
3、推動優化跨部門的業務流程, 參與業務部門的技術方案設計、評審、指導;
4、負責技術團隊人員培訓、人員成長指導。
5、應項目要求本月辦公地址在錦江區金石路316號新希望中鼎國際辦公,月底項目結束后在總部公司辦公
任職要求:
1、熟悉linux、JVM底層原理,能作為技術擔當,解決核心技術問題;
2、3年以上大數據平臺項目架構或開發經驗,對大數據生態技術體系有全面了解,如Yarn、Spark、HBase、Hive、Elasticsearch、Kafka、PrestoDB、Phoenix等;
3、掌握git、maven、gradle、junit等工具和實踐, 注重文檔管理、注重工程規范優先;
4、熟悉Java后臺開發體系,具備微服務架構的項目實施經驗,有Dubbo/Spring cloud微服務架構設計經驗優先;
5、性格開朗、善于溝通,有極強的技術敏感性和自我驅動學習能力,注重團隊意識。
大數據架構師的主要職責說明 篇7
職責:
1、大數據平臺架構規劃與設計;
2、負責大數據平臺技術框架的選型與技術難點攻關;
3、能夠獨立進行行業大數據應用的整體技術框架、業務框架和系統架構設計和調優等工作,根據系統的業務需求,能夠指導開發團隊完成實施工作;
4、負責數據基礎架構和數據處理體系的升級和優化,不斷提升系統的穩定性和效率,為相關的業務提供大數據底層平臺的支持和保證;
5、培養和建立大數據團隊,對團隊進行技術指導。
任職要求:
1、計算機相關專業的背景專業一類院校畢業本科、碩士學位,8年(碩士5年)以上工作經驗(至少擁有3年以上大數據項目或產品架構經驗);
2、精通Java,J2EE 相關技術,精通常見開源框架的架構,精通關系數據庫系統(Oracle MySQL等)和noSQL數據存儲系統的原理和架構;
3、精通SQL和Mapreduce、Spark處理方法;
4、精通大數據系統架構,熟悉業界數據倉庫建模方法及新的建模方法的發展,有DW,BI架構體系的專項建設經驗;
5、對大數據體系有深入認識,熟悉Kafka、Hadoop、Hive、HBase、Spark、Storm、greenplum、ES、Redis等大數據技術,并能設計相關數據模型;
6、很強的學習、分析和解決問題能力,可以迅速掌握業務邏輯并轉化為技術方案,能獨立撰寫項目解決方案、項目技術文檔;
7、具有較強的內外溝通能力,良好的團隊意識和協作精神;
8、機器學習技術、數據挖掘、人工智能經驗豐富者優先考慮;
9、 具有能源電力行業工作經驗者優先。
大數據架構師的主要職責說明 篇8
職責:
1、負責公司的大數據平臺的數倉架構、系統架構設計;
2、負責帶領團隊完成輿情分析相關的挖掘方案設計;
3、負責大數據研發組團隊管理;
4、負責帶領團隊完成輿情平臺的方案文檔撰寫、迭代開發;
5、負責研發規范制定,研究行業前沿技術;
6、參與產品規劃及設計討論。
任職要求:
1、本科五年工作經驗及以上,有至少五年的大數據技術實踐經驗,有NLP或AI相關經驗;
2、有很強的架構設計能力和良好的表達能力;
3、有一定的項目管理及團隊管理能力;
4、精通Hadoop、Spark生態圈中的常用組件原理及應用;
6、理解媒體業務,精通數據倉庫的規劃和設計;
5、精通掌握Java或Python編程,有性能調優能力;
4、熟悉NLP算法原理及應用;
6、對新生事物或者新技術有濃厚興趣,學習能力強。
大數據架構師的主要職責說明 篇9
職責:
1、大數據平臺的規劃、設計、實施,并優化數據庫;
2、對數據庫進行管理,負責數據庫應用系統的運營及監控;
3、對數據庫性能分析與調優,排錯,保證數據正確率;
4、配合其他部門進行的數據處理、查詢,統計和分析工作;
5、完成公司下達的項目開發任務。
任職要求:
1、計算機及相關專業本科以上學歷,5年以上軟件開發從業經驗,其中包括至少2年以上的大數據開發工作經驗;
2、熟悉hive,hadoop/spark,hbase等大數據相關技術架構,有管理或優化大型分布式集群經驗;
3、熟悉linux基本命令,精通SQL腳本的編寫,有豐富的數據庫管理、運維調優經驗;
4、熟悉C++、Java、C#等開發語言;
5、有互聯網電商行業大數據分析處理和大型數據倉庫的設計和實施經驗;
6、有分布式系統分析及架構設計經驗和大型計算集群的基礎設施開發維護經驗;
7、快速處理系統突發事件的能力,較強的學習和創新能力;
8、良好的溝通能力和團隊合作精神。
大數據架構師的主要職責說明 篇10
職責:
1、負責大數據平臺技術框架的技術選型和搭建;
2、負責核心技術問題公關,建設高可靠性,擴展性及高性能大數據/數據應用平臺;
3、負責規劃數據挖掘的整體流程,負責大數據開發團隊業務需求開發;
4、與其他團隊密切配合,尋求數據層面的業務價值,利用數據分析結論推動產品優化;
5、研究和分享大數據架構領域新技術。
任職要求:
1、計算機相關專業全日制統招本科及以上;
2、5年以上工作經驗,至少3年以上大數據項目相關工作經驗,能夠設計大型大數據系統的架構和技術方案;
3、精通Hadoop/Spark/Hbase/Hive等大數據技術,精通ETL技術;
4、熟悉數據挖掘,了解典型大數據算法和策略;
5、熟悉主流Java技術框架,精通關系型數據庫及SQL語言,熟悉NoSQL/JSON/XML;
6、有較強的學習能力和問題解決能力,邏輯嚴密、思路清晰;
7、有數據倉庫經驗者優先,有金融行業項目經驗者優先。
大數據架構師的主要職責說明 篇11
職責:
1. 負責產品級業務系統架構(如業務數據對象識別,數據實體、數據屬性分析,數據標準、端到端數據流等)的設計與優化。協助推動跨領域重大數據問題的分析、定位、解決方案設計,從架構設計上保障系統高性能、高可用性、高安全性、高時效性、分布式擴展性,并對系統質量負責。
2.負責云數據平臺的架構設計和數據處理體系的優化,推動云數據平臺建設和持續升級,并制定云數據平臺調用約束和規范。
3. 結合行業應用的需求負責數據流各環節上的方案選型,主導云數據平臺建設,參與核心代碼編寫、審查;數據的統計邏輯回歸算法、實時交互分析;數據可視化方案等等的選型、部署、集成融合等等。
4. 對云數據平臺的關注業內技術動態,持續推動平臺技術架構升級,以滿足公司不同階段的數據需求。
任職要求:
1. 熟悉云計算基礎平臺,包括 Linux(Ubuntu/CentOS)和 KVM、OpenStack/K8S 等基礎環境,熟悉控制、計算、存儲和網絡;
2. 掌握大型分布式系統的技術棧,如:CDN、負載均衡、服務化/異步化、分布式緩存、NoSQL、數據庫垂直及水平擴容;熟悉大數據應用端到端的相關高性能產品。
3. 精通 Java,Python,Shell 編程語言,精通 SQL、NoSQL 等數據庫增刪改查的操作優化;
4. PB 級別實戰數據平臺和生產環境的實施、開發和管理經驗;
5. 熟悉 Docker 等容器的編排封裝,熟悉微服務的開發和日常調度;
6.計算機、軟件、電子信息及通信等相關專業本科以上學歷,5 年以上軟件工程開發經驗,2 年以上大數據架構師工作經驗。
大數據架構師的主要職責說明 篇12
職責:
1、負責spark, hadoop, flink等開發和優化。
2、參與前期需求溝通和分析,以產品化開發的思維,完成需求分解和數據架構設計。
3、與研發和數據科學家合作保證產品定義清晰,按時完成產品上線。
4、能夠洞察市場狀況,與各部門合作轉化為基于大數據挖掘的新策略或方案.
5、主動創造和發掘新的基于大數據挖掘產品商業模式.
任職要求:
1、全日制本科及以上學歷,計算機軟件相關專業,5年以上開發經驗,3年以上架構經驗
2、精通hadoop/MapReduce/Spark/Hbase/Flink/Hive/R/Mahout等分布式數據存儲和分布式計算平臺原理,流式計算開發,有開源二次開發經驗者優先。
3、精通大數據挖掘、機器學習.熟練掌握Java/Perl/Python至少一種編程語言。
4、具有數據挖掘和分析、機器學習等項目實施相關經驗者優先;
5、良好的跨部門溝通合作能力,解決不同觀點能力并取得結果。具備敏銳的互聯網產品理解力,學習能力和邏輯思維能力強;
6、較強的自我驅動力、推動和協調能力,強烈的責任心和團隊合作精神;
大數據架構師的主要職責說明 篇13
職責:
1.負責整個大數據平臺架構的設計和構建;
2.負責構建大數據平臺的數據交換、任務調度等通用平臺;
3.制定開發、測試、實施、維護的標準和規范,指導和培訓工程師,不斷提升團隊能力。
4.參與系統需求分析、架構設計、技術選型、應用設計與開發以及測試與部署,負責編寫核心部分代碼。
5.持續挑戰新的技術方向,攻克大數據量、高并發、高可用、可擴展等技術難點。
任職要求:
1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗
2.大規模數據處理的架構和設計實戰經驗
3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,并具有豐富的大型數據平臺工程經驗
4.深刻理解大數據處理(流計算,分布式計算,分布式文件系統,分布式存儲等)相關技術和實現方法
5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平臺上的開發環境
6.本科或以上學歷,計算機軟件或相關專業,豐富的java開發經驗和互聯網背景優先。
7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精
大數據架構師的主要職責說明 篇14
職責:
1.負責公司新業務方向平臺大數據基礎架構的搭建及后期數據處理體系的升級和優化,不斷提升系統的穩定性和效率。為公司未來方向性產品提供大數據底層平臺的支持和保證。
2.負責制定大數據平臺調用約束和規范;
3.負責大數據方向技術難題的解決,以及代碼質量的把控;
4.作為大數據開發團隊的leader,負責大數據系統平臺開發團隊建設與人才梯隊培養,分享技術經驗,撰寫相關技術文檔指導和培訓工程師。
任職要求:
1.熱衷于大數據技術,并能平衡大數據性能、穩定性、擴展性多重要素進行設計和優化;
2.熟悉服務器基本知識,能夠評估系統硬件性能瓶頸;
3.掌握Linux操作系統的配置,管理及優化,能夠獨立排查及解決操作系統層的各類問題,并能提供解決問題的理論依據;
4.精通Java服務器編程,熟悉JVM原理,對數據結構和算法設計有較為深刻的理解;
5.精通elasticsearch、Redis、hadoop、Kafka、Zookeeper、Yarn、Hbase、Spark底層架構,熟悉原理、源碼、集群部署,包括參數優化、Bug修復,貢獻過代碼或提交過bug者優先
6.具備數據中心資源管理、監控、調度等系統研發經驗者優先,具備分布式系統研發經驗者優先;
7.具有應用大數據技術處理的項目開發、維護超過兩年的經驗者優先;
8.具有良好的文檔編寫能力,可進行方案設計、架構設計。
大數據架構師的主要職責說明 篇15
職責:
1.負責過多個大數據項目的架構;
2.精通Hadoop、Spark, HBase等主流的大數據平臺、精通各組件優化設計原理;
3.精通大數據實時流式處理的設計和應用;
3.熟悉大數據平臺調優,具備大數據生產平臺調優經驗;
4.金融行業,運營商行業大數據架構經驗更優;
5.研究大數據技術的最新發展,并引入到公司技術架構;
6.指導大數據工程師的日常工作,并培養技術骨干。
任職資格:
1.計算機相關專業本科或以上學歷;
2.具有5年以上大數據相關開發經驗;
3.具有2年以上帶團隊經驗
4.對Hadoop/Hive/Spark/HBase/ES等等大數據常用技術有深刻理解,能夠帶領團隊進行技術攻堅,完成中間件的實施、改造、調優;
5.精通海量數據和實時數據的分析處理,能對線上的數據處理性能問題做調優;
6.精通數據倉庫以及維度建模原理,有大型數據倉庫建設經驗;
7.精通關系型數據庫和NoSQL數據庫的使用,熟悉相關理論;
8.溝通順暢,重點突出,高效。