大數據架構師的職責(通用20篇)
大數據架構師的職責 篇1
職責:
1、負責大數據基礎平臺、海量數據存儲處理分布式平臺、數據分析系統架構設計和研發;
2、負責實時計算平臺基礎架構設計、部署、監控、優化升級;
3、制定項目數據倉庫設計及實現規范,指導設計研發和部署;
4、協助策略和算法團隊工作,保障數據挖掘建模和工程化;
5、深入研究大數據相關技術和產品,跟進業界先進技術。
任職要求:
1、3年以上大數據系統架構經驗;
2、精通Hadoop HBase Hive Spark Flink Kafka Redis技術及其生態圈;
3、具備Java Scala Python等開發經驗,熟悉數據挖掘和分析的策略與算法;
4、精通數據抽取,海量數據傳輸,數據清洗的常用方法和工具。
5、具備良好的系統分析能力、故障診斷能力;
6、有大數據策略、算法、可視化經驗優先;
7、有在華為云存儲產品和大數據產品的開發使用經驗優先。
大數據架構師的職責 篇2
職責
1、參與打造數據中內容的規劃、設計、開發和優化工作,實現高質量數據的互通與共享;
2、參與數據模型體系構建及數據主題設計和開發,搭建離線、實時數據公共層;
3、參與數據產品與應用的數據研發,發掘數據商業價值,打造極致體驗的數據產品;
4、深入理解數據產品的使用場景,為業務方在可用性、成本上做更好的設計做參考;
5、團隊成員的搭建與培養,任務劃分,進度監控,代碼規范,質量保證。
任職要求
1、熟悉數據倉庫建模理論,3年以上相關領域實踐經驗;
2、Hadoop、Hive、Hbase、Storm、Spark等技術框架;
3、精通Java、Python、Scala、go等開發語言中的1到2種;
4、熟練使用Python/Java/scala或其他語言進行復雜業務邏輯的數據處理工作,具備海量數據處理以及性能優化的能力;
5、對MySQL、Redis、HBase等數據庫有一定的了解和使用經驗;
6、對olap,多維分析及kylin熟悉的更好;
7、思路清晰,具備良好的溝通能力和理解能力,較強的學習能力以及快速解決問題的能力;
8、對新技術,新事物有很好的探索和求知欲;
9、熟悉常規的機器學習算法:降維(PCA、SVD)、SVM、邏輯回歸(LogisticsRegression)、決策樹(GBDT、RandomForest)、關聯規則(Apriori、FP-Growth)、聚類(K-Means)等優先。
大數據架構師的職責 篇3
職責
1、負責公司大數據平臺的整體架構設計,包含數據收集、數據存儲、數據挖掘、數據輸出;
2、負責規劃從數據源到數據應用的整體流程,并參與用戶產品和數據產品的決策;
3、負責海量數據分析、用戶行為分析,構建用戶數據模型;
4、負責解決核心技術問題,對技術方案進行決策;
5、技術團隊管理。
6、熟悉手機IOS、安卓系統APP開發
任職資格
1、計算機相關專業畢業,本科以上學歷;
2、5年以上相關工作經驗,具備軟件產品架構設計經驗,熟練掌握高性能、高擴展性架構設計方法;
3、熟練掌握java或c++任意一門語言、熟悉linux操作系統;
4、熟悉Hadoop/MR/Hbase/Mahout/Spark等大數據技術,并能夠基于上述項目開發大數據相關應用;
5、熟悉基本數據挖掘方法和技術;
6、強烈的敬業精神,良好的溝通與協調能力,能有效組織協調團隊完成各類開發工作;
7、熱愛技術,相信數據的價值,對大數據有深刻的理解。
大數據架構師的職責 篇4
職責:
1、負責公司的大數據平臺的數倉架構、系統架構設計;
2、負責帶領團隊完成輿情分析相關的挖掘方案設計;
3、負責大數據研發組團隊管理;
4、負責帶領團隊完成輿情平臺的方案文檔撰寫、迭代開發;
5、負責研發規范制定,研究行業前沿技術;
6、參與產品規劃及設計討論。
任職要求:
1、本科五年工作經驗及以上,有至少五年的大數據技術實踐經驗,有NLP或AI相關經驗;
2、有很強的架構設計能力和良好的表達能力;
3、有一定的項目管理及團隊管理能力;
4、精通Hadoop、Spark生態圈中的常用組件原理及應用;
6、理解媒體業務,精通數據倉庫的規劃和設計;
5、精通掌握Java或Python編程,有性能調優能力;
4、熟悉NLP算法原理及應用;
6、對新生事物或者新技術有濃厚興趣,學習能力強。
大數據架構師的職責 篇5
職責:
1、負責規劃科技大數據平臺及科技數據入庫自動化的方案設計;
2、負責大數據平臺的開發和維護,以及對外服務接口的開發;
3、負責大數據平臺的優化和改進工作。
任職要求
1、計算機相關專業本科及以上學歷,5年以上開發經驗,其中3年以上為互聯網、大數據相關的開發經驗;
2、熟知Hadoop生態圈體系,精通Hadoop/Spark/Storm/Kafka中的一項或幾項,深刻理解MapReduce的運行原理和機制,有MPI經驗者尚佳;
3、熟悉Elasticsearch、Redis、Hbased等相關數據庫的構建和操作,尤其是數據庫集群的構建和操作,熟悉Neo4j者尚佳;
4、具有機器學習相關項目經驗者優先。
大數據架構師的職責 篇6
職責:
1、負責公司大數據產品的架構設計,包含數據收集、數據存儲、數據應用,并完成相關架構設計文檔的撰寫;
2、參與規劃從數據源到數據應用的整體流程,并參與相關產品的決策;
3、負責解決核心技術問題,對技術方案進行決策;
4、負責大數據研發團隊建設、人才梯隊培養和技術團隊管理;
5、積極了解業界發展,研究與跟蹤大數據新技術發展方向。
任職要求:
1、精通GoldenGate For BigData相關理論,具備大型數據利用的生產實戰經驗;
2、精通數據驅動的理論,設計并生產上線相關數據驅動的產品;
3、精通常用消息中間件的使用,例如kafka/RocketMQ/Apache Pulsar,有解讀相關源碼者優先;
4、掌握hadoop、spark生態體系相關產品的使用,掌握MapReduce編程或Spark編程;
5、了解傳統數據倉庫理論及相關ETL工具,例如kettle/datastage;
6、熟悉Oracle、Mongodb、Mysql數據庫的使用;
7、扎實的Java語言基礎,熟悉Java開發工具和調試工具的使用;
8、良好的團隊協作精神,有能力對團隊在軟件設計、實現和測試方面進行指導;
9、良好的邏輯分析能力和溝通能力,執行力強、對待工作認真嚴謹、責任心強、具備出色的學習能力和團隊合作精神,有一定的推動能力;
10、計算機科學、信息技術或相關領域本科以上學歷,具有5年以上數據平臺項目開發經驗,3年以上的架構設計經驗,具有大數據平臺應用大型項目架構設計經驗優先;
大數據架構師的職責 篇7
職責:
1. 負責設計企業級大數據平臺的整體架構,從技術層面制定清晰的大數據產品與系統技術架構,并負責實現關鍵技術和產品。
2. 負責設計具有創新價值的大數據底層平臺、大數據上層應用系統等,帶領團隊完成有質變的技術解決方案。
3. 負責組織同事研究行內最前沿的技術發展方向,突破現有的技術難題。
4. 負責研究院對外項目合作協調與支持,編寫項目建設方案及后期項目建設支持。
任職要求:
1. 碩士及以上學歷,計算機相關專業。
2. JAVA基礎扎實,不少于8年的一線開發經驗,精通Spring boot/MyBatis/Restful API的開發與管理. 熟悉ReactJS/Angular/Vue之一前端開發技術,熟悉Maven或Ant.,熟悉Python語言開發加分。
3. 不少于4年大數據的直接研發經驗,精通Hadoop/Spark系統,有hands-on的架構設計、性能調優、開發經驗。有MongoDB、Kafka、Hbase/Cassandra/Storm/Hive 等系統的開發經驗。
4. 掌握分布式系統原理,對分布式存儲、流式計算、消息隊列中的一項或多項有深入的理解和認識。
5. 熟悉分布式系統的監控、運維、故障恢復,高可用原理和設計理念。
6. 算法基礎扎實,熟悉常見的數據結構,掌握大規模高并發訪問、大數據開發等處理經驗;熟練的Linux系統, 網絡, 內存和存儲等方面知識。
7. 必須要有千萬級別的項目管理經驗,包括但不限于前期需求溝通,建設方案編寫,中期項目實施,進度匯報,后期項目維護。
大數據架構師的職責 篇8
職責:
1.能夠帶領技術人員基于hadoop平臺進行海量數據應用系統開發;
2.負責結構化和非結構化數據的解析和清洗,海量數據查詢和報表展現;
3.負責超大規模數據平臺的搭建、維護和優化;
4.負責大數據采集、存儲框架研究,參與在線或離線數據存儲模型設計;
5.負責大數據平臺新技術的開發使用和性能優化,測試。
任職資格:
1.計算機相關專業本科及以上學歷;
2. 熟悉hadoop相關各種開源項目,比如HDFS/Hive/Hbase等有實際應用。(5年以上開發經驗者優先);
3.兩年以上熟練編寫mapreduce代碼經驗,有三年以上網絡日志分析、ETL經驗。熟悉日志分析框架chukwa,flume,scribe者優先;
4.兩年以上海量數據存儲的安裝部署、優化、二次開發經驗,對大規模數據存儲、傳輸、處理等有豐富的經驗;
5.在數據挖掘、數據密集型處理、分布式計算、網格計算領域有深入理論基礎;
6.具有較強的文檔撰寫能力,較強的團隊精神和合作精神,對工作有熱情,能承受壓力。
大數據架構師的職責 篇9
職責:
1. 負責大數據平臺的基礎技術規劃,編制相關規范文檔。
2. 負責大數據平臺的數據采集,處理,存儲以及挖掘分析的架構實現。
3. 負責大數據平臺的實際規劃建設,包括環境和框架的規劃搭建以及部分核心編碼工作。
4. 負責大數據相關技術發展方向的預研。
5. 參與業務需求調研,根據需求及行業特點設計大數據解決方案并跟進具體實施項目。
6. 制定大數據平臺中數據質量,業務質量監控及管理辦法。
崗位要求:
1. 全日制本科及以上學歷,5年以上工作經驗,4年及以上大數據架構設計經驗,熟悉大數據解決方案,包括Hadoop平臺、Spark、storm、機器學習、深度學習等大數據解決方案。
2. 深刻理解大數據處理(流計算、分布式計算、分布式文件系統、分布式存儲等相關技術)實現方法。有架構和設計實踐經驗。
3. 精通大型數據庫Oracle、SqlServer等的開發。
4. 精通java,Python中的一種或多種語言。
5. 熟悉容器、虛擬化、微服務框架等相關技術。
6. 對數據敏感,有嚴謹的工作思路,良好的溝通能力和團隊合作精神。
7. 熟悉R,Python,SAS、SPSS等數據挖掘經驗者優先。
8. 高寬展性,高性能,和分布式系統的實踐及運維經驗者優先。
9. 有大型數據倉庫實施、大數據平臺數據開發經驗,熟悉運營商業務者優先。
大數據架構師的職責 篇10
職責:
1)負責公司軟件產品整體架構的設計和關鍵功能實現
2)負責公司架構長期看護以及優化;
3)負責軟件部門各模組間的協調配合;
4)提高鞏固軟件代碼質量;
5)負責大數據流式框架的設計、優化及部署;
6)規劃研發部門員工的技術發展路線并提供必要的幫助和指導
任職資格:
1)本科及以上學歷,計算機相關專業,5年以上工作經驗;
2)頻繁換工作,比如一年一個公司,請繞路;
3)3年以上產品架構經驗,主導過產品的成功上線;
4)對底層設備通訊協議,B/S系統,手機APP開發等都有一定的了解;
5)對各種主流語言C#\Java\Pathon有一定的了解
5)精通各種大數據架構,并深入研究過其中一種,有storm\kafka等流式實時處理經驗為佳
6)能夠承擔較強的工作壓力,有良好的自我驅動能力和責任感;
7)具備優秀的邏輯思維能力、表達能力、溝通協調能力。
大數據架構師的職責 篇11
職責
1、負責企業級大數據平臺、數據云服務的設計與開發;
2、基于大數據生態圈,支持智慧交通等大數據場景應用實現;
3、負責公司大數據產品的設計、封裝與落地;
4、負責學習大數據相關算法研究、實現與應用
任職要求
1、統招本科及以上學歷;2年以上智慧城市建設或交通行業信息化相關工作經驗,3年以上大數據架構設計、開發經驗;
2、精通大數據生態圈的技術,包括但不限于MapReduce、Spark、Hadoop、Kafka、Mongodb、Redis、Flume、Storm、Hbase、Hive,具備源碼級問題解決和集群優化改造能力;
3、熟悉常用編程語言,包括Java、Python、Scala等;
4、具有很強的技術研發和創新能力,能有效把握技術發展方向,有較強的執行能力、學習能力、溝通能力、適應能力,責任心強;
大數據架構師的職責 篇12
職責:
1、數據分析軟件平臺架構搭建
2、負責深度學習核心框架或高性能后臺服務系統的架構設計工作,包括系統總體規劃、架構設計、系統分析、軟件實現、性能優化;
3、指導開發人員開發,并解決系統出現的問題,理解物業需求;
4、制定開發計劃和控制開發進度,負責指導研發團隊開展設計工作;
任職要求:
1、碩士以上,計算機或先關專業;
2、5年左右軟件開發經驗,含3年以上系統分析、設計經驗,有大型軟件項目大型軟件項目;有中大型互聯網企業數據庫架構設計及管理經驗,
3、 具備良好的組件級建模能力,熟悉HTTP、TCP等協議
4、熟練使用UML進行軟件架構設計,至少精通EA,RATIONAL, VISIO等一種設計工具.
5、精通至少一種編程語言,熟悉 Linux 相關技術,能獨立在上面進行開發、測試和部署
6、深入理解數據庫、數據倉庫、大數據、分布式體系架構和關鍵技術
大數據架構師的職責 篇13
職責:
根據大數據業務需求,設計大數據方案及架構,實現相關功能;
搭建和維護大數據集群,保證集群規模持續、穩定、高效平穩運行;
負責大數據業務的設計和指導具體開發工作;
負責公司產品研發過程中的數據及存儲設計;
針對數據分析工作,能夠完成和指導負責業務數據建模。
職位要求:
計算機、自動化或相關專業(如統計學、數學)本科以上學歷,3年以上大數據處理相關工作經驗;
精通大數據主流框架(如 Hadoop、hive、Spark等);
熟悉 MySQL、NoSQL(MongoDB、Redis)等主流數據庫,以及rabbit MQ等隊列技術;
熟悉hadoop/spark生態的原理、特性且有實戰開發經驗;
熟悉常用的數據挖掘算法優先.
大數據架構師的職責 篇14
職責:
1、負責大數據開發團隊建設;
2、負責行業大數據產品架構設計與研發;
3、負責帶領團隊進行行業大數據產品關鍵技術攻關。
任職要求:
1、有三年以上大數據應用、開發經驗;具備海量數據加工處理(ETL)相關經驗,對數據挖掘及機器學習有較為深刻的理解;
2、熟悉Hadoop相關技術,對HDFS、MapReduce、Hive、HBase有一定的使用和開發經驗;
3、熟悉Linux,熟練使用Shell或Python,進行腳本編寫;
4、對數據結構和數據統計分析算法有較為深刻理解;
5、掌握至少一種主流關系數據庫開發技術:Oracle、SQL Server、MySQL等;
6、掌握實時流計算技術,有Spark、Storm開發經驗者優先;
7、需要具備2年以上研發團隊管理經驗。
大數據架構師的職責 篇15
職責:
1.負責公司大數據底層框架的整體架構設計,結合公司實際業務情況進行技術選型及大數據戰略規劃;
2.負責統一數據平臺項目的整體評估、設計、架構及關鍵模塊的開發,不斷提升系統的穩定性和效率;
3.負責架構優化及系統關鍵模塊的設計開發,協助團隊解決開發過程中的技術難題;
4.建立良好的公司內外的業界技術影響力;有效輔導團隊,提升數據研發能力;
任職要求:
1.從事大數據項目相關開發和設計2年以上經驗;有作為技術負責人系統化解決問題的成功案例;有海量數據實踐經驗優先;
2.擁有一定的算法和數據結構基礎;有很強的數據設計抽象能力,善于從復雜的數據問題中找到關鍵路徑;
3.熟悉目前正在發展的大數據分布式平臺前沿技術的應用;包括但不僅僅限于:hadoop、storm、spark、等;
4. 良好的邏輯思維能力,良好的業務解讀能力,懂電力或通信業務優先;
5.具有鉆研精神,樂于接受挑戰;
大數據架構師的職責 篇16
職責:
1、大數據平臺架構規劃與設計;
2、負責大數據平臺技術框架的選型與技術難點攻關;
3、能夠獨立進行行業大數據應用的整體技術框架、業務框架和系統架構設計和調優等工作,根據系統的業務需求,能夠指導開發團隊完成實施工作;
4、負責數據基礎架構和數據處理體系的升級和優化,不斷提升系統的穩定性和效率,為相關的業務提供大數據底層平臺的支持和保證;
5、培養和建立大數據團隊,對團隊進行技術指導。
任職要求:
1、計算機相關專業的背景專業一類院校畢業本科、碩士學位,8年(碩士5年)以上工作經驗(至少擁有3年以上大數據項目或產品架構經驗);
2、精通Java,J2EE 相關技術,精通常見開源框架的架構,精通關系數據庫系統(Oracle MySQL等)和noSQL數據存儲系統的原理和架構;
3、精通SQL和Mapreduce、Spark處理方法;
4、精通大數據系統架構,熟悉業界數據倉庫建模方法及新的建模方法的發展,有DW,BI架構體系的專項建設經驗;
5、對大數據體系有深入認識,熟悉Kafka、Hadoop、Hive、HBase、Spark、Storm、greenplum、ES、Redis等大數據技術,并能設計相關數據模型;
6、很強的學習、分析和解決問題能力,可以迅速掌握業務邏輯并轉化為技術方案,能獨立撰寫項目解決方案、項目技術文檔;
7、具有較強的內外溝通能力,良好的團隊意識和協作精神;
8、機器學習技術、數據挖掘、人工智能經驗豐富者優先考慮;
9、 具有能源電力行業工作經驗者優先。
大數據架構師的職責 篇17
職責:
1、負責規劃大數據平臺及應用產品的需求和技術方案設計;
2、負責數據對接和對外服務設計、開發和維護,并能保證質量和性能;
3、負責基于大數據平臺的應用設計、開發和維護;
4、能從系統全局和各子系統的角度思考可能存在的問題,并提出改進方案建議;
任職要求:
1、大學本科6年以上工作經驗,計算機相關專業。
2、至少4年以上的Java開發經驗,3年以上大數據應用系統的開發和設計經驗。
3、熟悉Hadoop生態圈技術體系, 對離線計算、內存計算和流式計算均有深刻理解, 如Hadoop、Storm、Spark三個中的任意二個, 能進行平臺和組件優化。
4、精通Hive、HBase倉庫設計,深刻理解MR運行原理和機制,能進行以提供高任務執行效率的優化。
5、精通Java開發,熟悉JVM調優, 對GC有深刻理解。
6、熟悉Linux、Shell、Kafka、Oracle、Mysql、Redis等相關技術, 能進行hbase可靠性診斷和維護。
7、快速研究和學習技術能力。
大數據架構師的職責 篇18
職責:
1、負責大數據平臺架構的規劃與設計;
2、負責大數據平臺技術框架的選型與技術難點攻關;
3、參與企業級大數據產品和應用規劃;
4、研究跟進大數據架構領域新技術并分享;
5、大數據處理和分析應用平臺的設計指導。
任職資格:
1、 具備深厚的分布式系統或數據庫系統的理論基礎,熟悉分布式計算系統的工作機制,具有分布式文件系統、分布式數據庫系統、集群存儲系統等架構設計經驗;
2、熟悉BI平臺架構及相關項目標準,大數據解決方案包括Hadoop、Spark、Storm、機器學習等大數據平臺解決方案;
3、熟悉MySql/Postgresql/Oracle/MongoDB/Redis等主流數據數據庫;
4、 精通Linux/Unix環境,精通J java、scala、python、R中的一種或多種語言;
5、 具備優秀的團隊意識和溝通能力,學習能力和主動性強,具有鉆研精神,充滿激情,樂于接受挑戰;
6、大專及以上學歷,3年及以上工作經驗。
大數據架構師的職責 篇19
職責:
1.負責企業數據中心建設,設計數據邏輯模型和物理模型,并完成相關開發
2.梳理公司各業務線常用的指標和維度,統一指標定義口徑
3.根據數據應用開發和數據分析需求,設計數據倉庫信息層模型,提高數據開發的效率
4.負責數據模型的運營和優化,及時響應業務邏輯變更,保證模型的數據質量和穩定性
5.負責公司數據標簽體系的建設,并推動標簽體系在實際業務場景中落地
崗位要求:
1.5年以上DW/BI數據架構設計、模型設計和性能調優等相關經驗
2.有較強的數據分析能力,精通數據倉庫架構,熟悉Erwin或PowerDesigner建模工具
3.精通一種主流關系數據庫(如mysql等),熟悉Hive開發
4.有電商業務經驗,元數據管理,數據質量管理或標簽體系搭建經驗者優先
5.優秀的協調溝通與團隊協作能力,極強的責任心,能承受一定的工作壓力,認同企業文化和團隊價值
大數據架構師的職責 篇20
職責:
1. 負責大數據基礎和應用平臺的整體規劃和架構設計,參與需求分析,架構設計,詳細設計以及技術選型決策
2. 參與數據挖掘和建模相關核心算法的代碼實現
3. 負責大數據算法平臺的技術把關,性能調優,控制架構質量,解決項目技術難題;對研發項目和任務需求進行評估和方案設計、拆分任務并指導工程師完成開發
4. 帶領團隊提供并實現大數據算法平臺上各項數據接入、數據挖掘分析及數據可視化的架構設計與能力,支持解決方案實施
5. 負責數據庫設計、應用架構設計、核心技術選型等工作
6. 協調解決開發中的技術問題、設計和監控運營指標,保障系統穩定運行
7. 培養,指導有能力的員工,指導工程師進行技術驗證實現,核心技術攻關,解決開發過程中的技術難題
任職要求:
1. 熟悉大數據和數據倉庫的系統架構設計方法
2. 熟練使用并理解HadoopSpark架構及生態。(Hadoop,Hive,Hbase,Elasticsearch,Kafka,SparkFlink等)
3. 熟悉分布式系統架構,有分布式實時、離線和機器學習平臺的架構和開發經驗,具備海量數據清洗、分析處理及存儲的實踐經驗
4. 熟練使用JAVA,具有大規模分布式系統調優經驗
5. 熟悉AI相關算法,熟悉機器學習、深度學習。熟悉AI學習開源框架(Tensorflow、PyTorch等)者優先;
6. 具備良好的團隊合作精神,對工作充滿激情。
7. 熟悉FusionInsight平臺開發經驗者優先