返回頂部
關閉軟件導航
位置:首頁 > 資訊 > 電商資訊>阿里大數(shù)據(jù)部門真實工作場景和你想象的一樣嗎
阿里大數(shù)據(jù)部門真實工作場景和你想象的一樣嗎

老板:我是一家手機公司的老板,今天要向去董事局匯報,我要預備一份介紹過去三年的用戶增長、用戶留存、用戶活躍度、手機里面每個APP使用率等情況的報表,假如下面沒我下面沒有BI,那我肯定就蒙逼了。。

BI:我是一名非技術BI,我天天看競品的分析報告,看雙十一銷量,看各種評論,知道自己的產品有哪些短板有哪些優(yōu)點,我分析南北地域差異,國內外客戶喜好,總之我在手機領域有著很強的行業(yè)解讀能力和數(shù)據(jù)解讀能力,我可以畫出非常漂亮的圖表和PPT。

今天老板讓我出一份報表,我還要去刷臉找ETL工程師幫我跑出這次報告的數(shù)據(jù),基于這份數(shù)據(jù)我要給出一定的解讀,為啥這個月手機賣得不如上個月,為啥用戶流失越來越嚴重等等都是我要去做的。

阿里大數(shù)據(jù)部門真實工作場景和你想象的一樣嗎1

ETL工程師:我是食物鏈很底層的苦逼ETL工程師,我會寫shell、我會搭hadoop/hive/hbase、會寫超復雜邏輯的sql,今天那個不會自己計算數(shù)據(jù)的BI又讓我跑幾個數(shù)據(jù),我本想讓她提需求流程的,但她說這是老板要的(運營慣用的殺手锏!!!),要加急處理。

我只能放下手頭的活兒給她跑數(shù)據(jù)了,花了半個小時把數(shù)據(jù)跑好給她,希望能就這么交差吧。

假如你以為我天天就做這點事那你就錯了,我平時的工作可不僅僅就是完成上面交給我的任務哦,我還負責數(shù)據(jù)ETL過程、數(shù)據(jù)建模、定時任務的分配、甚至有時Hadoop集群的維護等等都得我去做,每件事單獨拿出來都可以拿出來寫本書。

就拿ETL過程來說吧,你要把原始數(shù)據(jù)從各種數(shù)據(jù)庫、各種服務器的不同業(yè)務日志歸一化到同一類格式,要約定好分隔符,然后導入到分布式文件系統(tǒng)HDFS,甚至你還要和業(yè)務系統(tǒng)定義數(shù)據(jù)格式出規(guī)范。

數(shù)據(jù)收集完,你還得出中間表,數(shù)據(jù)過濾,格式統(tǒng)一,ID統(tǒng)一,維度統(tǒng)一,通過不同的數(shù)據(jù)現(xiàn)象進行數(shù)據(jù),完了,你就得出一些日報周報之類的數(shù)據(jù)了,這時候你要按照需求把數(shù)據(jù)組織成一定的格式然后到Mysql、或者HBASE等等。

總之你就是需要把數(shù)據(jù)各種收集、各種處理、然后各種導入導出,是不是很有意思?

不過這些數(shù)據(jù)倉庫都非常初級,其中ETL工程師可發(fā)揮的空間太多了

1、正常情況下,老板—>BI—>ETL出一份報告,這中間能否BI直接去計算數(shù)據(jù)?sql太復雜,那么可不可以一切數(shù)據(jù)標簽化,BI甚至老板要什么就選什么?

2、ETL工程師可以把數(shù)據(jù)收集自動化、可以規(guī)范業(yè)務日志格式、可以將一切都配置化,但是這些都是基于N+1的,也就是說今天的發(fā)生了什么一定要到明天才能看到,那么有沒有一個系統(tǒng)能把數(shù)據(jù)分析做到實時或者準實時?參考雙十一大屏,馬總要是到12號才能知道成交了多少筆不劈了那幫做數(shù)據(jù)的才怪。

3、目前絕大部分分析系統(tǒng)都基于離線計算(HADOOP/ODPS),那這里有個問題了,運營或BI想看個數(shù)據(jù)還得你離線慢騰騰跑完才能看到,那么有沒有一個系統(tǒng)可以支持你再大的數(shù)據(jù)量,再復雜的邏輯,毫秒出數(shù)據(jù)?

阿里大數(shù)據(jù)部門真實工作場景和你想象的一樣嗎2

我們有提到的還有算法工程師、大數(shù)據(jù)運維工程師等等。

數(shù)據(jù)倉庫的概念很廣很大,但在大數(shù)據(jù)應用面前也不值一提。

阿里大數(shù)據(jù)部門真實工作場景和你想象的一樣嗎3

假如把數(shù)據(jù)價值分層,這里分層的辦法很多,我只列舉一種方法,有人分過5層

第一層:為老板提供決策支持,例如傳統(tǒng)的財務報表

第二層:為運營提供決策支持,例如數(shù)據(jù)化非常徹底的淘寶運營們

第三層:為產品提供支持,例如有產品經理們會拿著報表天天看研究自己的某一個按鈕擺放位置對不對

第四層:數(shù)據(jù)用于生產,比如直接對接廣告系統(tǒng)產生收益,比如直接對接推薦系統(tǒng)為用戶推薦商品,實現(xiàn)千人千面,再比如利用手機APP直接給不同用戶push消息

第五層:大數(shù)據(jù)交換,數(shù)據(jù)產生直接收益

大部分公司能做到前兩個層次就已經很不錯了,假如能做到第三層,就已經很牛逼,做到第四第五層次,國內互聯(lián)網公司不超過3家,阿里和騰訊可以做到,大數(shù)據(jù)應用太大了,不知從何說起,以后聊吧。

如果您覺得 阿里大數(shù)據(jù)部門真實工作場景和你想象的一樣嗎 這篇文章對您有用,請分享給您的好友,謝謝
文章地址:http://m.meyanliao.com/article/online/10122.html
解放雙手無盡可能,有問題添加天線貓微信
主站蜘蛛池模板: 天堂Av无码Av一区二区三区| 中文字幕精品无码一区二区三区| 好硬~好爽~别进去~动态图, 69式真人无码视频免 | 国产精品无码永久免费888| 熟妇人妻系列av无码一区二区| 人妻无码αv中文字幕久久| 亚洲中文无码永久免| 亚洲成AV人在线播放无码 | 亚洲Av无码国产一区二区| 亚洲人成无码网WWW| 伊人久久精品无码麻豆一区| 亚洲精品色午夜无码专区日韩| 天堂一区人妻无码| 秋霞鲁丝片Av无码少妇| 亚洲一区二区三区AV无码| 免费无码又黄又爽又刺激| 久久久亚洲精品无码| 潮喷失禁大喷水aⅴ无码| 亚洲国产成人精品无码区花野真一| 波多野结衣AV无码| 国产精品无码制服丝袜| 无码人妻丝袜在线视频| 亚洲av无码国产精品夜色午夜| 五月丁香六月综合缴清无码| 无码国产精品一区二区免费 | 国产福利电影一区二区三区久久老子无码午夜伦不 | 中文字幕乱码人妻无码久久| 国产成人无码免费视频97| 亚洲av无码专区亚洲av不卡| 久久久久av无码免费网| 无码人妻精品一区二区三区在线| 精品无码成人片一区二区| 无码里番纯肉h在线网站| 中文字幕无码成人免费视频| 无码超乳爆乳中文字幕久久| 国产白丝无码免费视频| 亚洲精品无码不卡在线播HE | 国产成人精品无码播放| 亚洲一区二区三区无码中文字幕| 最新中文字幕AV无码不卡 | 无码137片内射在线影院|