欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
用數據解決數據的問(wèn)題


一鍵處理One Click,標簽化數據Data Profile……

在今天的Strata Hadoop World 首屆北京會(huì )議上,阿里巴巴數據技術(shù)及產(chǎn)品部高級技術(shù)專(zhuān)家張磊拋出了兩個(gè)非常新鮮的功能名詞。   

 

One Click、Data Profile這兩個(gè)都是在阿里數據One Data體系內,為了高效率地開(kāi)展數據研發(fā)工作而開(kāi)發(fā)出來(lái)的功能模塊。此前,課代表已經(jīng)為大家介紹過(guò)兩篇關(guān)于OneData的文章。(回復“OneData”獲取過(guò)往筆記的推送)


阿里巴巴數據技術(shù)及產(chǎn)品部高級技術(shù)專(zhuān)家張磊


今天,課代表就把張磊在會(huì )議中的分享,摘錄一些重點(diǎn)干貨給大家。

1背景篇

在阿里內部,數據研發(fā)工作比大家想象中的還要繁雜得多。這主要是由阿里數據自身定位決定的。阿里數據定位于阿里集團的數據中臺。


就數據資產(chǎn)而言,阿里數據實(shí)際上擁有了海量的各類(lèi)業(yè)務(wù)數據,比如電商交易數據、支付數據、風(fēng)險數據、視頻數據、音樂(lè )數據、地理位置數據、物流數據……


體量龐大的數據,加上數據本身與業(yè)務(wù)的強相關(guān)勢必會(huì )給數據研發(fā)工作帶了極大的挑戰:交付時(shí)間受限、發(fā)布上線(xiàn)頻率高、運維任務(wù)眾多、系統環(huán)境復雜。


面臨這些挑戰,除了加強工具建設并與研發(fā)流程打通等常規方法外,阿里數據還在數據處理上,探索出了一些能讓研發(fā)更為高效的創(chuàng )新方法。

2Data Profile為數據畫(huà)像

由于阿里數據擁有的數據體量實(shí)在難以估量,我們很難精確地說(shuō)清楚到底擁有哪些數據、這些數據存儲在哪里,如何使用它們等等。過(guò)去,數據研發(fā)人員在尋找數據、確認口徑算法等工序上,花費了大量的人力和時(shí)間。


而Data Profile的出現,恰好解決了研發(fā)初期數據處理的繁雜困境,既節約了時(shí)間成本,同時(shí)也縮減了相當一部分人力資源。它的核心思路即是為紛繁復雜的數據建立一個(gè)脈絡(luò )清晰的血緣圖譜。通過(guò)圖計算、標簽傳播算法等技術(shù),系統化、自動(dòng)化地對計算與存儲平臺上的數據進(jìn)行打標、整理、歸檔。


形象地來(lái)看, Data Profile實(shí)際承擔的是為元數據“畫(huà)像”的任務(wù)。

3Data Profile四類(lèi)標簽

就像我們可以為用戶(hù)的網(wǎng)購行為打上不同的行為標簽一樣。如果我們也用同樣的思維來(lái)看待數據本身,那么原本冷冰冰的僵硬數據,實(shí)際上也變得有血有肉、個(gè)性鮮明。


數據之間的個(gè)性化,除了應用場(chǎng)景的不同之外,實(shí)際上在數據的研發(fā)流程、保障登記、數據質(zhì)量要求、安全等級、運維策略、告警設置上都會(huì )有差異。根據這種差異化, Data Profile開(kāi)發(fā)出了四類(lèi)標簽。

1、基礎標簽:針對數據的存儲情況、訪(fǎng)問(wèn)情況、安全等級等進(jìn)行打標。

2、 數倉標簽:針對數據是否是增量or全量、是否可再生、數據的生命周期來(lái)進(jìn)行標簽化處理。

3、業(yè)務(wù)標簽:根據數據歸屬的主題域、歸屬產(chǎn)品線(xiàn)、業(yè)務(wù)類(lèi)型為數據蓋上不同的標簽。

4、潛在標簽:這類(lèi)標簽主要是為了說(shuō)明數據潛在的應用場(chǎng)景,比如社交、媒體、廣告、電商、金融等。

利用Data Profile,我們不僅可以節約研發(fā)人員的時(shí)間成本,同時(shí)對阿里內部的非研發(fā)人員來(lái)說(shuō),也可以更直觀(guān)地理解數據,利用數據,從而提升數據的研發(fā)效率。

4OneClick一鍵處理

OneData體系里,讓數據研發(fā)更高效的工具還有OneClick。OneClick顧名思義,就是通過(guò)一鍵點(diǎn)擊的方式,來(lái)提高數據研發(fā)的效率。目前OneClick主要覆蓋的場(chǎng)景有兩個(gè):一是數據同步,另一個(gè)是存量數據日常維護。

 

OneClick的思路實(shí)際上就是將數據研發(fā)一些日常的操作,通過(guò)一個(gè)可復用的流程,一鍵點(diǎn)擊、一鍵完成。在上述兩塊數據處理的場(chǎng)景中,所有的功能都是基于某一事先配置好任務(wù)流去實(shí)現,每個(gè)任務(wù)流都是不同的API接口按照一定順序的排列組合。


5未來(lái):數據研發(fā)可以更高效

Data Profile和OneClick的出現,大大降低了研發(fā)和運維的成本。試想一下,隨著(zhù)業(yè)務(wù)的發(fā)展,數據一般都會(huì )有它自己的生命周期,我們需要定期去探查一些數據是否可以做下線(xiàn)處理。


過(guò)去,我們需要花費很高成本去調查確認,現在利用Data ProfileOneClick,這個(gè)事情可以變得非常簡(jiǎn)單。


首先我們可以通過(guò)DataProfile拿到這個(gè)數據的下游任務(wù)依賴(lài)情況、最近被讀寫(xiě)的次數、數據是否可再生、每天消耗的存儲計算等,這些信息足以讓我們判斷數據是否可以下線(xiàn),如果根據一些規則判斷可以下線(xiàn),我們會(huì )通過(guò)OneClick觸發(fā)一個(gè)數據下線(xiàn)的工作任務(wù)流,數據owner可能只需要在手機上點(diǎn)一下提交按鈕,那么刪除數據、刪除meta、下線(xiàn)調度任務(wù)、下線(xiàn)DQC監控等一系列操作就會(huì )自動(dòng)后臺執行完成。


對于OneData體系的未來(lái),阿里數據仍在持續探索。未來(lái)阿里數據希望可以通過(guò)這一體系,將整個(gè)研發(fā)過(guò)程自動(dòng)化,進(jìn)一步解放生產(chǎn)力。阿里數據也希望這一行之有效的方法論可以為業(yè)界帶來(lái)復用的價(jià)值,引領(lǐng)行業(yè)的變革。


<END>



阿里數據

讓你了解數據在阿里的一點(diǎn)一滴


本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
震撼揭秘阿里數據中臺:300多種標簽如何服務(wù)千人千面?
《阿里巴巴全域數據建設》(實(shí)錄/PPT干貨)
★★什么是One Data體系?阿里數據中臺解讀
干貨:解碼OneData,傳說(shuō)中的阿里數據中臺是如何練成的?
數據中臺實(shí)戰(二):基于阿里OneData的數據指標管理體系
我花10個(gè)小時(shí),寫(xiě)出了小白也能看懂的阿里數據中臺分析
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久