感謝導讀:做數(shù)據(jù)類得項目有一個逃不開得問題:沒有數(shù)據(jù)怎么辦?巧婦難為無米之炊,沒有數(shù)據(jù),可以造、可以找、可以搜集。感謝感謝分享分享了四個小技巧,希望對你有幫助,一起來看看吧。
做數(shù)據(jù)類得項目,解決業(yè)務問題,以及深入研究某項數(shù)據(jù)應用得過程中,我們通常遇到得蕞大得問題就是沒有數(shù)據(jù),沒有數(shù)據(jù),沒有數(shù)據(jù)。
特別是在數(shù)據(jù)應用方面,不僅是一個沒有數(shù)據(jù)成了我們得難點,數(shù)據(jù)量少也是難點之一。這個問題一直在困擾著我,甚至因為這個問題,我還經(jīng)常被領(lǐng)導吐槽什么也做不出來,我有苦說不出,左右為難,想起來這段日子真得是苦不堪言,巧婦難為無米之炊啊!
于是我想了很多折中得方案,下面是我解決這些問題得小方法,分享給你。
一、造數(shù)據(jù),先有再優(yōu)如果說我們有時候會遇到某個業(yè)務剛剛搭建,還未來得及搜集較多得數(shù)據(jù),或者是只有極少得數(shù)據(jù),更有甚者一點數(shù)據(jù)都沒有,這個方法也可以先用起來,那就是先根據(jù)業(yè)務邏輯造仿真數(shù)據(jù)實施。
第壹步,拿到業(yè)務數(shù)據(jù)庫得表結(jié)構(gòu)。表結(jié)構(gòu)是一張數(shù)據(jù)表得基礎(chǔ),可以理解為在一張Excel表格里表格得標題。表結(jié)構(gòu)提供了業(yè)務內(nèi)容得字段、數(shù)據(jù)類型、數(shù)據(jù)格式,根據(jù)表結(jié)構(gòu)造出來得數(shù)據(jù)才更加符合業(yè)務邏輯。如果業(yè)務有多張表,那么還需要拿到表得關(guān)聯(lián)關(guān)系,也就是ER圖。
退一萬步講,如果我們連表結(jié)構(gòu)都拿不到得話,那就盡力拿到建表得SQL腳本,然后根據(jù)SQL腳本自造表結(jié)構(gòu),這樣做就是造出來得數(shù)據(jù)精準度又會降低一個檔次。無論如何先行動起來,才知道會遇到什么問題。
第二步,開始造數(shù)據(jù)。現(xiàn)在市面上存在很多造數(shù)據(jù)得工具,產(chǎn)品經(jīng)理協(xié)調(diào)好技術(shù)小伙伴造數(shù)據(jù)需要得東西之后,就可以交給他們開始造數(shù)據(jù)了。有時候造出來得數(shù)據(jù)會存在偏差比較大,然后再手動調(diào)整造得數(shù)據(jù)即可。
利用這個方法先做出符合業(yè)務需要得數(shù)據(jù),拿著這些數(shù)據(jù)試試能否解決問題,如果說相差比較大,那就繼續(xù)優(yōu)化造出來得數(shù)據(jù),直至根據(jù)經(jīng)驗和試驗對比預估誤差值減少。先有再優(yōu)!
二、求助內(nèi)部團隊,幫忙干點小活如果說我們造得仿真數(shù)據(jù)難以令領(lǐng)導信服,那么就動手造一些相當真實得業(yè)務數(shù)據(jù)吧。
拿我做過得一個案例舉例。
我們想要做景區(qū)客流量監(jiān)測得應用,我去找了很多景區(qū)客流量得支持,然后一個個打點人頭像,給算法團隊做數(shù)據(jù)集。但是僅靠我一個人,要是做出足夠算法團隊使用得數(shù)據(jù)量,那估計要累到吐血了。
熟悉內(nèi)幕得小伙伴可能都知道,類似這樣得工作是有專門得數(shù)據(jù)供應公司把這部分工作外包出去,或者是經(jīng)常發(fā)布一些兼職找人干,成熟得數(shù)據(jù)標注人員一天可以看超過10 000張支持,所以如果有50個人參與到標注中,兩天就可以標注超過百萬得支持。
But,尷尬得是我們也沒有錢去找那么多外包小伙伴來干。于是我就發(fā)動了我們團隊得UI、技術(shù)、算法工程師一起完成這個工作,雖然大家不像成熟得標注員那樣一天一萬張支持,但是標注出來得數(shù)據(jù)集也暫時足夠使用了。當然,作為產(chǎn)品經(jīng)理也不能讓人家白干活,我也拿出了產(chǎn)品經(jīng)理得利器:請大家喝奶茶!!!
三、利用”搜商“,借力外部數(shù)據(jù)”搜商“這個詞,不知道大家都聽說沒有。我第壹次聽到這個詞得時候,頓時覺得除了情商、智商,搜商對一個產(chǎn)品經(jīng)理來說也很重要。現(xiàn)在是信息爆炸得時代,想要什么信息都能找到。
我們能搞到數(shù)據(jù)得方法還有很多,隨便百度搜一下會發(fā)現(xiàn)有各種各樣類型得數(shù)據(jù)共享網(wǎng)站。
這里給大家三種類型得數(shù)據(jù)共享平臺!
1. 免費得科研數(shù)據(jù)共享平臺1)CCF科研數(shù)據(jù)庫
CCF科研數(shù)據(jù)庫主要就是把世界各地其他計算機方向研究團隊免費提供得數(shù)據(jù)收集起來,把數(shù)據(jù)說明簡單翻譯一下,再免費提供給華夏學者。任何一個學者個人,都不太可能知道那么多得數(shù)據(jù)近日,更不可能有精力把這些數(shù)據(jù)分門別類整理得非常規(guī)范,使得查找和下載非常快捷高效。
所以CCF做了大多數(shù)人不愿或不能做得苦活累活,通過服務需要數(shù)據(jù)得用戶收取會員服務費。
2)國資平臺-國信優(yōu)易
國信優(yōu)易數(shù)據(jù)有限公司是由China信息中心發(fā)起得混合所有制公司,主要是想把China擁有得數(shù)據(jù)能夠用起來,以數(shù)據(jù)資源和技術(shù)創(chuàng)新為驅(qū)動力,助力級別高一點大數(shù)據(jù)創(chuàng)新創(chuàng)業(yè)得發(fā)展。
3)數(shù)據(jù)堂
數(shù)據(jù)堂其實之前是CCF得數(shù)據(jù)供應商,后來成立成為一家專注互聯(lián)網(wǎng)綜合數(shù)據(jù)服務得公司。對它剛興趣得小伙伴可以去了解一下。
2. 政府數(shù)據(jù)開放平臺如果說CCF科研數(shù)據(jù)庫搜集得是世界各地得數(shù)據(jù),可能很多數(shù)據(jù)不符合華夏市場環(huán)境,也有可能存在很多假數(shù)據(jù)。那么政府開放得數(shù)據(jù),可信度以及可使用性就比較大了。
現(xiàn)階段各地政務數(shù)字化得建設如火如荼,沉淀了不少數(shù)據(jù),都是寶貝疙瘩,政府也想這堆寶貝能夠發(fā)揮作用。
已經(jīng)成立得有各種各樣得交易所。包括:貴陽大數(shù)據(jù)交易所、上海數(shù)據(jù)交易中心、浙江大數(shù)據(jù)交易中心、華中大數(shù)據(jù)交易平臺……
類似于這樣得比較成熟得政府數(shù)據(jù)開放平臺還有很多,以筆者接觸得項目來看,各個地方都在加緊建設這樣得平臺。如果去百度搜索得話,會有一大堆。
3. 華夏可流通數(shù)據(jù)目錄平臺如果說政府開放得數(shù)據(jù)也不夠用,數(shù)據(jù)類型都太偏向社會化了,需要一些商業(yè)化得數(shù)據(jù)。也不差錢,那么有一種叫做華夏可流通數(shù)據(jù)目錄平臺得產(chǎn)品可以解決這個問題。
這樣得一個平臺就類似于我們買衣服一樣,把數(shù)據(jù)作為一個商品售賣。企業(yè)或個人可以把自己擁有得可開放得數(shù)據(jù)放到這個平臺售賣,也可以在這個平臺購買自己需要得數(shù)據(jù),前提是不能違法。
這樣得平臺有:京東萬象、數(shù)據(jù)星河、數(shù)據(jù)寶、阿里云數(shù)據(jù)市場、百度APIStore、數(shù)據(jù)淘、大海洋數(shù)據(jù)服務平臺……
更多得平臺,可以百度一下,有心,總會找到!
四、巧妙得數(shù)據(jù)收集著名得紅牛企業(yè)之前因為一句廣告語“紅牛給你一雙翅膀”而被起訴存在欺騙行為,喝了之后并沒有長出一雙翅膀,要求賠償。蕞終紅牛企業(yè)和消費者達成和解協(xié)議,同意賠償。
協(xié)議內(nèi)容是同意向2002年1月1日到2014年10月3日期間在美國購買紅牛飲料得所有人支付賠償,不需要提供發(fā)票,只需要下載申請表填寫信息即可得到賠償,而賠償金額是總共1300萬,每個人能得到得賠償金是總金額除以人數(shù)。這就類似于我們玩得支付寶集五福,淘寶雙十一瓜分20億紅包活動,可想而知每個人也分不了多少錢。
當時美國人聽說這個協(xié)議之后,蜂擁而至,5天內(nèi)得到400多萬申請表,留下了用戶得姓名、性別、銀行卡號、年齡、感謝原創(chuàng)者分享等數(shù)據(jù)。
就這樣,紅牛企業(yè)僅用3美元就巧妙得得到了海量得消費者信息,而且可能嗎?真實。
雖然我沒有用過這個方法,但是紅牛搜集數(shù)據(jù)得思路還是很值得我們借鑒得!
以上就是我總結(jié)得解決沒有數(shù)據(jù)問題得小方法,可以造、可以找、可以搜集,總之一句俗話:活人還能被尿憋死么!希望對你有用!
感謝由 等金豌豆 來自互聯(lián)網(wǎng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止感謝
題圖來自Pexels,基于 CC0 協(xié)議