热门问题
时间线
聊天
视角
Kaggle
来自维基百科,自由的百科全书
Remove ads
Kaggle是一個數據建模和數據分析競賽平台。企業和研究者可在其上發布數據,統計學者和數據挖掘專家可在其上進行競賽以產生最好的模型。這一眾包模式依賴於這一事實,即有眾多策略可以用於解決幾乎所有預測建模的問題,而研究者不可能在一開始就了解什麼方法對於特定問題是最為有效的。Kaggle的目標則是試圖通過眾包的形式來解決這一難題,進而使數據科學成為一場運動。2017年3月8日谷歌官方博客宣布收購Kaggle[1]。
Remove ads
競賽流程
Kaggle中組織一場競賽的過程如下。
- 競賽主持人準備數據和問題的描述。Kaggle對這一過程以及競賽的建構、數據的匿名化以及集成最終獲勝的模型提供諮詢服務。
- 參與者通過不同的方法進行實驗,相互競賽以獲得最優的模型。對於大多數的參與者,他們的提交會根據預測精度被立即評分,並在實時的積分榜上顯示。
- 在截止時間過後,競賽主持人為「全球性的,永久性的,不可撤銷和免版稅地使用獲獎作品」支付獎金。亦即競賽獲勝者的算法、軟體和相關的智慧財產權是非排他性的,除非特別指明[2]。
除了公開競賽以外,Kaggle還向活躍參與者提供私下的比賽,以及為大學團體提供Kaggle-in-Class項目[3]。
影響
根據Kaggle官方提供的數據,Kaggle在全球範圍內擁有將近20萬名數據科學家,專業領域從計算機科學到統計學、經濟學和數學[4]。Kaggle也曾經和NASA、維基百科、德勤和好事達合作舉辦競賽。其中的一項獎項高達300萬美金的競賽是Heritage Health Prize,目的是通過病人看病及吃藥住院等數據預測明年病人住院的天數[5]。另一項與微軟合作的競賽則旨在提高Kinect的手勢識別精度[6]。
Kaggle的競賽在愛滋病研究[7]、棋牌評級[8]和交通預測[9]方面取得了成果。基於這些成果產生了一系列的學術論文。產生這一結果的原因是實時積分榜促使參加者不斷改進以試圖超越當前的最佳實踐[10]。獲勝的方法常常在Kaggle的博客No Free Hunch(頁面存檔備份,存於網際網路檔案館)上展示。
融資
2011年,Kaggle從創辦地澳大利亞墨爾本搬遷到美國舊金山,並在11月宣布向矽谷投資者進行規模為1100萬美元的首輪融資。指數風險投資公司和科斯拉風險投資公司成為Kaggle最大的股東,而PayPal聯合創始人馬克斯·列夫琴也參加了該輪投資並成為Kaggle的董事局主席。另一位著名的投資人是經濟學家,Google首席經濟師哈爾·范里安。他稱Kaggle提供了一種「將全世界最有才能的數據科學家組織起來並使各種規模的機構都能夠觸及」的方式[11]。
參見
參考資料
擴展閱讀
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads