无码人妻A片一区二区三区_18禁裸乳无遮挡啪啪无码免费_91精品亚?影视在线?看_人人妻人人爽人人澡AV_国产精品人妻一区二区三区四区_午夜免费影视

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 精選文章 > 如何像數據科學家或數據分析師一樣思考

如何像數據科學家或數據分析師一樣思考

2020-08-06 14:41:37 | 來源:中培企業IT培訓網

數據科學是一個新興且日趨成熟的領域,從數據工程和數據分析到機器學習和深度學習,各種工作職能不斷涌現。數據科學家必須結合科學,創造性和調查性思維來從一系列數據集中提取含義,并應對客戶面臨的潛在挑戰。從零售,運輸和金融,到醫療保健和醫學研究,生活各個領域的數據量都在不斷增長。可用計算能力的提高和人工智能的最新發展推動了數據科學家的關,像數據科學家一樣思考。那么成為一名數據科學家又需要什么呢?高級數據科學家給了關于成功技巧的一些建議 。

高級數據科學家Chu具有人工智能方面的背景知識,尤其是在語言學,語義學和圖形學領域,并在新加坡的知名企業工作了兩年。

保持好奇心

Chu在接受我們的采訪時說,數據科學家應該像調查員一樣思考。

您需要通過問“為什么?”感到好奇和興奮。“這有點像是一個偵探,將他們混在一起,尋找新的線索。”

在金融領域,數據科學家從一系列數據集中提取含義,以告知客戶并指導其關鍵決策。

數據科學家必須著眼于客戶想要解決的挑戰,并從他們正在使用的數據中獲取線索。

通過與Chu交談,我了解了能夠轉移重點并考慮調查背景的重要性。

如果無法解決根本問題,那么完美的分析將無濟于事。有時,您需要回頭,嘗試一種新方法并重新構造您要回答的問題。好奇心在于它。您需要愛問題!

  要科學

數據科學家使用各種工具來管理其工作流程,數據,注釋和代碼。

“我必須非常勤奮。我需要衡量和跟蹤進度,以便可以備份并嘗試新的方向,重用以前的工作并比較結果。

“重要的是要科學,在進行過程中進行觀察,實驗和記錄,以便您可以復制發現。我需要整理我的觀察結果,因此我將Noion用作主要工具,將所有筆記,論文和可視化文件都放在一個位置。”

Chu強調需要保持記錄不僅要追溯到他目前的研究,而且還要涵蓋所有以前的發現。

“這就像數據科學日記。每當遇到類似情況時,我都會保留良好的參考點,并請他們參考以指導下一步。”

  有創造力

數據科學不僅涉及科學方法。職位可能會誤導他人;您不必具有科學背景,但是您確實需要能夠創造性地思考。通常,替代思維是您應對挑戰的關鍵。

“我必須在解決問題的科學思維和創造性思維之間切換,以引導我探索新的不同探索途徑。

“邏輯,科學的思維對于幫助我得出結論至關重要,但戴上創意帽同樣重要:我使用好的和失敗的例子作為觀察新模式的線索。這全都與“編碼情報”有關。”

  學習編碼

您需要扎實的編碼能力,才能使用各種數據處理技術來預處理不同的數據源,以解決嘈雜或不完整的數據。

您還需要能夠創建機器學習管道,這將需要您知道如何構建模型,并使用工具和框架來評估和分析其性能。

像大多數數據科學家一樣,Chu使用Python,因為可以使用許多出色的軟件包來處理和建模數據。

實際上,Glassdoor在2017年上半年為放置在其站點上的數據科學家抽取了10000個工作清單,并發現Python,R和SQL這三種特殊技能構成了數據科學中大多數職位空缺的基礎。Ben Chu的團隊依賴于開源機器學習包。

“我們主要將Confluence用作文檔工具;機器學習的MLFlow,Amazon Sagemaker,Scikit-Learn,Tensorflow,PyTorch和BERT; Apache Spark在大型數據集上構建快速的數據管道;和Athena作為我們的數據庫來存儲處理后的數據。

“我們還使用Superset來連接數據并更輕松地構建儀表板以輸出圖表,從而使其更加直觀。”

  不用擔心“冒名頂替綜合癥”

Chu現在是某企業的一名高級數據科學家,但是他長大后想成為一名音樂家,并且對語言著迷。“對于我在自然語言處理方面的工作領域,我需要對語言學,尤其是語義學和語言細微差別有很好的理解。”

他解釋說,數據科學團隊需要一系列技能-他和他的同事具有不同背景的重疊技能。

“您所需的技能將取決于您所從事的領域。例如,我需要對財務有很好的了解。

“例如,數據分析通過構建異常檢測方法來檢測欺詐行為,將其作為交易數據中的不規則模式來減輕欺詐行為。

“像我這樣的數據科學家需要精通如何處理各種孤立的財務數據。知道要結合什么是至關重要的,因為沒有這種理解,我就無法建立成功的模型。”

成為計算機科學家或數學家進入數據科學并不是必需的。沒有人在每個領域都擁有全部專業知識。您可能來自法律,經濟學或科學領域。這完全取決于您的想法。

如果您可以靈活,系統地進行操作,則可以在使用工具,框架和數據集的過程中熟悉它們。

如何開始

對于那些渴望發展其數據科學技能的人,Chu提供了一些實用的技巧,盡管COVID-19造成了干擾,您仍可以輕松地采用這些技巧。

您可以查找研究社區,參加網絡研討會并在線查找培訓課程。一旦面對面的聯網再次可行,Chu建議您積極參與數據科學界。

“參加聚會和黑客馬拉松,這將幫助您建立一個強大的網絡來討論您的想法,激發您的研究并回答您的問題”。

另外,請記住,數據科學領域是新的并且仍在日趨成熟。

出現了各種不同的職位,例如數據科學家,數據工程師和數據分析師,以及機器學習和深度學習工程師。您可能會發現一個角色比另一個角色更適合您的興趣和技能。

以上即是關于如何像數據科學家或數據分析師一樣思考的全部內容,想了解更多關于數據科學的知識,請繼續關注中培偉業。

主站蜘蛛池模板: 国产一区二区三区视频观看 | 国产精品无码久久AⅤ人妖 欧美日韩在线不卡 | 久久国产精品-久久精品 | 69国产成人精品午夜福中文 | 国产成人综合一区二区三区 | 成人99视频| 1a级毛片免费观看 | 精品午夜福利无人区乱码一区 | 麻豆福利在线观看 | 欧美18ⅩXXXX性欧美喷水 | 蜜臀亚洲AV无码之国产精品 | 色视频在线看 | 黄色av影视 | 一级特黄色毛片 | 产精品一区二区馆蜜桃 | 亚洲国产精品毛片 | 国产亚洲欧美精品一区 | 久久久久午夜 | 娇妻在厨房被朋友玩得呻吟 | 久久久久久久高清 | 九九免费在线观看视频 | 97久久精品无码一区二区 | 老太脱裤子让老头玩xxxxx | 亚洲浮力影院久久久久久 | 精品国产91亚洲一区二区三区婷婷 | 亚洲精品久久无码av片动漫网站 | av大全在线| 日韩国产中文字幕在线 | 无码人妻丝袜在线视频红杏 | 久久久亚洲综合 | 国产午夜人做人免费视频 | 无套中出丰满人妻无码 | 国产模利在线网址成人 | 国产天堂亚洲国产碰碰 | 乱淫67194 | 免费视频99 | 麻豆产精国品一二三产区区 | 一区二区三区在线免费播放 | 国产日韩a | 国产爆乳无码一区二区麻豆 | 国产在线视频二区 |