前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)課程體系范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:該文闡述了數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)的設置必要性、專業(yè)的培養(yǎng)目標和知識能力結構,最后探索了數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)的技術性課程體系設置方法。希望該文內(nèi)容對數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的培養(yǎng)方案制訂和課程體系構造具有一定的指導意義和參考價值。
關鍵詞:數(shù)據(jù)科學;大數(shù)據(jù)技術;課程體系
1本專業(yè)的背景
數(shù)據(jù)科學隨著人工智能學科發(fā)展而產(chǎn)生。自1956年提出人工智能研究以來,人工智能經(jīng)歷過推理研究期、知識表達研究期和機器學習期[1]。機器學習中歸納學習主要從數(shù)據(jù)歸納出規(guī)律,在20世紀80年代末期提出知識發(fā)現(xiàn)(Knowl-edgeDiscover,KDD),而20世紀90年代初產(chǎn)生了數(shù)據(jù)挖掘(DataMining)研究方向,數(shù)據(jù)挖掘成為20世紀90年代至21世紀初非常熱門的研究方向,各種數(shù)據(jù)挖掘研究問題和成果,形成了數(shù)據(jù)科學的主要內(nèi)容。21世紀初,網(wǎng)絡技術的廣泛運用推動了信息領域的大規(guī)模數(shù)據(jù)產(chǎn)生與積累。從大量數(shù)據(jù)的統(tǒng)計分析中發(fā)現(xiàn)一些規(guī)律,成為業(yè)界亟須解決的一個技術問題,推動了大規(guī)模并行計算以及分布式計算技術的發(fā)展,產(chǎn)生了以Hadoop平臺為代表的大數(shù)據(jù)分析計算技術。國家在“十三五”規(guī)劃綱要中提出:“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”。黨的十八屆五中全會公報提出要實施“國家大數(shù)據(jù)戰(zhàn)略”,標志著大數(shù)據(jù)戰(zhàn)略正式上升為國家戰(zhàn)略。2015年9月,國務院印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》提出,加強專業(yè)人才培養(yǎng),鼓勵高校設立數(shù)據(jù)科學和數(shù)據(jù)工程相關專業(yè),重點培養(yǎng)專業(yè)化數(shù)據(jù)工程師等大數(shù)據(jù)專業(yè)人才。正是在這種背景下,2016年,我國設立了數(shù)據(jù)科學與大數(shù)據(jù)技術本科專業(yè),第一批由北京大學、中南大學和中央財經(jīng)大學等三所高校設立,第二批為2017年由32所高校設立。
2本專業(yè)的培養(yǎng)目標
在國外,數(shù)據(jù)科學與大數(shù)據(jù)技術(DataScience)專業(yè)是以數(shù)據(jù)分析學(DataAnalytics)專業(yè)為基礎發(fā)展而來的,在北美大學首先設立數(shù)據(jù)分析碩士學位,主要是抽象出底層的數(shù)據(jù)問題,連接計算機基礎學科與數(shù)據(jù)科學之間的空白。2013年,紐約大學等幾所美國高校設立了數(shù)據(jù)科學碩士學位,出現(xiàn)了數(shù)據(jù)科學專業(yè)概念[2]。該專業(yè)以數(shù)據(jù)科學與大數(shù)據(jù)分析開發(fā)為核心內(nèi)容,并強調(diào)學生理解掌握數(shù)據(jù)領域的知識,具備為數(shù)據(jù)分析運用服務的技術能力。數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)培養(yǎng)具有多學科交叉能力的大數(shù)據(jù)人才,其中,重點培養(yǎng)三方面的素質(zhì)人才:理論型人才,主要應具備對數(shù)據(jù)科學中模型進行理解和運用的能力;實踐型人才,主要應具備處理實際數(shù)據(jù)的能力;應用型人才,主要應具備利用大數(shù)據(jù)的方法解決具體行業(yè)應用問題的能力。學生畢業(yè)后主要從事大數(shù)據(jù)產(chǎn)品開發(fā)或大數(shù)據(jù)分析,未來職業(yè)發(fā)展為企事業(yè)單位的數(shù)據(jù)信息高級管理員和分析師,或成為信息技術領域的涉及數(shù)據(jù)分析方向軟件開發(fā)工程師或算法分析師。具體目標為:掌握面向數(shù)據(jù)應用的統(tǒng)計學、數(shù)學、計算機科學以及應用領域學科的基礎理論和方法、熟練運用各種數(shù)據(jù)分析技術和手段;掌握數(shù)據(jù)尤其是大數(shù)據(jù)的采集、存儲、處理、分析與應用等技術,具備數(shù)據(jù)和大數(shù)據(jù)應用項目的設計和開發(fā)能力;能夠利用探索性數(shù)據(jù)分析技術對數(shù)據(jù)進行初步建模,并能利用統(tǒng)計推斷的基本理論、方法對數(shù)據(jù)進行分析和產(chǎn)品化開發(fā);在系統(tǒng)的專業(yè)技術訓練基礎上,具備廣泛的數(shù)據(jù)應用視野、能夠勝任大數(shù)據(jù)分析挖掘、大數(shù)據(jù)系統(tǒng)開發(fā)等技術領域以及大數(shù)據(jù)商務與金融等各類相關應用領域的多層次工作。
3數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)知識能力結構
數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)主要以計算機科學與技術專業(yè)為基本知識能力支撐、將人工智能的數(shù)據(jù)挖掘為拓展性能力,因此其涉及計算機科學與技術、人工智能、統(tǒng)計學等專業(yè)知識與能力,即掌握應用先進的計算技術并從大數(shù)據(jù)當中獲取知識與智慧的技術[3]。數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)要求的知識與能力是計算機傳統(tǒng)知識能力、經(jīng)典數(shù)據(jù)分析與新型數(shù)據(jù)分析手段;計算機的信息管理技術提供應用基礎技術,數(shù)學理論基礎和數(shù)理統(tǒng)計方法支持,新興技術平臺提供技術支持,通過多支持并以數(shù)據(jù)為核心所得出的技術。數(shù)據(jù)科學與大數(shù)據(jù)技術能力需求可以分為理論性能力和實踐性能力[4]。學生要有較強的數(shù)理統(tǒng)計基礎、數(shù)學建模能力、扎實的數(shù)據(jù)結構和算法基本功,能夠很好地理解和掌握各種機器學習和數(shù)據(jù)挖掘算法,還要掌握處理“大數(shù)據(jù)”的先進技術,即掌握云計算相關的大數(shù)據(jù)處理平臺及其生態(tài)系統(tǒng)。實踐性能力指處理實際數(shù)據(jù)的實踐能力,能夠掌握基本算法和系統(tǒng)開發(fā)能力,并且具備一定實際應用性能力,即利用大數(shù)據(jù)解決具體行業(yè)應用問題的能力。專業(yè)技術性能力要求為:具備數(shù)學能力,在基本數(shù)據(jù)技術及其在軟件開發(fā)中應用數(shù)學的能力。具備大數(shù)據(jù)應用程序開發(fā)實踐能力,能夠根據(jù)軟件需要設計簡單的解決方案,能根據(jù)給出的設計方案實現(xiàn)軟件開發(fā);具備應用大數(shù)據(jù)知識將大數(shù)據(jù)和云計算知識用于分析解決復雜性工程問題的能力;具備能夠基于科學原理并采用科學方法對復雜工程問題進行研究的能力,包括設計實驗、分析與解釋數(shù)據(jù),并能通過信息綜合得到合理有效的結論[5-6]。
4數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)課程設計原則
專業(yè)技術性能力課程體系分為:數(shù)學基礎課、計算機相關課程、數(shù)據(jù)科學相關課程、大數(shù)據(jù)技術相關課程、領域相關課程。各高校可根據(jù)各自的專業(yè)定位選擇設置。數(shù)學基礎課:傳統(tǒng)計算機學科基礎數(shù)學主要有微積分、線性代數(shù)、概論統(tǒng)計學。專業(yè)數(shù)學基礎課可擴展為優(yōu)化與運籌學課程:時間序列導論、隨機過程分析、最優(yōu)化方法、多元統(tǒng)計分析、運籌學。計算機相關課程:遵照中國工程教育認證的計算機類的通用標準主要有計算機科學導論、高級語言程序設計、算法與數(shù)據(jù)結構、操作系統(tǒng)、計算機組成原理、操作系統(tǒng)導論、軟件工程、數(shù)據(jù)庫原理與應用、計算機網(wǎng)絡等相關課程,根據(jù)本專業(yè)特點,建議增設算法分析與設計。數(shù)據(jù)科學相關課程:主要是圍繞數(shù)據(jù)挖掘與分析展開課程。根據(jù)需要掌握數(shù)據(jù)采集、數(shù)據(jù)存儲與管理、數(shù)據(jù)分析方法、數(shù)據(jù)展示等能力,可開設的課程有數(shù)據(jù)科學導論、數(shù)據(jù)挖掘與分析、機器學習、數(shù)據(jù)可視化、數(shù)據(jù)采集與爬蟲技術、數(shù)據(jù)的人文與倫理等課程。大數(shù)據(jù)技術相關課程:須掌握利用相關大數(shù)據(jù)技術平臺和開發(fā)方法,實現(xiàn)數(shù)據(jù)科學理論的分析方法。面向大數(shù)據(jù)實際應用能力培養(yǎng),比較典型大數(shù)據(jù)平臺開發(fā)課程主要有Spark開發(fā)技術、Hadoop編程平臺、HBase大數(shù)據(jù)快速讀寫、大數(shù)據(jù)系統(tǒng)應用實驗、云計算。領域相關課程:這方面課程主要面向專業(yè)方向選修課,其包括兩類,一類是通用領域的相關課程,例如自然語言處理、圖像分析與處理、語音分析或相關領域的數(shù)據(jù)分析、大數(shù)據(jù)案例分析與實驗、文本挖掘分析、智能系統(tǒng)推薦等;另一類是與行業(yè)相關的領域課程,例如農(nóng)業(yè)大數(shù)據(jù)分析、電子商務大數(shù)據(jù)分析、電力數(shù)據(jù)分析等,可根據(jù)各高校的專業(yè)特色定位而開設。
參考文獻
[1]顧險峰.人工智能的歷史回顧和發(fā)展現(xiàn)狀[J].自然雜志,2016,38(3):157-166.
[2]孫書韜,朱立谷,李春芳.北美知名大學數(shù)據(jù)科學專業(yè)課程體系分析[J].中國教育信息化,2019(24):48-50.
[3]賀文武,劉國買.數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)核心課程建設的探索與研究[J].教育評論,2017(11):31-35.
[4]楊洪,李知遙,張志強.數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)實踐能力培養(yǎng)體系的探索與實踐[J].成都大學學報(社會科學版),2018(3):106-112.
[5]劉穎,王愛蓮,宣齊娜,等.新工科背景下數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)建設探析:以地方財經(jīng)類高校為例[J].吉林工商學院學報,2019,35(6):106-109.
[6]周四軍,熊偉強.如何構建數(shù)據(jù)科學與大數(shù)據(jù)技術本科專業(yè)課程體系[J].才智,2017(25):60.
作者:劉建華 胡文瑜 唐鄭熠 林芳 單位:福建工程學院信息科學與工程學院