摘要:歷時一個通宵,兩個白天,60多G的數據終于分發到上百臺計算機。200多平米的實驗室空蕩蕩,只能聽見計算機運行的聲音。數天后,這里將坐滿學生,鍵盤聲此起彼伏。
歷時一個通宵,兩個白天,60多G的數據終于分發到上百臺計算機。200多平米的實驗室空蕩蕩,只能聽見計算機運行的聲音。數天后,這里將坐滿學生,鍵盤聲此起彼伏。
實驗室里100多臺電腦搭載了PaddlePaddle,靜靜等待第一批使用的學生
邊教邊學,大學教師也需打怪升級
許云峰是河北科技大學信息學院計算機系的副教授,負責教授本科的人工智能和大數據課程,他與同事李媚、白宇和張妍同為大數據課程組的老師。在各高校陸續開設人工智能專業,AI領域加速快跑的時候,兩個問題一直困擾著許云峰:師資力量嚴重不足,缺乏實驗環境。
這兩個問題同樣困擾著其他高校教師。今年上半年,教育部印發《高等學校人工智能創新行動計劃》,并推出國內首個高校人工智能人才國際培養計劃,力爭五年內培訓頂尖高校至少500位AI教師、5000位AI學生。但是可支持資源少、缺少經驗指導是事實,很多老師自己都不會,只能邊教邊學,無形中提高了學習的門檻。
“人人都有平等學習和使用AI的權利,不能因為技術門檻將學生拒之門外?!痹S云峰說。2013年,許云峰第一次接觸深度學習技術,他意識到“深度學習技術是目前人工智能領域中最成熟、與實際應用最近、可擴展性最強的一項技術,選擇深度學習技術作為教學和科研的切入點,既可以促進本科生的就業,又可以促進研究生和教師的科研工作。”然而努力了半年,效果并不理想——沒有專業的實驗平臺,沒有真實數據,算法光靠“努力”成不了。
使用Paddle、參加培訓班,
學習AI的最佳時機被他抓住
2016至2018年,出現了兩個轉折點。
其一,百度于2016年宣布PaddlePaddle開源。經過長期試用,許云峰認為“PaddlePaddle是目前我們嘗試過的最容易上手的開源深度學習框架,沒有之一”。作為教師,他很看重框架的易用性,“學生可以非常輕松地設計網絡、調整參數,并設計新的算法,進而解決科研項目中的實際問題?!弊阅侵螅S云峰老師所在的實驗室一直在嘗試用該框架解決科研和工程問題。
其二,2018年5月,百度舉辦了信息技術新工科產學研聯盟深度學習師資培訓班,許云峰、李媚、白宇和張妍就在其中,在與資深人工智能專家的交流中他逐漸補齊了知識短板。在課程結束后的交流分享中,許云峰承諾:在河北科技大學已有的實驗環境上,開發基于PaddlePaddle的人工智能和大數據實驗系統,降低學生學習人工智能和大數據的技術門檻,使人人都有平等學習和使用AI的權利。
缺乏實驗環境?
于是他給百度打了個電話……
許云峰做出這樣的承諾,心里還是有把握的。
在百度舉辦的深度學習師資培訓班上,他和課程組同事已經將PaddlePaddle深度學習開源框架的基本的知識與操作技巧了然于心。培訓結束后,參訓教師、授課專家建起了微信群。來自不同高校教師經常就教學實踐中遇到的問題在群里討論,尋找最恰當的解決方案,為他們后期的教學活動提供持續性的保障。
在師資問題逐步得到解決之后,擺在許云峰面前的是一個很實際的問題?!皩W院的機房沒有進行人工智能相關實驗的軟件環境,學生們更不可能配置相應的硬件設備?!边@一問題如果不解決,開設相關課程則淪為空談。
許云峰給百度深度學習師資培訓班的組織者之一、PaddlePaddle運營高級經理謝夢打了個電話,“我需要你們的數據,需要你們的平臺提供幫助”。在了解到許云峰團隊的困境之后,謝夢馬上找到了百度AI Studio的產品經理靳偉。
AI Studio是封裝好了PaddlePaddle運行環境的AI實訓平臺,在云端集合了AI教程、代碼環境、算法算力;加上其一站式的設計,為初學者準備了多個領域的不同模型范例,以及數十個經典數據集,供學習練習使用。
靳偉了解許云峰的需求后,立馬給出肯定答復:“AI Studio愿意為河北科技大學和許老師提供幫助,也肯定能滿足他們的需求?!?/p>
獲得了技術支持,課程組終于能全身心投入大數據和人工智能實驗系統的開發。許云峰和百度持續溝通開課細節,課程設置、教材編寫、軟硬件布施,事無巨細。百度也樂意為老師們提供全天侯的PaddlePaddle開課服務。百度校園品牌部的項目經理張倩與許云峰溝通最為密切,“可能一周有3到4天都會和許老師溝通。我和我同事們的郵箱,幾乎天天收到老師發的項目進度、新的需求。能幫助老師們成就一件從無到有的事,我也很開心?!睆堎徽f。
開設PaddlePaddle深度學習開源框架相關課程的基礎條件已經具備。此時,距許云峰參加深度學習師資培訓班僅過了4個月。
報名人數一口氣破300,
開課模式可以復制?
9月18日,經過2個白天1個通宵,60多G的數據集被上傳到100多臺電腦主機。由許云峰與同事以及大數據實驗室多位研究生、本科生,歷時14人月開發的人工智能和大數據實驗系統,正式宣告完工。該系統整合了百度開源的深度學習框架PaddlePaddle和一些人工智能和大數據的相關實驗案例,可以讓學生在4G內存+I5CPU的普通PC上運行人工智能和大數據實驗,大幅度降低了學習人工智能和大數據技術的技術門檻。
他在培訓班的微信群里發了一句話:“我們上次開會吹的牛,終于兌現了。”
根據許云峰及團隊的規劃,他們將在原有課程《大數據應用技術》基礎上引入PaddlePaddle深度學習開源框架的相關理論與案例,形成“大數據+深度學習”的全新課程。在原有課時的基礎上新增22課時,從應用的角度融合了大數據和人工智能兩個學科的知識和相關案例。許云峰希望這門課程的落地,可以增強本科生在就業市場中的競爭力,增強研究生的科研能力。
目前,該課程報名人數已經突破300人,大二、大三學生及研究生尤為熱情。雖然涉及PaddlePaddle的課程到10月份才正式展開,但大部分學生已經將20多G的實驗系統安裝到自己的筆記本上,先做一輪“預習”。
河北科技大學向“人人都能學習、使用AI”的愿景邁出了第一步
研究生們在實驗室里討論方案
他將一個網盤鏈接發在群里,說:“關于我們搭建實驗室系統的資料,都在這兒了。平臺搭建工作告一段落,后續工作是做應用案例了。”他希望,借助他和團隊的分享和經驗,后續能有更多的高校搭建實驗平臺,幫助老師與學生更好地融入到中國高校人工智能隊伍中來,人人都能學習、使用AI。
1月20日晚,游族網絡發布2024年年度業績預告,報告顯示,2024年度預計營收13.8-14.6億...
1月18日,游族網絡2025年會“U-nite U-show——游秀之夜”在上海西岸穹頂藝術中心成功...
WeLab Bank匯立銀行近日宣布,于 2024 年 12 月實現首次盈虧平衡,這距離其成立僅有四...
投資家網(www.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。