百度:國內首個大模型數據標注基地落地海口,標注師本科率達 100%
(資料圖片)
IT之家 8 月 29 日消息,百度官方公眾號近日宣布,位于海口市秀英區的百度智能云(海口)人工智能基礎數據產業基地正式啟動運營,這是百度智能云與海口市政府合作共建的國內首個大模型數據標注中心,未來會為各行各業提供大模型數據服務。
據介紹,當前,大模型正處在產業落地前期,高質量的數據,是大模型實現產業化的關鍵要素。對于以 ChatGPT、文心一言為代表的生成式 AI,海量的數據訓練、人工標注、指令微調、基于人類反饋的強化學習(RLHF),可以讓大模型與人類價值觀、思維方式不斷對齊,使大模型更加可用。
為此,百度智能云升級了大模型數據服務能力,建設了國內首個專業大模型數據標注基地。百度智能云方面表示,目前已經在全國與各地政府合作,共建了十多個數據標注基地,累計為當地提供超過 1.1 萬個穩定就業崗位,間接帶動 5 萬人就業。
IT之家注意到,百度官方稱,為保障數據標注質量,百度智能云還搭建了全流程數據服務人才梯隊。海口數據標注基地現擁有數百名專職大模型數據標注師,標注師的本科率達到 100%。
“和傳統的數據標注師要求不同,大模型標注師都需要本科以上學歷,我覺得主要是因為大模型數據涉及的知識面很廣,評判標準復雜,非常考驗標注師的語言理解能力和邏輯推理能力。在入職的前兩個月,公司會對我們進行集體培訓和考核,通過考核后才能正式上崗。”百度智能云大模型數據標注師王潔玉說。
百度官方表示,海口基地在未來三到五年,新增就業有望突破 5000 人規模。此外,建成海口數據標注基地,只是海口市和百度合作的開端,后續還要共同打造數字經濟產業集群,將海口市秀英區的數字經濟規模、數字經濟層級帶來更高的提升。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。
標簽: