(視覺中國/圖)
2024年歲末,東方大模DeepSeek-V3大模型發(fā)布,神秘迅速成為全球人工智能(AI)領域的力量焦點,刷屏科技圈,爆火很多人化身“自來水”,國產在各大社交媒體、型背科技論壇上發(fā)帖討論,年輕不吝溢美之詞。東方大模
在全球范圍內的神秘行業(yè)基準測試中,DeepSeek-V3達到與Llama 3(開源大模型標桿,力量由扎克伯格的爆火Meta公司開發(fā))、GPT-4o(OpenAI大模型)相當?shù)膰a水平,闖入了多個AI大模型排行榜單前列。型背聊天機器人競技場(Chatbot Arena)最新數(shù)據(jù)顯示,年輕DeepSeek-V3位列開源模型榜第一,東方大模在全模型榜單里排名第七,也是中國模型中排名最高的。更令人詫異的是,DeepSeek-V3模型訓練所消耗的算力,只有Llama的1/11。
DeepSeek-V3轟動AI圈,背后的中國公司深度求索(DeepSeek)也“浮出水面”。硅谷同行稱其為“東方神秘力量”,對DeepSeek團隊表現(xiàn)出濃厚的興趣。而在國內,“雷軍千萬年薪挖角DeepSeek研究員羅福莉”的話題也上了社交平臺熱搜。
不管是AI圈,還是“吃瓜群眾”,都在好奇,DeepSeek-V3大模型的背后,到底是一支什么樣的團隊?
羅福莉(羅福莉個人公眾號/圖)
2024年12月底,有媒體報道,雷軍以千萬年薪招攬一名“天才AI少女”來領導小米的AI大模型團隊。這位95后“少女”名叫羅福莉,過去兩年供職于DeepSeek團隊,曾參與DeepSeek大模型的關鍵研發(fā)。
羅福莉在北京大學讀計算語言學碩士期間,曾因在ACL(國際計算語言學協(xié)會)學術會議上發(fā)表多篇論文而受到關注。畢業(yè)后,她進入阿里巴巴達摩院,從事預訓練語言模型相關的工作。2022年加入深度求索母公司幻方量化,之后成為DeepSeek大模型項目成員。
DeepSeek-v3的出現(xiàn),讓很多人以為,DeepSeek團隊必然有“大?!弊?zhèn)。但羅福莉走紅卻讓外界發(fā)現(xiàn),真正的“大?!笔悄切┫袼粯拥哪贻p人。
2023年5月,DeepSeek-V2發(fā)布,相比于國內外主流大模型,大幅減少了計算量和推理顯存,一問世就備受關注。做出這一突破性創(chuàng)新的,是年輕的高華佐和曾旺丁等人。
兩人都剛從學校出來沒幾年。高華佐來自廣東,2012年在華南師范大學附屬中學就讀時,曾獲第29屆全國中學生物理競賽一等獎,并于次年保送至北京大學物理學
十四屆全國人大三次會議將于3月5日上午9時舉行開幕會
最嚴非銀支付新規(guī)落地倒計時,過半機構未達新標準
北京航空航天大學原副校長張廣被決定逮捕
檢察機關依法對劉連舸涉嫌受賄、違法發(fā)放貸款案提起公訴
百度就“謝廣軍女兒開盒”事件發(fā)布聲明
三部門累計向皖鄂貴調撥6萬件救災物資
copyright © 2016 powered by 上海昊昌機電設備有限公司 sitemap