(視覺中國/圖)
2024年歲末,東方大模DeepSeek-V3大模型發(fā)布,神秘迅速成為全球人工智能(AI)領(lǐng)域的力量焦點(diǎn),刷屏科技圈,爆火很多人化身“自來水”,國產(chǎn)在各大社交媒體、型背科技論壇上發(fā)帖討論,年輕不吝溢美之詞。東方大模
在全球范圍內(nèi)的神秘行業(yè)基準(zhǔn)測試中,DeepSeek-V3達(dá)到與Llama 3(開源大模型標(biāo)桿,力量由扎克伯格的爆火Meta公司開發(fā))、GPT-4o(OpenAI大模型)相當(dāng)?shù)膰a(chǎn)水平,闖入了多個AI大模型排行榜單前列。型背聊天機(jī)器人競技場(Chatbot Arena)最新數(shù)據(jù)顯示,年輕DeepSeek-V3位列開源模型榜第一,東方大模在全模型榜單里排名第七,也是中國模型中排名最高的。更令人詫異的是,DeepSeek-V3模型訓(xùn)練所消耗的算力,只有Llama的1/11。
DeepSeek-V3轟動AI圈,背后的中國公司深度求索(DeepSeek)也“浮出水面”。硅谷同行稱其為“東方神秘力量”,對DeepSeek團(tuán)隊(duì)表現(xiàn)出濃厚的興趣。而在國內(nèi),“雷軍千萬年薪挖角DeepSeek研究員羅福莉”的話題也上了社交平臺熱搜。
不管是AI圈,還是“吃瓜群眾”,都在好奇,DeepSeek-V3大模型的背后,到底是一支什么樣的團(tuán)隊(duì)?
羅福莉(羅福莉個人公眾號/圖)
2024年12月底,有媒體報(bào)道,雷軍以千萬年薪招攬一名“天才AI少女”來領(lǐng)導(dǎo)小米的AI大模型團(tuán)隊(duì)。這位95后“少女”名叫羅福莉,過去兩年供職于DeepSeek團(tuán)隊(duì),曾參與DeepSeek大模型的關(guān)鍵研發(fā)。
羅福莉在北京大學(xué)讀計(jì)算語言學(xué)碩士期間,曾因在ACL(國際計(jì)算語言學(xué)協(xié)會)學(xué)術(shù)會議上發(fā)表多篇論文而受到關(guān)注。畢業(yè)后,她進(jìn)入阿里巴巴達(dá)摩院,從事預(yù)訓(xùn)練語言模型相關(guān)的工作。2022年加入深度求索母公司幻方量化,之后成為DeepSeek大模型項(xiàng)目成員。
DeepSeek-v3的出現(xiàn),讓很多人以為,DeepSeek團(tuán)隊(duì)必然有“大牛”坐鎮(zhèn)。但羅福莉走紅卻讓外界發(fā)現(xiàn),真正的“大牛”是那些像她一樣的年輕人。
2023年5月,DeepSeek-V2發(fā)布,相比于國內(nèi)外主流大模型,大幅減少了計(jì)算量和推理顯存,一問世就備受關(guān)注。做出這一突破性創(chuàng)新的,是年輕的高華佐和曾旺丁等人。
兩人都剛從學(xué)校出來沒幾年。高華佐來自廣東,2012年在華南師范大學(xué)附屬中學(xué)就讀時(shí),曾獲第29屆全國中學(xué)生物理競賽一等獎,并于次年保送至北京大學(xué)物理學(xué)
要求材料阻燃,強(qiáng)化電池安全,電動自行車新國標(biāo)九月實(shí)施
汛期供水保衛(wèi)戰(zhàn):“這次旱災(zāi)給了我們一個教訓(xùn)”
在太空“從北京朝天津投籃”丨我這十年
科創(chuàng)板做市交易制度“呼之欲出”
從釣魚臺到博鰲:“頂流”DeepSeek改變世界的看法
國家衛(wèi)健委:昨日新增本土“427+1662”例
copyright © 2016 powered by 上海昊昌機(jī)電設(shè)備有限公司 sitemap