清華大學計算機系副教授劉知遠小學時寫應用題,面壁們老會卡殼。智能知遠他總會過度思考,創始從一個題目里讀出多重含義。人劉到了高中,該把個工寫英語閱讀理解時,看作這種感受更強烈了。面壁們
劉知遠從未懷疑過出題人,智能知遠反而懷疑是創始不是自己太笨了,“理解不了題目”。人劉多年后深入學習語言哲學之后,該把個工他才漸漸意識到這其實是看作種天賦,“我就比較善于抓住語言里面那個不確定的面壁們地方”。
自然語言處理的智能知遠本質就是消除這種不確定,讓機器能夠精確無誤地理解人類的創始語言。劉知遠前半生正是與這種不確定性纏斗的二十年。
特別是過去兩年,搭上ChatGPT的便車,自然語言處理坐上了時光機,“從2023年到2024年所經歷的這些新事情,比過去20年經歷的總和還要多得多”。
回望中國大模型史,年屆四十的劉知遠是個繞不過去的人物。他參與締造中國第一個大模型,又躬身參與了這一輪大模型創業。2022年8月,在ChatGPT發布的三個月前,劉知遠發起成立了一家大模型公司——面壁智能。
這家公司最為出圈的一件事是,2023年6月3日,斯坦福大學一個學生團隊發布的一個模型被發現是抄襲了面壁智能的模型。
面壁智能的辦公室位于北京中關村東路1號院6號樓3 層,辦公室的白墻上隨處可見那句《三體》的經典臺詞,“這是面壁計劃的一部分”。
圖片由農健使用AI工具生成
1984年,劉知遠出生在山東泰安新泰市一個普通工薪家庭,小學偶爾逃課去游戲廳玩,家里也沒期待過他能上清華。他父親在郵電局上班,還建議放棄初中直接讀中專,方便以后接他的班。
沒想到十幾年后,劉知遠以山東省前三十名的成績,如愿進入清華大學。
當時正是互聯網泡沫破滅之時,最熱門的方向是建筑和生物醫學,計算機專業并不是高分專業。劉知遠報了建筑、生物工程和電子系,招生組反饋這些專業的名額已經被分數更高的同學占了,無奈選了計算機專業,“算是一個機緣巧合吧”。
讀博時也是如此,報考生物信息學方向也是招滿了,他陰差陽錯進入了自然語言實驗室,“我覺得非常幸運,因為五年之后生物信息學的導師自己都放棄了這個方向。”自然語言處理正好開始了高歌猛進的二十年。
劉知遠清楚記得,讀博期間,實驗室有個大師兄做文本分類,“給你一篇文章,看能不能把它分到相關的類別里面,比如這篇新聞是社會新聞,還是國際新聞、軍事新聞,或是別的新聞?”他的博士論文就是關鍵詞提取,“通過統計的方法識別出文檔到底哪個詞,能代表文章主題的關鍵詞。”
2012年成為一個分水嶺,深度學習在大洋彼岸叩響了發令槍。當年10月,Geoffrey Hinton和他的兩名學生——Alex Krizhevskyr,以及ChatGPT 的靈魂人物 Ilya Sutskeve,獲得ImageNet圖像識別比賽的冠軍,并且發表論文介紹了第一個深度卷積神經網絡模型AlexNet。ImageNet是斯坦福大學教授李飛飛創辦的人工智能領域一個重要賽事,通過對機器算法識別圖像,從而促進最先進算法的開發。
在處理圖像識別、語音識別方面,深度學習的能力得到了廣泛認可。在老師孫茂松的帶領下,劉知遠花了兩個月尋找答案。可自然語言處理方向的大多數人的意見是,深度學習不能幫助自然語言處理。
最終劉知遠得出一個結論:基于統計學習用符號去表示語言知識的這種傳統路線,已經沒有太多突破的可能,深度學習是個非常值得探索的新技術路線。正是基于這樣的判斷,“我們實驗室應該是國內最早擁抱深度學習的團隊”。
2017
2025-04-17 00:24
2025-04-17 00:23
2025-04-16 23:58
2025-04-16 23:44
2025-04-16 23:38
2025-04-16 22:42