開年,DeepSeek論文火遍全網(wǎng),內(nèi)容聚焦大模型記憶。
無獨有偶,谷歌近期也發(fā)布了一篇被譽為“Attention is all you need”V2(Nested Learning: The Illusion of Deep Learning Architectures)的重磅論文,核心同樣指向記憶瓶頸。
就連最近這只徹底破圈的AI大龍蝦——OpenClaw(原名Clawdbot),其亮點之一依舊是記憶。
也就是說,記憶≈今年全球AI圈集體押注的技術(shù)風(fēng)口≈皇冠明珠。
幾乎所有你能想到的大模型團隊,都在加班加點往自家模型里塞記憶功能……
但這一次,讓我們把視線從這些科技巨頭身上稍稍挪開,就會發(fā)現(xiàn)有一支后起之秀同樣不容小覷。
他們就是陳天橋和鄧亞峰帶隊的EverMind最新發(fā)布世界級長期記憶系統(tǒng)——EverMemOS,發(fā)布即SOTA。
一舉打破多項記憶基準(zhǔn)測試的同時,還能遠超此前所有的基線方法。
![]()
其次,它是真正能用的。
不是只會跑測試的“花架子”,實際部署后效果照樣能打。而且團隊有底氣有信心,技術(shù)代碼全部開源。
為了方便開發(fā)者使用,他們剛剛還專門上線了云服務(wù)——現(xiàn)在只需一個最簡單的API,就能直接將最前沿的大模型記憶能力裝進自己的應(yīng)用。
并且要知道,從EverMemOS正式立項到開源,團隊只用了短短四個月時間,這是什么實力不必多說。
學(xué)習(xí)大腦記憶機制,成了。
啟發(fā)于腦科學(xué)技術(shù)的研究成果,盛大一直以來非常重視長期記憶領(lǐng)域的研究。早在2024年10月,盛大團隊就對外發(fā)布了長期記憶領(lǐng)域的綱領(lǐng)性文章《Long Term Memory-The Foundation of AI Self-Evolution》。
基于盛大多個團隊在該領(lǐng)域的持續(xù)積累,EverMind在2025年8月正式啟動EverMemOS項目,并于11月對外正式發(fā)布開源版本。
EverMemOS是EverMind打造的首款A(yù)I記憶基礎(chǔ)設(shè)施,對比同賽道團隊,似乎姍姍來遲。
Mem0、Zep等產(chǎn)品最早都能追溯到2024年,現(xiàn)在商業(yè)化最成功的開發(fā)者框架Letta(原MemGPT)也是2023年就開始起步。
EverMemOS卻交出了亮眼的答卷:最晚入場,但效果彎道超車。
從技術(shù)角度看,它同時繼承了基于外部存儲和基于隱狀態(tài)兩種路徑。不過業(yè)內(nèi)并非沒有嘗試過此類方案,但EverMind顯然在記憶提取的精準(zhǔn)度和邏輯一致性上實現(xiàn)了更優(yōu)的平衡。
原因在于EverMind抓住了精髓,用鄧亞峰的話說,就是:
通過EverMemOS,我們賦予智能體一個活的、不斷演化的歷史。
這里的關(guān)鍵詞其實是“活的”。那么如何能保存最鮮活的記憶呢?人類大腦。
這就引出了EverMind的獨特思路——生物啟發(fā)。
![]()
具體來講,EverMemOS通過模擬人類記憶的形成并轉(zhuǎn)化為計算框架,利用三階段層層遞進以實現(xiàn)大模型長期記憶的存儲和提?。?/p>
Step 1:情景軌跡構(gòu)建。
對應(yīng)人腦的海馬體和內(nèi)嗅皮層,可以將連續(xù)的對話內(nèi)容拆分成一個個獨立的記憶單元(MemCell),每個單元里不僅記錄有完整的聊天內(nèi)容,還包括一些關(guān)鍵事實、時效信息等。
Step 2:語義整合。
類比新皮層(前額葉皮層+顳葉皮層),系統(tǒng)會將內(nèi)容相關(guān)的記憶單元歸類在一起,形成主題化的記憶場景(MemScene),同時還會更新用戶畫像,區(qū)分用戶的長期穩(wěn)定偏好和短期臨時狀態(tài)。
Step 3:重構(gòu)式回憶。
這一步對應(yīng)的是前額葉皮層和海馬體的協(xié)同機制,當(dāng)用戶提問時,系統(tǒng)就會在記憶場景的引導(dǎo)下進行智能檢索,只挑選出必要且足夠的記憶內(nèi)容,用于后續(xù)的推理任務(wù)。
由此,AI學(xué)會像人類一樣記憶——這不僅是知識的數(shù)據(jù)庫存儲,更是認知系統(tǒng)的深度整合。如此一來,即便是在多個Agent之間,也能實現(xiàn)信息的高效傳遞。
![]()
至于效果如何,咱們還是眼見為實,看看基準(zhǔn)測試結(jié)果。
團隊選取了4個主流記憶基準(zhǔn)測試,以及多種大模型記憶增強方法。所有方法都基于同一基礎(chǔ)大模型(GPT-4o-mini或GPT-4.1-mini)進行測試。
結(jié)果也很明顯,EverMemOS大獲全勝,全面超越現(xiàn)有記憶系統(tǒng)和全上下文模型。
![]()
其中在LoCoMo上,準(zhǔn)確率直接一躍來到93.05%,尤其是在多跳推理和時序任務(wù)上表現(xiàn)突出,分別提升19.7%和16.1%,同時token使用量和計算成本得到大幅度降低。
在多會話對話評估LongMemEval里,EverMemOS同樣以83%的準(zhǔn)確率位居榜首,說明在面對跨度極大、信息量極高的場景中,EverMemOS依舊能夠精準(zhǔn)檢索和關(guān)聯(lián)到過去的信息,并且通過持續(xù)交流還會不斷進化完善自己。
HaluMem由MemTensor和中國電信研究院聯(lián)合發(fā)布,是業(yè)界首個面向AI記憶系統(tǒng)的操作級幻覺評估基準(zhǔn)。而EverMemOS在保證記憶完整性的同時,也顯著改善了幻覺現(xiàn)象。
在PersonaMem v2里,EverMemOS在九個復(fù)雜場景中依舊全場最佳,保證了深度個性化和行為一致性。
![]()
足以見得,EverMemOS是相當(dāng)全能的一枚選手,記性好、搜得準(zhǔn),關(guān)鍵還運行速度快、成本還夠低,最長可突破百兆上下文限制。
一邊幫大模型減負,一邊幫大模型補記憶力,堪稱大模型版安神補腦液。
連接智能的關(guān)鍵在記憶
那么最后,我們再來看看EverMind究竟意欲何為?畢竟又是發(fā)新技術(shù)、新平臺,又是辦比賽,這一套組合拳下來,野心可不小。
首先從供給側(cè)講,EverMind正在試圖用EverMemOS重新定義大模型記憶的技術(shù)路線。
EverMemOS沒有沿著原來已有的技術(shù)方案延展,而是實打?qū)嵉孛鞒隽艘粭l以腦科學(xué)+AI的獨特路徑,而且它的技術(shù)成熟度出乎意料地扎實,說明EverMemOS還只是EverMind布局的冰山一角。
事實上,據(jù)EverMind透露,他們已經(jīng)開始構(gòu)造一整套的混合解決方案,其中底層是信息處理模塊,上層則是在強化學(xué)習(xí)的驅(qū)動下,通過調(diào)用模型參數(shù)來實現(xiàn)對信息的使用。
當(dāng)初做EverMemOS的時候,直接挑戰(zhàn)最難的多對多協(xié)作場景,而非基礎(chǔ)的1v1人機對話場景,就是因為他們把目光放在了更長遠的標(biāo)準(zhǔn)重塑上。
![]()
其次從需求側(cè)講,舉辦比賽一方面是為了擴大團隊的影響力,將技術(shù)推廣出去,讓行業(yè)得以復(fù)用,另一方面也是為了通過秀肌肉吸納更多相關(guān)領(lǐng)域人才,然后反哺EverMind的全鏈路技術(shù)研發(fā)。
這一點,從賽道設(shè)計中便可看出。三個賽道依次代表應(yīng)用層、中間層、基礎(chǔ)設(shè)施,覆蓋到了用戶所有的開發(fā)環(huán)節(jié),凸顯出EverMind對可循環(huán)應(yīng)用生態(tài)的核心考量。
其實EverMind從一開始就定位明確。它并不滿足于成為一個RAG工具或向量數(shù)據(jù)庫,而是志在于做通向下一代人工智能的基礎(chǔ)設(shè)施,即長期記憶系統(tǒng)(Long Term Memory OS),賦予AI個性化、主動性,以及通過持續(xù)學(xué)習(xí)(Continual Learning)自我演化(Self Evolving)的能力。
EverMind希望能夠成為大模型記憶的書寫者,去親自定義記憶是如何被創(chuàng)建、組織、檢索和演化的。
![]()
而往更大的視角看,EverMind的野心也折射出了一個行業(yè)共識——
智能來到比拼長期記憶的下半場。
人類智能主要由因果推理和長期記憶能力構(gòu)成,如果說OpenAI-o1、DeepSeek-R1為AI帶來了推理能力,那么長期記憶必然是下一代AI應(yīng)該擁有的核心能力。
它將突破大模型的上下文局限,幫助Agent具備個性化特性,并持續(xù)進化出深層次的長期認知,這都是下一代AI必須有的特性。在模型能力日益同質(zhì)化的背景下,哪家Agent能率先搭載高性能記憶系統(tǒng),就意味著哪家能夠真正拉開差距,擁有留住用戶的護城河。
當(dāng)然要實現(xiàn)這一點,不可能只靠一個團隊單打獨斗,而需要一整個生態(tài)協(xié)同發(fā)展,那么誰能成為這個生態(tài)的締造者,就顯得格外重要。
從某種程度講,這恰恰是盛大的舒適區(qū)。
在互聯(lián)網(wǎng)時代,盛大就靠著平臺生態(tài)證明了自己的能力邊界,而在如今新一輪AI時代里,盛大依舊能將過去的戰(zhàn)略經(jīng)驗遷移過來,只是這一次它選擇的是記憶。
所以毋庸置疑,由盛大孵化的EverMind將成為這個領(lǐng)域里不可忽視的一抹力量,它的野心與實力堪配。
此行必然不易,但我們或許已然可以期待,在不久后的將來,有更多如同EverMind的探路者攜手共進,來真正揭開AI長期記憶迷宮的一角。
免責(zé)聲明:市場有風(fēng)險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: