摘要:Cypher-RI框架通過強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的結(jié)構(gòu)感知推理,將自然語言到圖查詢的準(zhǔn)確率提升至新高度,為企業(yè)級(jí)圖智能應(yīng)用奠定關(guān)鍵技術(shù)基礎(chǔ)。
在人工智能基礎(chǔ)設(shè)施層研究持續(xù)高速演進(jìn)的2025年,圖數(shù)據(jù)智能查詢領(lǐng)域迎來里程碑式突破。創(chuàng)鄰科技攜手浙江大學(xué)聯(lián)合研發(fā)Cypher-RI大模型訓(xùn)練框架被全球人工智能領(lǐng)域最具影響力的頂級(jí)會(huì)議 NeurIPS 2025正式收錄,該成果首次實(shí)現(xiàn)了基于強(qiáng)化學(xué)習(xí)的圖模式感知(Schema-Aware)自然語言轉(zhuǎn)Cypher查詢生成,通過強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)端到端自動(dòng)優(yōu)化,在Cypher查詢生成任務(wù)上取得突破性表現(xiàn),在權(quán)威基準(zhǔn)CypherBench上以7B參數(shù)規(guī)模模型達(dá)到69%的執(zhí)行準(zhǔn)確率,超越GPT-4o 9.41個(gè)百分點(diǎn),標(biāo)志著圖數(shù)據(jù)庫智能查詢進(jìn)入“結(jié)構(gòu)感知”新階段。
企業(yè)復(fù)雜關(guān)系分析場(chǎng)景面臨的長期挑戰(zhàn)
隨著數(shù)字化轉(zhuǎn)型的深入,企業(yè)數(shù)據(jù)規(guī)模爆炸式增長,復(fù)雜關(guān)系數(shù)據(jù)的價(jià)值挖掘愈發(fā)依賴圖數(shù)據(jù)庫。無論是金融反洗錢鏈路、社交網(wǎng)絡(luò)的關(guān)系傳播,還是生物信息中的蛋白質(zhì)交互,都天然呈現(xiàn)為圖結(jié)構(gòu)。圖數(shù)據(jù)庫成為洞察復(fù)雜關(guān)系的關(guān)鍵技術(shù)。
然而,關(guān)系數(shù)據(jù)的價(jià)值能否被真正釋放,往往取決于用戶是否能夠?qū)懗稣_、高效的圖查詢語句。以Cypher為代表的圖查詢語言雖然表達(dá)能力強(qiáng)大,但需要用戶深度理解圖模式(Schema)結(jié)構(gòu)、熟練掌握復(fù)雜語法規(guī)則,且具備精準(zhǔn)的 “圖思維”——這使得普通業(yè)務(wù)人員難以直接操作,而依賴模板匹配、示例學(xué)習(xí)的傳統(tǒng)查詢生成技術(shù),在面對(duì)多類型點(diǎn)邊、復(fù)雜邏輯查詢、跨場(chǎng)景泛化等企業(yè)真實(shí)業(yè)務(wù)場(chǎng)景時(shí),普遍存在 “結(jié)構(gòu)理解偏差”、“生成語句不可執(zhí)行”、“結(jié)果準(zhǔn)確率低” 等問題,導(dǎo)致圖數(shù)據(jù)庫的強(qiáng)大能力難以轉(zhuǎn)化為實(shí)際業(yè)務(wù)價(jià)值,成為企業(yè)數(shù)字化轉(zhuǎn)型的 “隱形壁壘”。
CypherRI 突破何在:圖結(jié)構(gòu)理解與強(qiáng)化學(xué)習(xí)協(xié)同優(yōu)化
為破解上述行業(yè)痛點(diǎn),創(chuàng)鄰科技聯(lián)合浙江大學(xué)突破性地提出 “圖模式感知 + 強(qiáng)化學(xué)習(xí)” 雙核心架構(gòu),構(gòu)建了全球首個(gè)能夠主動(dòng)解析圖結(jié)構(gòu)、閉環(huán)優(yōu)化查詢生成的大模型訓(xùn)練框架Cypher-RI。該框架的核心創(chuàng)新在于實(shí)現(xiàn)了圖模式感知與生成過程的深度融合。與傳統(tǒng)僅依賴文本匹配的生成方式不同,CypherRI在理解自然語言問題的同時(shí),能夠動(dòng)態(tài)感知并主動(dòng)篩選與問題真正相關(guān)的圖結(jié)構(gòu)信息,確保生成的Cypher語句在語法正確、結(jié)構(gòu)可執(zhí)行的基礎(chǔ)上,精準(zhǔn)對(duì)應(yīng)業(yè)務(wù)意圖。
研究團(tuán)隊(duì)創(chuàng)新性地引入強(qiáng)化學(xué)習(xí)框架,以查詢可執(zhí)行性與結(jié)果準(zhǔn)確性作為獎(jiǎng)勵(lì)信號(hào),推動(dòng)模型在訓(xùn)練中自主優(yōu)化推理路徑。這使得模型不僅能“模仿”已有查詢樣本,更學(xué)會(huì):
辨識(shí)與問題相關(guān)的點(diǎn)邊類型與屬性
基于圖語義進(jìn)行多步邏輯推理
生成健壯且可穩(wěn)定執(zhí)行的Cypher查詢語句
該方法從機(jī)制上解決了生成查詢與圖結(jié)構(gòu)脫節(jié)的關(guān)鍵痛點(diǎn),大幅提升跨場(chǎng)景適用性與可靠性。
以小搏大:7B模型超越GPT-4o,樹立企業(yè)級(jí)部署新標(biāo)桿
在權(quán)威評(píng)測(cè)基準(zhǔn) CypherBench 上,基于7B參數(shù)模型訓(xùn)練的Cypher-RI的表現(xiàn)顯著超越所有已公開模型,并以9.41個(gè)百分點(diǎn)的優(yōu)勢(shì)領(lǐng)先GPT-4o,刷新該任務(wù)SOTA(State-of-the-Art)記錄。
這一研究不僅從實(shí)踐上驗(yàn)證了:只要配合合適的強(qiáng)化學(xué)習(xí)框架,小參數(shù)模型同樣能夠在高度專業(yè)的任務(wù)上取得世界級(jí)性能,更凸顯了其對(duì)企業(yè)客戶的多重價(jià)值:
成本可控:占用資源少、部署成本低,可私有化部署,避免云端大模型的高額API成本和數(shù)據(jù)安全風(fēng)險(xiǎn)
高效可靠:響應(yīng)速度快,支持高并發(fā)查詢,更好滿足企業(yè)實(shí)時(shí)分析與交互需求
優(yōu)化深度:訓(xùn)練成本低,可針對(duì)企業(yè)專屬數(shù)據(jù)進(jìn)行持續(xù)訓(xùn)練與優(yōu)化,實(shí)現(xiàn)“專用化智能”
行業(yè)意義:定義圖技術(shù)與大模型融合的新范式
CypherRI 的推出讓業(yè)務(wù)人員能夠通過自然語言直接、準(zhǔn)確地操作圖數(shù)據(jù),大幅降低分析門檻、是圖技術(shù)邁向“平民化”與“智能化”的關(guān)鍵一步。它不僅是查詢生成任務(wù)的SOTA,更揭示了大模型在結(jié)構(gòu)化數(shù)據(jù)交互中的演進(jìn)方向:從“萬能語言接口”走向“認(rèn)知增強(qiáng)專用智能體”。其強(qiáng)化學(xué)習(xí)架構(gòu)與模式感知設(shè)計(jì)為GraphRAG、圖增強(qiáng)推理、企業(yè)知識(shí)圖譜問答等下游應(yīng)用提供了可復(fù)用的技術(shù)內(nèi)核,推動(dòng)圖技術(shù)從單一分析場(chǎng)景邁向體系化、工程化、可規(guī)?;钠髽I(yè)級(jí)AI基礎(chǔ)設(shè)施。
創(chuàng)鄰科技將持續(xù)深化“圖技術(shù)+大模型”的協(xié)同技術(shù)路線,聯(lián)合學(xué)術(shù)界與產(chǎn)業(yè)伙伴,拓展自動(dòng)化圖分析、時(shí)序圖預(yù)測(cè)、跨模態(tài)圖理解等前沿方向,構(gòu)建可信、可控、可持續(xù)演進(jìn)的數(shù)據(jù)智能新底座,賦能企業(yè)在新一輪AI變革中建立結(jié)構(gòu)性競(jìng)爭(zhēng)優(yōu)勢(shì)。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: