91精品一二三,日韩欧美中文综合精品,欧美日韩在线观看视频一区,9视频在线观看18,久悠悠AV,91网站在线视频,男人的天堂亚洲易欲AV,久久狠狠地插女人,一区二区三区亚洲精品

新聞發(fā)布
立即打印
媒體聯(lián)絡(luò)
線女士
用友集團(tuán) xianbj@yonyou.com
從混沌數(shù)據(jù)到邏輯框架:LOM本體大模型如何自主構(gòu)建本體?
2026年4月17日

   

yonyou


企業(yè)擁有海量數(shù)據(jù),但數(shù)據(jù)不等于知識(shí)。ERP中的表、文檔中的規(guī)則、流程中的約束——都藏在“人腦”和“文本”中,無(wú)法被機(jī)器直接理解。沒(méi)有可計(jì)算的知識(shí),AI只能靠概率“猜測(cè)”,無(wú)法用邏輯“保證”。



 


LOM本體大模型的核心能力之一,是自主構(gòu)建企業(yè)業(yè)務(wù)的邏輯框架——從混沌數(shù)據(jù)中提煉出實(shí)體、關(guān)系、約束,形式化為可計(jì)算的本體。本文基于用友AI Lab全新發(fā)布的LOM本體大模型論文《Unifying Ontology Construction and Semantic Alignment for Deterministic Enterprise Reasoning at Scale》,深度解讀這一能力,揭示LOM本體大模型如何為企業(yè)AI規(guī)?;於ǖ谝粔K基石。


01

企業(yè)AI規(guī)?;目玻?/strong>

數(shù)據(jù)不等于知識(shí)


 


過(guò)去十年,企業(yè)完成了大規(guī)模的數(shù)字化遷移。ERP、CRM、SCM、HRM——各類業(yè)務(wù)系統(tǒng)積累了海量數(shù)據(jù)。然而,當(dāng)企業(yè)試圖用AI處理這些數(shù)據(jù)時(shí),一個(gè)根本問(wèn)題浮出水面:數(shù)據(jù)不等于知識(shí)。


一個(gè)典型的ERP系統(tǒng)可能包含數(shù)百?gòu)埍怼?shù)千個(gè)字段。字段名如“INV01”“CUST_TYPE”只是標(biāo)識(shí)符,其業(yè)務(wù)含義需要人工解讀;同一概念在不同系統(tǒng)中使用不同名稱;業(yè)務(wù)規(guī)則藏在操作手冊(cè)里,寫(xiě)在審批流程中,甚至存在業(yè)務(wù)專家的腦子里。


這種“數(shù)據(jù)豐富、知識(shí)貧乏”的困境,構(gòu)成了企業(yè)AI規(guī)?;瘧?yīng)用的第一道坎。沒(méi)有可計(jì)算的知識(shí)框架,AI只能基于統(tǒng)計(jì)相關(guān)性進(jìn)行“猜測(cè)”——這恰恰是概率模型的本質(zhì)局限。


論文開(kāi)篇即點(diǎn)明這一困境:“企業(yè)積累了海量數(shù)據(jù),但其中大部分仍然混亂且實(shí)際上處于休眠狀態(tài)?!比绾螁拘堰@些沉睡的數(shù)據(jù)?答案在于自主構(gòu)建。


02

 本體:

讓機(jī)器理解業(yè)務(wù)的“邏輯框架”


在人工智能領(lǐng)域,“本體”是一個(gè)基礎(chǔ)概念。簡(jiǎn)單來(lái)說(shuō),本體是對(duì)一個(gè)領(lǐng)域的概念化——它定義了:


實(shí)體:業(yè)務(wù)中有哪些事物(供應(yīng)商、物料、倉(cāng)庫(kù)、訂單)

關(guān)系:這些事物之間如何關(guān)聯(lián)(供應(yīng)商提供物料、物料存入倉(cāng)庫(kù))

約束:這些關(guān)系必須遵守什么規(guī)則(物料必須在保質(zhì)期內(nèi)、供應(yīng)商必須通過(guò)資質(zhì)審核)


我們可以把本體理解為企業(yè)的“業(yè)務(wù)物理定律”。正如牛頓定律描述了宇宙中物體的運(yùn)動(dòng)規(guī)律,本體描述了企業(yè)業(yè)務(wù)的運(yùn)行邏輯。有了這套“定律”,機(jī)器就不再是盲目地“猜”,而是有章可循地“推”。


論文將這一思想總結(jié)為:通過(guò)自主構(gòu)建本體,LOM本體大模型“創(chuàng)造了一個(gè)確定性的環(huán)境,其中邏輯不僅僅是概率性的,而是結(jié)構(gòu)性的、具有約束力的”。


03

自主構(gòu)建:

LOM如何從混沌數(shù)據(jù)中“提煉”邏輯框架


 


LOM本體大模型的自主構(gòu)建能力,體現(xiàn)在它能夠從

兩類原始數(shù)據(jù)中自動(dòng)抽取知識(shí):


從結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)隱式關(guān)系


企業(yè)數(shù)據(jù)庫(kù)中的表常常缺少明確的外鍵定義。

LOM本體大模型采用迭代框架,按外鍵約束順序遍歷表結(jié)構(gòu),結(jié)合RAG模塊獲取語(yǔ)義上下文,合成增量本體片段。經(jīng)過(guò)驗(yàn)證與優(yōu)化,最終將所有表、列及關(guān)系映射為邏輯自洽的全局本體。




從非結(jié)構(gòu)化文本中抽取實(shí)體與關(guān)系


企業(yè)的知識(shí)不僅存在于數(shù)據(jù)庫(kù)中,更大量沉淀在文檔里——操作手冊(cè)、合同條款、政策文件、會(huì)議紀(jì)要。


LOM本體大模型采用LLM驅(qū)動(dòng)的抽取管道:將文檔分塊處理,在低溫度設(shè)置下執(zhí)行實(shí)體-關(guān)系抽取,識(shí)別出業(yè)務(wù)實(shí)體及其屬性,以及實(shí)體之間的關(guān)聯(lián)類型(如“隸屬于”“關(guān)聯(lián)于”“屬于”)。


抽取出的實(shí)體往往存在指代不一的問(wèn)題——同一家供應(yīng)商可能被稱為“XX科技”“XX科技有限公司”“XX科技股份”。LOM本體大模型通過(guò)多層次匹配機(jī)制解決這一難題:


表面匹配(編輯距離、子串包含)

領(lǐng)域歸一化(標(biāo)準(zhǔn)化縮寫(xiě)與全稱)

  深度語(yǔ)義匹配(向量嵌入相似度)


最終,同一實(shí)體被合并為規(guī)范節(jié)點(diǎn),形成文本層本體。


跨源融合:統(tǒng)一的企業(yè)知識(shí)圖譜


結(jié)構(gòu)化本體與文本本體通過(guò)系統(tǒng)性流程深度融合:概念對(duì)齊識(shí)別等價(jià)類與屬性,沖突解決處理命名與層次矛盾,層次集成建立跨本體關(guān)系,最后通過(guò)驗(yàn)證確保邏輯一致性。


融合后的企業(yè)本體是一個(gè)統(tǒng)一的異構(gòu)圖,既包含關(guān)系數(shù)據(jù)庫(kù)的嚴(yán)謹(jǐn)結(jié)構(gòu),又承載非結(jié)構(gòu)化文檔的豐富語(yǔ)義。論文指出,這一過(guò)程“將原始數(shù)據(jù)中固有的概率噪聲坍縮為確定性的結(jié)構(gòu)表示”。


04

動(dòng)態(tài)演化:

邏輯框架不是靜態(tài)的,而是“活”的


企業(yè)的業(yè)務(wù)不是一成不變的。新供應(yīng)商入庫(kù),新政策發(fā)布,新約束生效——邏輯框架必須隨之演化。


傳統(tǒng)方法每次更新都需要重新構(gòu)建,成本高昂且滯后嚴(yán)重。LOM本體大模型則通過(guò)動(dòng)態(tài)更新機(jī)制,支持本體的實(shí)時(shí)演化。論文將這一機(jī)制描述為“讓圖結(jié)構(gòu)響應(yīng)實(shí)時(shí)數(shù)據(jù)流入而動(dòng)態(tài)適應(yīng)”。


具體而言,LOM本體大模型將企業(yè)環(huán)境概念化為一個(gè)稀疏圖,節(jié)點(diǎn)代表實(shí)體,邊代表關(guān)系。當(dāng)新數(shù)據(jù)流入,模型通過(guò)鏈接預(yù)測(cè)判斷是否需要更新圖狀態(tài)——是否存在新節(jié)點(diǎn)?新關(guān)系?舊關(guān)系是否失效?然后遞歸更新圖結(jié)構(gòu),保持與業(yè)務(wù)現(xiàn)實(shí)同步。


論文用公式描述了這一過(guò)程:G??? = Update(G?, ΔD?; θ_align)。這意味著,LOM的邏輯框架不是靜態(tài)的“知識(shí)庫(kù)”,而是動(dòng)態(tài)的“生命體”,持續(xù)與業(yè)務(wù)現(xiàn)實(shí)同頻共振。


05

邏輯框架如何服務(wù)于確定性推理


有了這個(gè)自主構(gòu)建的邏輯框架,LOM本體大模型的推理不再是概率性的“猜測(cè)”,而是確定性的“推導(dǎo)”。


在傳統(tǒng)的GraphRAG范式中,圖被用作檢索索引,幫助LLM定位相關(guān)文本,但最終推理仍由LLM的概率引擎完成。LOM本體大模型則完全不同——它將本體作為邏輯定律,在本體上直接執(zhí)行確定的圖算法(如最短路徑、最小生成樹(shù))或邏輯規(guī)則推理。


這正是7D邏輯自治的核心:結(jié)論不是“猜”出來(lái)的,而是由邏輯框架嚴(yán)格推導(dǎo)出來(lái)的。


這一轉(zhuǎn)變對(duì)企業(yè)決策具有根本意義。當(dāng)AI建議“更換供應(yīng)商A”時(shí),企業(yè)需要知道:這是基于什么規(guī)則?推導(dǎo)路徑是什么?是否可驗(yàn)證、可追溯?LOM本體大模型的邏輯框架提供了所有這些答案。


論文的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了這一路徑的有效性:在鏈接預(yù)測(cè)任務(wù)(本體構(gòu)建的核心)上,LOM-4B達(dá)到88.8%準(zhǔn)確率。這證明LOM能夠從真實(shí)企業(yè)的噪聲數(shù)據(jù)中,準(zhǔn)確地構(gòu)建出可計(jì)算的邏輯框架。


從混沌數(shù)據(jù)到邏輯框架,LOM本體大模型的本體自主構(gòu)建能力完成了企業(yè)AI規(guī)模化的關(guān)鍵一躍。它解決了“數(shù)據(jù)不等于知識(shí)”的根本困境,將企業(yè)散落的隱性知識(shí)轉(zhuǎn)化為可計(jì)算的邏輯體系。


這個(gè)自主構(gòu)建并持續(xù)演化的邏輯框架,正是后續(xù)語(yǔ)義對(duì)齊和確定性推理賴以實(shí)現(xiàn)的基石。沒(méi)有它,AI只能“猜”;有了它,AI才能“推”。讓AI獲得“理解”業(yè)務(wù)世界邏輯的能力,是超越概率猜測(cè)、實(shí)現(xiàn)企業(yè)級(jí)確定性智能的必經(jīng)之路。


LOM本體大模型論文地址,免費(fèi)下載:

https://chinaxiv.org/abs/202603.00072


 


掃描上方二維碼

獲取本體大模型資料

更有機(jī)會(huì)參加企業(yè)AI訓(xùn)練營(yíng)


   

石河子市| 大兴区| 岳普湖县| 涡阳县| 钟山县| 电白县| 湘西| 青冈县| 江山市| 柞水县| 临朐县| 达州市| 鹿泉市| 长顺县| 东乌| 甘谷县| 昌吉市| 辰溪县| 宜春市| 鸡西市| 鄂伦春自治旗| 万载县| 东乡族自治县| 集安市| 海口市| 股票| 临湘市| 淮北市| 南京市| 南丰县| 江油市| 比如县| 康马县| 墨江| 张家川| 泸州市| 运城市| 宝丰县| 金华市| 湘阴县| 安达市| ·