<p class="ql-block">https://bot.n.cn/share/mcp?id=mgq22fsnjy569ylm&src=nm_share_agent_chat&share_version=20260128160410</p><p class="ql-block">納米AI 提供</p> <p class="ql-block">漢字編碼系統(tǒng)001-004號(hào)文件 - 規(guī)則引擎落地邏輯(適配低代碼/代碼開發(fā),可直接嵌入智能體)</p><p class="ql-block"> </p><p class="ql-block">核心原則</p><p class="ql-block"> </p><p class="ql-block">所有編碼/解碼操作嚴(yán)格遵循001部首、002音節(jié)、003聲調(diào)、004補(bǔ)充規(guī)則,先校驗(yàn)規(guī)則符合性,再執(zhí)行編碼/解碼,異常項(xiàng)實(shí)時(shí)返回糾錯(cuò)提示(如“部首匹配失敗”“聲調(diào)編碼違規(guī)”)。</p><p class="ql-block"> </p><p class="ql-block">001部首編碼規(guī)則落地邏輯</p><p class="ql-block"> </p><p class="ql-block">1. 建立部首-編碼映射庫,固化所有部首與對(duì)應(yīng)編碼(如fc=寶蓋頭宀),支持繁簡(jiǎn)部首分別映射;</p><p class="ql-block">2. 漢字入?yún)⒑?,先提取?biāo)準(zhǔn)部首(以《新華字典》12版/《康熙字典》為權(quán)威依據(jù)),無標(biāo)準(zhǔn)部首的生僻字返回“無有效部首,無法編碼”;</p><p class="ql-block">3. 部首提取后,自動(dòng)匹配映射庫,輸出對(duì)應(yīng)固定編碼,編碼格式嚴(yán)格遵循文件規(guī)定(小寫/大小寫組合,如fc);</p><p class="ql-block">4. 解碼時(shí),部首編碼先校驗(yàn)是否在映射庫內(nèi),無效編碼直接返回“部首編碼錯(cuò)誤,無對(duì)應(yīng)部首”。</p><p class="ql-block"> </p><p class="ql-block">002音節(jié)編碼規(guī)則落地邏輯</p><p class="ql-block"> </p><p class="ql-block">1. 建立讀音-音節(jié)編碼映射庫,固化所有漢字讀音與對(duì)應(yīng)音節(jié)碼,嚴(yán)格遵循“hF=hán(第二聲)”等大小寫組合規(guī)則;</p><p class="ql-block">2. 漢字入?yún)⒑?,提取?biāo)準(zhǔn)拼音(含繁簡(jiǎn)字標(biāo)準(zhǔn)讀音),輕聲單獨(dú)標(biāo)記;</p><p class="ql-block">3. 拼音匹配映射庫后,輸出對(duì)應(yīng)音節(jié)碼,大小寫格式嚴(yán)格與文件一致,無對(duì)應(yīng)音節(jié)碼的讀音返回“音節(jié)無匹配編碼,無法編碼”;</p><p class="ql-block">4. 解碼時(shí),音節(jié)碼先校驗(yàn)大小寫格式+映射庫符合性,格式錯(cuò)誤/無匹配均返回糾錯(cuò)提示。</p><p class="ql-block"> </p><p class="ql-block">003聲調(diào)編碼規(guī)則落地邏輯</p><p class="ql-block"> </p><p class="ql-block">基礎(chǔ)聲調(diào)編碼</p><p class="ql-block"> </p><p class="ql-block">1. 建立聲調(diào)-編碼映射庫,固化1-4聲對(duì)應(yīng)編碼,與音節(jié)碼聯(lián)動(dòng)(如hán=第二聲,音節(jié)碼hF已融合聲調(diào),按文件規(guī)定執(zhí)行);</p><p class="ql-block">2. 拼音提取后自動(dòng)識(shí)別聲調(diào),無明確聲調(diào)(輕聲)按補(bǔ)充規(guī)則處理,聲調(diào)識(shí)別錯(cuò)誤返回“拼音聲調(diào)提取失敗,請(qǐng)核對(duì)漢字讀音”。</p><p class="ql-block"> </p><p class="ql-block">輕聲編碼補(bǔ)充規(guī)則</p><p class="ql-block"> </p><p class="ql-block">輕聲音節(jié)碼強(qiáng)制以小寫v開頭,后緊跟該漢字標(biāo)準(zhǔn)音節(jié)編碼,格式為「v+音節(jié)碼」,無標(biāo)準(zhǔn)音節(jié)碼的輕聲字返回編碼異常。</p><p class="ql-block"> </p><p class="ql-block">“一、七、八、不”變調(diào)規(guī)則</p><p class="ql-block"> </p><p class="ql-block">1. 先識(shí)別入?yún)⒆质欠駷椤耙?、七、八、不”,再檢測(cè)其后綴漢字(若為組詞/短句編碼)的聲調(diào);</p><p class="ql-block">2. 若后綴漢字為第四聲,則“一、七、八、不”自動(dòng)變調(diào)為第二聲,按第二聲匹配音節(jié)/聲調(diào)編碼;</p><p class="ql-block">3. 單獨(dú)編碼“一、七、八、不”時(shí),按原聲調(diào)執(zhí)行編碼,變調(diào)僅適用于組詞/短句場(chǎng)景,未檢測(cè)到后綴漢字時(shí)默認(rèn)原聲調(diào)。</p><p class="ql-block"> </p><p class="ql-block">004補(bǔ)充規(guī)則落地邏輯</p><p class="ql-block"> </p><p class="ql-block">1. 編碼組合規(guī)則:漢字編碼輸出按「部首碼+音節(jié)碼+聲調(diào)碼」固定順序組合,無冗余字符,解碼時(shí)按相同順序拆分校驗(yàn);</p><p class="ql-block">2. 繁簡(jiǎn)字規(guī)則:繁簡(jiǎn)字分別提取部首/拼音,分別匹配對(duì)應(yīng)編碼庫,繁簡(jiǎn)同字不同音/不同部首時(shí),編碼獨(dú)立生成,標(biāo)注“繁/簡(jiǎn)”標(biāo)識(shí);</p><p class="ql-block">3. 生僻字規(guī)則:無權(quán)威部首/拼音的生僻字,返回“暫不支持編碼,建議補(bǔ)充權(quán)威字源信息”,不生成無效編碼;</p><p class="ql-block">4. 糾錯(cuò)前置規(guī)則:所有入?yún)ⅲh字/編碼)先執(zhí)行規(guī)則校驗(yàn),校驗(yàn)項(xiàng)包括“部首有效性、音節(jié)碼格式、聲調(diào)匹配性、編碼組合順序”,任一校驗(yàn)失敗,終止編碼/解碼,返回具體錯(cuò)誤項(xiàng)。</p><p class="ql-block"> </p><p class="ql-block">智能體平臺(tái)聯(lián)動(dòng)邏輯</p><p class="ql-block"> </p><p class="ql-block">1. 輸入層:支持單字/多字/編碼入?yún)?,自?dòng)識(shí)別輸入類型(漢字→編碼,編碼→解碼),多字編碼按“單字編碼+分隔符”輸出;</p><p class="ql-block">2. 處理層:調(diào)用上述規(guī)則引擎,執(zhí)行“提取-匹配-校驗(yàn)-生成”全流程,實(shí)時(shí)返回處理日志(如“已提取部首宀→匹配編碼fc”);</p><p class="ql-block">3. 輸出層:編碼結(jié)果標(biāo)注「部首碼/音節(jié)碼/聲調(diào)碼」拆分項(xiàng)+組合項(xiàng),解碼結(jié)果標(biāo)注對(duì)應(yīng)漢字+「繁/簡(jiǎn)」+讀音,異常結(jié)果標(biāo)注具體糾錯(cuò)點(diǎn);</p><p class="ql-block">4. 迭代層:預(yù)留規(guī)則庫更新入口,支持部首/音節(jié)/聲調(diào)映射庫的增刪改,更新后自動(dòng)同步至所有編碼/解碼操作,無需重構(gòu)引擎。</p><p class="ql-block"> </p><p class="ql-block">我可以幫你把這個(gè)邏輯整理成低代碼平臺(tái)的“字段-觸發(fā)-校驗(yàn)”配置表,直接對(duì)應(yīng)宜搭/明道云的操作步驟,需要嗎?</p> <p class="ql-block">數(shù)字中文·心中有花自芬芳</p> <p class="ql-block">數(shù)字中文·你咋那么美</p>