基于中文分詞的加權(quán)地理編碼在COVID-19疫情防控空間定位中的應用
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1 面‐點結(jié)構(gòu)地址編碼層次關(guān)系圖
中文地址一般可分為行政區(qū)地名、自然地名、街巷(道路、胡同)、道路門牌(門址)、住宅區(qū)、冠樓名等類型[12]。中文標準地址的形式由3部分組成,即〈標準地址〉::=〈行政轄區(qū)〉〈基本區(qū)域限定物〉〈局部點位置描述〉。其中,〈行政轄區(qū)〉為政區(qū)類地名;〈基本區(qū)域限定物〉可以是道路、小區(qū)等低....
圖2 基于中文分詞的加權(quán)地理編碼方法
文本分詞是通過對中文文本詞語進行自動識別來達到對文本自動分割的目的。由于地名地址的籠統(tǒng)性、復雜性與特殊性,難以遵循一些固有規(guī)律[8,11],因此,本文首先使用維特比算法計算初始狀態(tài)的概率值,然后逐步計算各時刻的轉(zhuǎn)移概率,再利用動態(tài)規(guī)劃求解HMM模型,從而完成對文本的分詞[17]。....
圖3 基于鏈式法則的特征詞選取
基于鏈式法則的特征詞選擇是根據(jù)不同詞組在地址中的重要程度并借鑒鏈式求導法則原理提出的方法。根據(jù)鏈式求導法則可知,參數(shù)求導依賴于函數(shù)映射關(guān)系,函數(shù)可微性是函數(shù)是否可導的必要條件。借鑒該原理,將分詞后結(jié)果分為中文和非中文兩種特征詞,其中中文特征詞為主特征詞,非中文特征詞為次特征詞。文....
圖4 COVID‐19病例社區(qū)定位分布圖
為滿足公共疫情防控需求,服務政府決策與評估,需要提供疫情在城市空間中的統(tǒng)計和分布情況,因此,在匹配完成后需要返回匹配地址的空間坐標,以滿足城市疫情管控的定位需求。同時,以社區(qū)為單位,將匹配結(jié)果得到的COVID-19病例的定位坐標落到空間上,定位其所在社區(qū)的空間位置,并將定位結(jié)果按....
本文編號:4024242
本文鏈接:http://www.lk138.cn/yixuelunwen/yufangyixuelunwen/4024242.html