宏觀經濟大數據系列研究之三:基于移動終端位置數據的企業線下復工水平測算方法研究
來源:大數據部 ??時間:2020-06-22

摘要:

[目的]為更加及時、有效地量化測算突發公共事件后企業線下復工水平,提供可量化的數據結果支撐相關政策制定和落地實施。

[方法]采用人工與自動化相結合的POI圍欄圈定策略,獲取931個樣本區域內移動終端數量;基于企業生產經營范圍內的移動終端位置數量測算復工水平;結合事實和相關數據對測算結果進行驗證。

[結果]研究發現2020年春節假期結束后初期,全國樣本企業平均復工水平約為2019年同期的三成,截止到今年2月底,樣本企業已有約半數員工線下返回工作崗位。

[局限]此次實驗樣本數量相對較少,且數據分析維度有限。

[結論]本研究所提方法符合突發公共事件后對復工水平動態監測的需要,測算結果有效性得到初步驗證。

關鍵詞:突發公共事件;移動終端位置數據;企業復工水平

分類號:G350

DOI: 10.11925/infotech.2020-0322. 

 

1 引言

突發公共事件常常對企業的生產經營產生影響,臺風、地震、流行病等都可能導致大量企業停工。在事件影響逐漸消散的階段,如何有效穩妥地推進企業復工復產是政策制定者和實施者關注的重要問題。掌握現狀是精準施策的重要基礎,對企業復工水平現狀的動態監測能夠為穩妥推進企業復工復產相關政策的制定和實施效果評估提供必要的量化支撐。

企業復工水平測量方法主要有以下兩類:(1)類似于統計數據的獲取,由統計局、行業協會等機構逐級調查匯總;(2)信息服務商基于自身產品的用戶數據估算企業復工水平。以上兩種策略雖然都具有可行性,但也存在明顯不足,如統計數據由于統計周期較長會導致結果具有滯后性,多數服務商數據具有不可避免的樣本偏誤等。

結合已有方法并取長補短,本文提出了一種利用移動終端位置數據的企業線下復工水平測算方法,并利用真實數據進行了實驗。實驗結果顯示該方法能夠有效測量企業線下復工水平,同時具有以下優勢:(1)及時性,測量結果的滯后時間不超過12小時;(2)高覆蓋率,該方法能夠以較低成本覆蓋大量企業,進行更全面的測算;(3)可擴展性,因測量顆粒度精確到企業,可通過匹配企業相關各類多源數據不斷豐富分析維度。

2 研究綜述

2.1 復工相關研究

我國學者對復工的研究大多聚焦于在個體層面,主要側重于個體傷病后恢復工作的影響因素。馮蘭芳、周慧玲等選取57例工傷環衛患者分實驗組和對照組從就業準備、復工率及誤工時間等進行對比[1]。舒甜、白鐘飛等以上海地區457個工傷患者為例,探究其復工的預測因素[2]。周慧玲、黃瓊等發現在現場評估樣本中,性別、年齡等因素影響職工在不同時間的復工率[3]。在這些研究中,復工均被界定為員工回到工作崗位。

對于突發公共事件中的復工問題,部分學者采用定性方法開展了研究。劉武忠、王祖兵等從職工外地返回、上下班途中、下班回到社區以及出差用人單位外部環節和聚集性場所、共用設施物品、外來訪客內部環節進行分析,對復工復產單位新冠肺炎感染關鍵風險點進行分析評估,并提出針對性的防控建議[4]。胡越秋、王軍、董澤華從行為經濟學視角利用三參照點理論、決策四力影響因素、前景理論和助推思想等對突發公共衛生事件防控期間企業復工決策行為進行分析[5]。

與此同時,國內學者逐漸嘗試用不同的定量方法對突發公共事件中的復工問題進行研究。李倩、唐彪等利用動力學模型,基于多源數據利用最小二乘法估計系統未知參數,得出復工等正常社會活動的有序開展或將導致緩疫策略執行力與依從性的下降,給疫情的發展帶來不確定性[6]。王霞、唐三一等基于全國和湖北省新冠疫情報告數據以及百度人口遷徙與分布大數據,構建復雜網絡模型,重點分析了武漢及周邊地區復工的可能時間節點和復工對二次爆發風險的影響[7]。不難發現,截至目前學術界仍缺少對企業復工水平的分省市動態測算研究。

2.2 移動終端位置數據在相關領域的應用

上世紀90年代,GPS定位數據已經在居民出行調查等領域得到了應用[8],隨著集成GPS模塊的手機的普及,手機GPS數據逐漸得到廣泛使用[9]。與此同時,電信運營商的手機信令定位數據、網絡服務商的SDK定位數據以及微博等信息產品中的定位數據等移動終端位置數據正越來越多地應用于社會科學研究。

交通運輸等領域已廣泛使用定位數據對出行進行測量,該類研究多以不同運輸方式中主體特征或主體間關系的特征為核心構建模型[10]。例如,Bohte等提出了基于GPS數據推理和驗證出行目的和方式的方法,并在荷蘭得到了有效應用[11];李浩等基于GPS、興趣點(POI等數據分析了上海居民出行時空特征[12];楊彬彬提出了基于手機信令數據的地鐵占有率指標,用于評估特定車次的載客強度[13]。

位置數據在表征特定地理范圍內人口分布與流動等指標的有效性也在實踐中得到驗證。例如,Yuan等基于POI和移動軌跡,利用主題模型對北京市城市功能區進行了劃分并識別了不同功能在不同位置的強度[14];Pan等通過出租車的移動軌跡對杭州市的土地使用情況進行了識別[15];申悅等利用GPS數據研究了北京郊區的兩個巨型社區,分析了影響居民在工作日內對城區空間利用情況的因素[16];王賢文等基于騰訊位置大數據分析了京津冀城市群在春節前后等不同時間段的人口流動特征,以及人口流動與地理位置、經濟水平等的相關關系[17]。

位置數據在突發公共事件研究中主要用于風險定位和災情影響測算,例如鄔群勇等嘗試使用微博定位功能、微博正文中的定位信息以及微博數量的變化確定臺風災情位置,并通過實驗驗證了該方法的有效性[18];史新穎結合DBSCANK-means聚類算法,構建了基于手機信令數據的受災人口計算模型[19]。

位置數據也在就業問題研究中得到了應用。丁亮等基于手機信令數據識別出上海市就業者的工作地和居住地,以此為基礎測算出其通勤數據,進而測度了上海中心城區的就業中心體系[20]。王德等利用手機信令數據分析了上海居民就業的空間遷徙情況,驗證了手機信令數據在城市人口就業地遷移研究中的可用性[21]。張天然基于上海市數據,驗證了手機信令數據在計算就業崗位通勤距離等指標上的可用性[22]。李鵬飛以沈陽市為例,使用核密度、空間自相關等方法,基于手機信令數據識別出城市就業中心,并分析了城市就業空間特征[23]。

綜上所述,對于突發事件中企業復工水平的測算,目前仍缺少得到一致認可的解決方案。但已有研究表明,職工回歸工作崗位是復工問題的核心,而基于移動終端位置數據測量人口分布與流動的研究方法已經在交通運輸、城市規劃等領域得到驗證,同時,此類數據已經在突發事件和就業研究中得到應用,因此基于移動終端位置數據測量復工水平具有可行性。

3 基于移動終端位置數據的企業線下復工水平測算方法

利用移動終端位置數據的線下復工水平測算方法總體可以分為數據獲取、復工水平測算、測量結果驗證三個步驟,總體研究路線如圖1所示。

 

1 總體研究路線

Fig.1 Research roadmap

3.1 特定POI區域范圍內移動終端獲取方法

為有效獲取特定POI區域范圍內的移動終端數,首先需要圈定較為準確的POI覆蓋圍欄范圍。由于突發公共事件中企業線下復工水平的測算具有較高的時效性要求,因此在確定圍欄范圍的過程中需兼顧時間成本以及移動終端位置數據的準確性、穩定性和持續性。以此為出發點,本文在已有研究的基礎上設計了應急狀態下特定POI區域范圍內移動終端數量獲取流程,兼顧了人工或自動化圈定圍欄方式的優劣勢,主要可分為三個步驟:抽樣選取待監測POI樣本、人工/自動化圈定圍欄、利用監測網格持續獲取移動終端數量,總體思路如圖2所示。

2 特定興趣點(POI)區域范圍內移動終端數量獲取方法具體流程

Fig.2 The detailed process of acquiring the number of mobile terminals within specific POI areas

1抽樣選取待監測POI樣本階段

針對特定領域、特定區域或特定主體的線下復工水平測算需求,顯然能夠納入監測范圍的POI數量越多則線下復工水平測算誤差率越小,但由于往往期望被納入監測的POI數量較為眾多,而后續圈定圍欄會損失一定時效性,為了權衡準確性與時效性,本文根據不同分析需求制定了多種POI樣本抽樣策略,例如:按POI影響力(例如大型商超或超市網民好評度、企業招聘影響力等)、按POI規模(例如企業注冊資本、企業員工規模等)、按POI類型(例如上市/非上市公司、公司所屬行業等)或是按完全隨機策略選取具有一定代表性的POI樣本。

2)人工/自動化圈定圍欄階段

為了兼顧線下復工水平測算的準確性與時效性需求,本文依托面數據區域查詢[24]及圓型周邊查找方法[25]研究成果,選定了兩種根據POI確定對應圍欄信息的策略,即人工精準化圈定圍欄策略(面數據區域查詢)和自動化快速圈定圍欄策略(圓型周邊查找),根據實際操作經驗,人工精準化圈定一個企業圍欄約耗時2-3分鐘,時間成本相對較低,此外,自動化快速圈定圍欄則可實現秒級批量處理,時間成本更低。

 人工精準化圈定圍欄策略

對于人工精準化圈定圍欄策略,由于圈定圍欄過程中的多個環節需要人工介入,時效性較差但準確度相對較高。其主要流程包括利用地圖搜索并確認POI對應地理位置、人工根據地圖顯示POI覆蓋范圍圈定其圍欄范圍、將圍欄范圍轉換為8GeoHash編碼[24](注:GeoHash位數越多代表圍欄精度越精確,目前業界主流采用8位編碼繪制圍欄范圍)、將8GeoHash編碼映射至監測網格等,人工圈定圍欄示意圖如圖3所示。其中,為了便于移動終端數量的獲取及統計,目前業界主流做法會提前將移動終端定時上報的地理位置數據進行網格化預處理,每個網格大致由38.2米長和19米寬的矩形網格組成[26]。

 

3 人工圈定圍欄示意圖

Fig.3 Schematic diagram of manually determining the fence

 自動化快速圈定圍欄策略

相較于人工圈定圍欄策略,自動化快速圈定圍欄策略的主要流程是:根據POI名稱自動化關聯映射POI的詳細文本地址、根據文本地址與經緯度坐標映射關系庫確定POI中心點坐標、設定POI輻射范圍半徑、將POI中心點坐標及其輻射半徑繪制的圓周擬定為該POI圍欄范圍并轉換為監測網格,其中,如圖4所示,以半徑為50米為例,其圓周共覆蓋了11個網格。不難發現自動化快速圈定圍欄策略的全過程中人為參與環節較少,雖然準確度會有些損失但時效性較強,可供不同監測需求下綜合選取。

4 將中心點坐標及輻射半徑轉換為監測網格示意圖(以半徑為50米為例)

Fig.4 Schematic diagram of converting the center point coordinates and radiation radius into monitoring grids (taking a radius of 50 meters as an example)

3)利用監測網格持續獲取移動終端數量階段

無論是人工精準化圈定圍欄策略還是自動化快速圈定圍欄策略,一旦選定監測網格即可開始持續獲取這些網格內的移動終端位置數據,一般情況下,從確定圍欄到獲取到移動終端位置數據的時間一般不超過12小時,時間滯后性較低。此外,為了盡量減少統計誤差,本文只統計在監測網格區域內停留時間超過2小時的移動終端數量,并且將原始數據進行脫敏化處理,只提取了時間、位置和數量信息,所有數據不包含任何個人信息和內容數據。

3.2 企業線下復工水平測算方法

關于突發公共事件后的復工和復工水平,雖然學界已有一些研究,但目前尚未形成統一的定義方式。本文結合已有研究和復工一詞的詞典定義[27],以2020年初的突發公共衛生事件(以下稱“案例事件”)為例,采用如下操作化定義。

復工定義:春節法定假期后,企業員工在法定工作日返回工作崗位。

復工水平定義:已經復工的員工數量在員工總數中的占比,以及這一占比在案例事件期間和非案例事件期間的對比情況。

基于以上操作化定義,本文提出線下返崗率和線下返崗景氣度兩個指標用以測量案例事件期間的復工水平。返崗率表征已經返回工作崗位員工的占比,計算方法如公式(1)所示:

                 1

因此,需要基于移動終端位置數據測算線下返崗人數和員工總數兩個指標。已有研究表明,移動終端設備的數量能夠反映人流量,因此本文使用企業生產經營范圍內持續停留超過2個小時的移動終端設備數量(以下簡稱“設備數”)映射企業線下工作的人數。關于線下返崗人數,本文將使用春節假期后法定工作日的設備數進行等量映射,關于員工總數,本文采用春節前正常工作日的設備數進行等量映射。具體測算步驟如下:

1.計算202012日(元旦后一天)至123日(除夕前一天)期間工作日內企業的逐日設備數;

2.對所有企業設備數逐日求和,并以12日數據為100進行標準化,結果如圖5所示。從圖中不難發現,受春節假期影響,工作日設備數從119日開始出現明顯下滑,因此選取12日至117日共12個工作日作為2020年春節前正常工作日。


 

5 2020年年前工作日逐日設備總數標準化結果

Fig.5 Scaled results of the total number of mobile devices on working days before the Spring Festival of 2020

3.計算正常工作日的逐日設備數均值,作為企業正常情況下的員工總數。

綜上,本研究中基于移動終端位置數據的線下返崗率計算方法如公式(2)所示:

         2

本文采用以上方法,對2019年的線下返崗率進行了測算,結果(見圖6)發現,即使在沒有突發公共事件的年份,線下返崗率也不是在年后立即達到100%,而是存在逐步回升過程,整個過程大約持續兩周。

 

6 2019年春節后逐日線下返崗率

Fig.6 The offline return rate after the Spring Festival of 2019

因此,為了進一步反映今年春節后線下返崗率受案例事件影響程度,本文提出了線下返崗景氣度指標表征受案例事件影響的返崗率與前一年無突發公共事件狀態下水平的距離,該指標計算方法如公式(3)所示:

      3

其中,同期以全國法定工作日計,例如2020年春節假期后第一個工作日(23日)和2019年春節假期后第一個工作日(211日)為同期。線下返崗景氣度得分越接近1說明越接近正常水平。

3.3 企業線下復工水平結果驗證方法

關于案例事件期間的企業復工水平,仍缺乏統一的定義和測算口徑,更沒有持續的權威數據可供比對,因此如何評估測算方法的有效性成為本研究的一大難點。本文采用以下兩種方法解決這一問題。

基于事實驗證。本研究的目的是識別復工水平,為相關決策提供量化支撐,因此測算結果的可解釋性以及與事實的契合度應作為結果評估的重要標準。本文擬通過不同角度將測算結果的特征與案例事件期間的事實進行比對,評估兩者的符合程度,測算結果與事實的符合程度越高,則測算有效性越高。但這種驗證方法無法擺脫事后解釋的困境,因此仍需進行量化驗證。

基于相關數據驗證建構效度。建構效度用于評估“測量工具是否反映了概念與命題的內部結構”[28],其核心思想是如果兩個理論上存在相關性的概念在測量結果上也相關,則更有信心認為測量結果是有效的。本研究使用的相關概念對是線下復工與城市內出行,因為線下復工與通勤是相伴的。城市內出行數據方面,本文使用了百度地圖公布的城市內出行強度和滴滴出行公布的城市交通活力恢復指數。如果測算結果通過了建構效度檢驗,就有更充分的證據表明本文提出的測算方法是有效的。

4 實驗數據與測算結果

4.1 實驗數據介紹

為了利用真實數據對案例事件期間線下復工水平進行測算,本文根據職友集網站(www.jobui.com)公開發布的各城市企業排名,抽樣選取了600個大型企業樣本,同時,根據高德地圖(www.amap.com)搜索“寫字樓”的排名情況,抽樣選取了331個寫字樓樣本。因此,大型企業及寫字樓的總實驗樣本量為931,為了確保覆蓋率和代表性,實驗樣本涵蓋了除港澳臺以外的31個省份。

此外,考慮到企業辦公地址較為復雜,本文對企業樣本采用了人工圈定圍欄策略,對寫字樓樣本采用了自動化快速圈定圍欄策略。并基于931個實驗樣本,選取了201911日至331日及202011日至229日兩個時間段內共150天,獲取了在圍欄區域內停留時間超過2小時的移動終端數量作為復工水平測算的基礎性數據。

4.2 測算結果

本文使用3.2節的計算方法,對20202月全國及分省樣本企業復工水平進行了測量。部分測算結果如下。

從全國總體水平來看,樣本企業線下復工水平穩步提升。如圖7所示,23日節后第一個工作日,線下返崗率僅為18.38%,線下返崗景氣度為0.29,復工水平約為2019年的三成。自210日起,隨著絕大多數省份解除對企業復工的政策限制,線下返崗率出現大幅上升,此后每周上升約10個百分點,至228日已達50.4%,即已有約一半的員工在線下返回工作崗位。從第三周開始,由于基期(2019年)線下返崗率已回到正常水平,線下返崗率和線下返崗景氣度結果基本一致。

 

7 20202月全國樣本企業線下返崗水平測算結果

Fig.7 The measure results of the offline resumption level of all samples in February 2020

228日, 31個樣本省份中,半數以上省份樣本企業的線下復工率已超過50%。截止到2月底,從線下返崗率來看,尚無省份超過80%,甘肅、福建、吉林等8個省份超過了60%,多數省份在40%60%之間,除此之外,北京為38.76%,新疆為25.83%。對于案例事件影響最為嚴重的湖北省,由于采取了嚴格措施管理人口流動,湖北省樣本企業的復工水平雖然節后第一周接近于全國整體水平,但在全國持續回升的過程中,湖北的復工水平卻一直在低位徘徊,其228日的線下返崗率僅為19.22%。

1 2020228日各省樣本企業線下返崗率分布

Table 1 The province distribution of the offline return rate on February 28, 2020

線下返崗率

省份數量

省份

[60%,80%)

8

甘肅、福建、吉林、陜西、山東、遼寧、云南、海南

[50%,60%)

9

江蘇、青海、內蒙古、寧夏、安徽、貴州、浙江、湖南、江西

[40%,50%)

11

四川、山西、廣東、河北、上海、廣西、河南、天津、西藏、重慶、黑龍江

[20%,40%)

2

北京、新疆

[0%,20%)

1

湖北

 

5 測算有效性驗證

本節將結合事實和城市內出行數據,對線下返崗率的測算結果進行驗證,因線下返崗景氣度只是在前一步的基礎上計算同比變化,此處不再單獨驗證。20202月全國和湖北省的線下返崗率測算結果如圖8所示。

 

8 20202月全國及湖北樣本企業線下返崗率

Fig.8 The offline return rate of all samples and samples in Wuhan in February 2020

 

5.1 基于事實定性驗證

總體來看,測算結果的主要特征與案例事件期間的事實高度相符,具體表現在以下幾個方面:

從總體趨勢上,全國呈現上升趨勢,但湖北省相對平穩。線下返崗率測算結果表明,全國復工水平呈總體上升趨勢,與國家發展改革委公布的規上企業復工趨勢[29]相符。而與此同時,受案例事件影響較大、人口流動管理政策更加嚴格的湖北,其返崗率和返崗景氣度在今年2月期間均未出現明顯的上升趨勢,符合事實特征。

逐周對比來看,第一周湖北與全國復工水平差距較小,第二周開始差距逐漸拉開。雖然春節假期后的法定工作日是從23日開始,但上海[30]、浙江[31]等超過20個省份都規定各類企業不早于2924時復工,北京[32]等省份也建議在20202924時前各類企業靈活復工。由此可見,多數省份都是在210日之后正式復工。從測算結果來看,春節假期后第一周,全國和湖北的復工水平均較低,二者差異不大,但從第二周開始,全國復工水平開始逐步上升,結果與事實相符。

逐日對比來看,第一周內出現了逐日下降的特征。由于測算所用底層數據精確到單臺設備,所以能夠敏銳地捕捉復工水平的逐日變化。從測算結果逐日變化來看,僅第一周的復工水平出現了短期小幅下滑,這與當時部分企業違規復工被查處、因防疫設施不足再次停工等事實[33]相符合。

5.2 基于其它來源數據定量驗證

線下復工與市內通勤高度相關,因此城市內出行數據可視為復工相關數據。本節將結合百度、滴滴等大型互聯網公司公布的相關數據驗證基于移動終端位置數據的線下復工水平測算方法的有效性。

1)與百度遷徙城市內出行強度指數對比

百度遷徙城市內出行強度指數是各個“城市有出行的人數與該城市居住人口比值的指數化結果”[34],該指數反映了城市內逐日出行強度的變化,但沒有計算春節假期前后的強度的比值。為保證對比的一致性,本研究采用與線下返崗率相同的方法對百度遷徙城市內出行強度指數進行計算,將其命名為“出行恢復度”,四個直轄市2月份的測算結果對比如表2所示。

2 線下返崗率與出行恢復度對比

Table 2 Comparison of the offline return rate and the travel recovery indicator

城市

指標

均值

全距

方差

Pearson

相關系數

北京

線下返崗率

0.29

0.26

0.01

0.96

出行恢復度

0.34

0.21

0.00

重慶

線下返崗率

0.23

0.30

0.01

0.89

出行恢復度

0.41

0.21

0.01

上海

線下返崗率

0.27

0.34

0.01

0.99

出行恢復度

0.40

0.34

0.01

天津

線下返崗率

0.27

0.29

0.01

0.95

出行恢復度

0.36

0.22

0.01

從表中可以看出,四個直轄市的線下返崗率和出行恢復度均高度相關,初步驗證了數據有效性。從具體數值來看,四個直轄市線下返崗率的均值都低于出行恢復度,而其全距則沒有低于后者,說明二者代表不同含義。

以線下返崗率為因變量,出行恢復度為自變量的一元線性回歸結果(見表3)顯示,這兩個指標在四個直轄市測算結果均顯著正相關。因此,如果百度遷徙城市內出行強度指數是對城市內出行的有效測量,則可以認為本文測量結果通過了建構效度檢驗。

3 線下返崗率與出行恢復度回歸分析結果

Table 3 Regression results of the offline return rate and the travel recovery indicator

因變量

自變量

回歸系數

標準誤差

變量P

模型P

北京

線下返崗率

截距

-0.17

0.03

0.00

0.00

北京出行恢復度

1.35

0.10

0.00

重慶

線下返崗率

截距

-0.29

0.06

0.00

0.00

重慶出行恢復度

1.27

0.15

0.00

上海

線下返崗率

截距

-0.13

0.01

0.00

0.00

上海出行恢復度

0.99

0.03

0.00

天津

線下返崗率

截距

-0.25

0.04

0.00

0.00

天津出行恢復度

1.46

0.11

0.00

2)與滴滴城市交通活力恢復指數對比

雖然與出行恢復度的對比得到了較好的結果,但此處無法驗證百度遷徙城市內出行強度指數的有效性。因此,本研究引入與滴滴城市交通活力恢復指數的相關性分析,進一步檢驗測算結果的有效性。滴滴城市交通活力恢復指數“基于滴滴出行平臺海量軌跡數據、交通運行指數(TTI)等出行數據,進行擬合、交叉驗證、加權處理后得出,可科學客觀地反映出城市交通的活躍度[35]。因為本文數據采集時,四個直轄市中,滴滴城市交通活力恢復指數的公開數據僅覆蓋上海和重慶,以下以這兩個城市為例進行驗證。線下返崗率與滴滴城市交通活力恢復指數的對比如表4所示。

4 線下返崗率與城市交通活力恢復指數對比

Table 4 Comparison of the offline return rate and the urban traffic vitality recovery index

省份

指標

均值

全距

方差

Pearson相關系數

重慶

線下返崗率

0.23

0.30

0.01

0.93

城市交通活力恢復指數

0.09

0.15

0.00

上海

線下返崗率

0.27

0.34

0.01

0.96

城市交通活力恢復指數

0.18

0.26

0.01

從重慶和上海的結果來看,線下返崗率與城市交通活力恢復指數也是高度相關的,指標間的Pearson相關系數在兩個城市均超過0.9。從具體數值來看,線下返崗率的均值和全距相對較高。

從回歸分析的結果(見表5)來看,除重慶模型中的截距項外,其它變量均顯著正相關,再次驗證了線下返崗率測算的有效性。

5 線下返崗率與城市交通活力恢復指數回歸分析結果

Table 5 Regression results of the offline return rate and the urban traffic vitality recovery index

因變量

自變量

回歸系數

標準誤差

變量P

模型P

重慶線下返崗率

截距

0.02

0.02

0.38

0.00

重慶城市交通活力恢復指數

2.32

0.22

0.00

上海線下返崗率

截距

0.04

0.02

0.04

0.00

重慶城市交通活力恢復指數

1.30

0.09

0.00

3)驗證數值有效性

不難發現,以上幾種方法都只是在變化規律層面驗證了線下返崗率測算的有效性,而沒有驗證單個獨立數值的有效性,即無法判斷228日全國線下返崗率為50.40%這樣單一數值是否準確。對于這一問題,理想的解決方案是跟權威數字進行對比,但在研究中并未找到可用于比對的權威數字。雖然官方公布了規上企業復工率之類等相關指標,但存在以下兩個問題:第一,所公布數據的口徑未知;第二,所公布數據不夠連貫。

本研究所提出的方法,能夠以企業為單位進行測算,進而判斷每個企業是否復工,但由于無法獲得官方判斷企業復工的標準,因此無法采用相同標準將線下返崗率轉化為企業復工率,例如將企業有1人返崗即視為復工和超過50%的人返崗視為復工則會得出完全不同的結論。同時,即使能夠測算出復工率,由于可對比的官方數據較少,少數幾個點的對比不具有統計意義。因此,單個獨立數值的有效性本次并未得到驗證。

雖然如此,相對于基于出行等數據的測算,本研究提出的測算方法與復工這一問題的關聯更為直接,因此其數值更可能反映實際復工水平。一方面,以企業為單位獲取數據,在概念上與企業復工更為契合。另一方面,本研究所用數據都精準定位到了企業生產經營范圍內,直觀地測算了線下返回工作崗位的人數。與此同時,如圖6所示,2019年年后的線下返崗率逐步恢復并穩定在100%上下小幅波動,符合經驗判斷,說明雖然具體數值存在小幅誤差,但總體能夠表征實際返崗水平。

與此同時,需要指出的是本次實驗的結果可能存在一定誤差。一方面,本次使用的實驗數據樣本量較小,重點覆蓋了具有一定規模的企業和知名寫字樓,樣本對農村地區的代表性不足,因此結果可能更接近于城市內企業的線下復工水平。此外,由于在一些情況下移動終端數不等于人數,例如一個人擁有多臺移動終端等,在使用移動終端數量近似測量人流量時或存在一定誤差,雖然通過突發事件前后及兩年間的對比能夠在一定程度上縮小這一誤差,但無法將其完全消除。

 

6 結語

為了更加及時、有效地測量突發公共事件期間企業復工水平,本文提出了一種基于移動終端位置數據的企業線下復工水平測算方法,并使用931個樣本數據進行了實證研究,主要研究如下:

1)本研究所提方法能夠低成本、大量、快速地獲取企業生產經營范圍內的人口流動數據,能夠在12小時內計算出前一天的線下復工水平,符合突發公共事件期間對復工水平動態實時跟蹤監測的需要;

2)基于事實和相關數據的驗證結果顯示,本文所提方法具有一定的有效性,一方面,測算結果能夠較好地解釋現實特征,另一方面,測算結果通過了建構效度檢驗,與城市內出行數據呈顯著相關。

本次實驗階段仍存在一些不足,例如所用樣本較少,對總體的代表性仍需進一步驗證;所用數據維度較少,無法全面反映線上線下綜合復工水平;測算結果具體數值有效性的驗證仍有不足等。在后續研究中將通過擴大樣本量、豐富數據維度、增加驗證標準等方法對研究進行深化。

开个什么店好赚钱呢 门面不是太正 排三定位 天津11选五开奖走势图 排列3开奖结果排列5 山东群英会任五中四多少钱 今天快三开奖结果出来 体彩辽宁11选5怎么玩 配股资格 吉林体彩11选五怎么中奖 上海今天11选5开奖走势图 十一选五玩法中奖图