編者按 :蕾奧一直以來都關注著大數據技術的應用,并與百度慧眼展開合作,不斷嘗試使用大數據平臺推動生產和研發工作的進行。現發布我們的最新研究成果,基于百度慧眼人口數據對深圳市近8年來典型社區人口結構變化特征進行觀察和分析,希望能從看似簡單的數據信息中,挖掘出一些背后有價值、有趣的規律。該研究由公司技術管理與研發中心的大數據研究團隊負責,研究成果已在“百度地圖慧眼”公眾號上發布。本次轉發已獲授權。
全文5300字,閱讀需要10分鐘
一、研究目的
隨著大數據技術的發展,人口數據采集相比傳統方式有了顛覆性發展,使得對城市人群活動全貌和細節的快速觀測成為可能。百度慧眼人口數據基于百度地圖開放平臺每天800億次的定位數據,經過脫敏去隱私處理,整合定位和POI等多源數據,提取定位天數分布、定位時間分布、用地類型、Wifi信息等上百個特征,通過人工智能算法挖掘得出高準確和覆蓋率的常駐人口數據。
大數據在與其他來源數據的比照和融合中,可以得到許多有趣的發現。此次深圳市蕾奧規劃設計咨詢股份有限公司與百度慧眼合作,將百度慧眼人口數據與傳統的人口普查數據相結合,對深圳市近8年來的社區人口變化特征進行一次“管中窺豹”式的觀察,試圖形成一套專題型數據應用分析邏輯。
深圳市最新一輪人口普查開展于2010年。這一年,對于深圳也是一個重要的發展節點:一是人口規模開始出現了大幅增長,居住類社區在人口增長的大背景下發生了什么樣的變化?二是深圳經濟特區擴容,由原來的“二線關”擴展到深圳全市,8年來特區內外一體化對社區人口產生了什么影響?三是產業轉型升級加速,部分產業從原特區內遷出,連帶的就業者遷徙對特區內外的社區人口結構帶來什么影響?帶著這些問題,項目組遴選了若干典型社區,一探近年來深圳在高速發展中社區人口的變化特征。
二、 數據準備
研究選擇2010年的深圳市第六次全國人口普查(以下簡稱“六普”)數據與百度慧眼2018年5月的數據進行對比。在全市700余個社區,選擇了9個邊界穩定又各具代表性[1]的社區作為觀察對象。
圖表1 典型社區總體情況介紹
圖表2 典型社區總體分布情況
“六普”數據和百度慧眼人口數據關于常住人口的統計口徑不同。前者的判斷標準是在該地居住6個月以上,后者的判斷標準是2個月內晚上和周末都出現在該地的人。因此,在本研究中選擇“六普”常住人口與百度慧眼人口數據中的居住人口進行對比。一般認為,在人口總量上,“六普”數據傾向偏低而大數據傾向偏高,且考慮前述的口徑差異,本研究不對人口數量做直接比較,而將重點放在對人口結構變化的考察上。
三、典型社區基本情況
從深圳全市整體情況來看,男性人口占比比女性多20%,全市人口學歷主要集中在“高中及以下”,而“本科及以上”學歷的僅占9.33%。年齡結構上深圳人口呈現出年輕化的情況,人口主要集中在了“24歲以下”和25~34歲年齡段。
在后續典型社區的分析中,項目組判定人口密度增幅達50%以上或人口結構占比變化幅度在10個百分點以上的為“有顯著變化”,小于該變化幅度的則可視為穩定。分析工作將重點針對各社區的顯著變化。
圖表3 典型社區基礎數據匯總
【01 中新街社區】
圖表4 中新街社區2008年2月與2017年12月衛星圖
中新街社區建于1981年,位于南山區沙河街道,建筑形態主要為多層建筑和中高層建筑,中新街的選擇標準是原特區內平均水準的社區。在對比研究的8年時間內社區形態基本穩定,住宅建筑基本未發生改變。社區總人口密度在8年間增長25.21%,常住人口總量基本穩定。社區中男性占比相比女性占比有小幅增加;社區常住人口學歷結構上主要為“高中及以下”學歷,大專學歷與“本科及以上”學歷人口占比相當;年齡結構則為35~44歲年齡段占比最高,其次是25~34歲年齡段,整體來說是以中年人為主的穩定型社區。
【02 蓮花二村社區】
圖表5 蓮花二村社區2010年4月與2017年12月衛星圖
蓮花二村社區建于1989年,位于福田區中心,紅荔路與皇崗路交接處西北,是原特區內平均水準的住宅類社區,主要建筑形態為中高層和高層。蓮花二村社區是本次研究所選典型社區中唯一人口減少的社區,8年間常住人口減少15%,這在深圳人口大規模增長和統計口徑的差異下顯得十分反常,因而受到了項目組的關注。社區常住人口結構基本穩定,常住人口主要分布在35~44歲和25~34歲年齡段。
【03 下沙社區】
圖表6 下沙社區2010年4月與2017年12月衛星圖
下沙社區位于福田區西南部,車公廟以南,是深圳市著名的城中村社區。社區城中村部分在8年間未發生較大改變,主要改變發生在社區北部,原有建筑被拆除,新建濱河時代廣場。統計顯示,下沙社區8年間常住人口密度增幅156.17%,其中男性人口增幅遠高于女性。社區超過一半的常住人口學歷為“高中及以下”,但是相比六普,其占比已經有了顯著下降,同時社區中大專學歷人口占比增長明顯。年齡結構方面,25~34歲年齡段人口占比最高,其次是24歲以下年齡段,社區人口結構更加年輕化,34歲以下人口占到全社區常住人口的3/4以上。
【04 湖貝社區】
圖表7 湖貝社區2010年4月與2017年12月衛星圖
湖貝社區毗鄰羅湖區東門商圈,是東門街道唯一的農城化社區。其建筑形態在8年間未發生較大改變,仍以城中村為主。社區人口密度穩定,男性比例雖有所提升,但社區過半常住人口仍為女性。相比六普時95.52%常住人口學歷為“高中及以下”,現在的湖貝社區大專學歷占比增幅顯著。社區中34歲以下人口占比在兩次統計中都超過75%,整體年齡結構偏年輕化。
【05 梅林一村社區】
圖表8 梅林一村社區2010年4月與2017年12月衛星圖
梅林一村社區位于福田區梅林街道。社區北部為梅林水庫,南部也就是社區居住主體是大型住宅區,是原特區內擁有優良學位的中高端社區。社區建筑以中高層和高層建筑為主,社區建筑形態和常住人口密度都基本保持穩定,性別比例、學歷結構都未發生較大變化。人口年齡結構發生了明顯改變,24歲以下人口減少,而25~54歲年齡段人口均有不同程度的小幅增長,社區常住人口年齡結構向35~44歲年齡段集中,類似正態分布。
【06 長城社區】
圖表9 長城社區2010年4月與2017年12月衛星圖
長城社區地處福田區園嶺街道,紅荔路與華強北路交叉口東北,屬于原特區內擁有良好學位的中高端社區,社區內住宅以高層建筑為主。長城社區的建筑形態基本穩定,常住人口密度增幅21.85%,性別、學歷結構在近8年間均未發生較大改變。年齡結構方面,24歲以下常住人口減少的同時25~54歲常住人口均出現一定程度的增加,尤其是35~44歲年齡段人口占比增幅明顯,達到12.61%,目前該年齡段人口已占到社區常住人口的41.18%。
【07 福永社區】
圖表10 福永社區2010年3月與2018年1月衛星圖
福永社區位于寶安區福永街道,緊鄰深圳寶安國際機場,是位于原特區外的由城中村構成的社區。在本次研究的時間段里社區內建筑形態有一定程度的改變,但總體上仍維持以城中村為主體的樣貌。福永社區在8年間人口密度增長78.96%,常住人口的學歷分布發生了巨大的變化,“高中及以下”學歷和大專學歷人口占比變化幅度均達到20%以上。年齡段分布來看,25~34歲年齡段人口占比增長顯著。
【08 愉園社區】
圖表11 愉園社區2010年11月與2017年12月衛星圖
愉園社區位于龍崗區中心城,龍城公園以北,龍潭公園以西,是原特區外的中高端社區,社區住宅主要由中高層和高層建筑構成。社區常住人口密度8年間增長70.46%,性別比例變化不大。學歷結構上,“高中及以下”學歷段人口占比顯著降低。年齡結構方面,24歲以下年齡段人口占比降低,25~44歲年齡段人口占比均有所上漲,成為社區常住人口占比最大的群體。
【09 銀湖社區】
圖表12 銀湖社區2010年4月與2017年12月衛星圖
銀湖社區位于羅湖區清水河街道西北部,北環大道以北,在原特區內屬于建成較早、形態穩定的高端社區,建筑形態主要分為別墅區的低層和南部住宅區的多層、超高層建筑。社區常住人口密度8年間增幅39.95%,性別比例失衡,男性占比已達62.80%。社區大專學歷人口占比顯著增長,增幅達到10.68%。年齡結構方面,25~54歲各年齡段人口占比均出現了不同幅度的增長,但是從總體來看社區年齡結構仍算較為穩定,各年齡段人口分布較為平均。
四、典型社區人口變化特征
【01 人口密度】
社區人口密度顯然受到建筑形態的影響,大致分為三檔:
——原特區內的城中村(下沙、湖貝)是第一檔,人口密度可達到15萬人/平方公里以上。其中,下沙社區由于交通區位優勢明顯,也是過去8年間人口增長最快的社區。
——原特區內的高端別墅型社區(銀湖)是第三檔,人口雖然在增加,但人口密度低于1.5萬人/平方公里。
——其他社區是第二檔,人口密度接近5萬人/平方公里的“天花板”。其中,原特區外社區(福永、愉園)的人口增幅要明顯高于原特區內的社區,說明了2010年深圳經濟特區“擴容”和產業騰籠換鳥對人口空間分布的影響;而在原特區內,學位配套較好的社區(長城、梅林一村)人口密度又要明顯高于其他社區。
圖表13 典型社區人口密度及其變化情況
【02 性別比例】
典型社區性別比總體上在強化男多女少的趨勢,與全市變化一致。比較有趣的是,中高端社區(梅林一村、長城、愉園、蓮花二村)不論性別比還是其變化量都顯著低于全市平均水平,說明這類社區的家庭更加完整(非單身),或與這些社區的置業成本往往非個人所能承受有關。
圖表14 典型社區性別比及其變化情況
【03 年齡結構】
年齡結構變化主要表現為25-34歲年齡段人口比例大幅增加,35-44歲年齡段人口比例稍有增加,其他年齡段人口占比均有不同幅度的下降,這是由于深圳本身的年齡金字塔結構和大量工作年齡人口流入共同導致的。從典型社區的比較中還可發現,房價也在影響社區人口的年齡結構變化:24-35歲多為初次置業人群,故原特區外社區(如愉園)該年齡段人口比重增長比原特區內社區要快;35-44歲年齡段需要考慮學位且有相當的經濟基礎,故原特區內學位較好的社區(長城、蓮花二村)該年齡段人口比重增長又明顯高于其他社區。
圖表15 典型社區年齡結構及其變化情況
【04 學歷結構】
學歷結構整體呈現優化的態勢,表現為“高中及以下”學歷人口占比的大幅下降、大專學歷人口占比的大幅上升與“本科及以上”學歷人口占比的小幅增長。且原特區外社區和城中村社區的常住人口學歷優化的幅度更大。另外值得注意的是,擁有優良學位的中高端社區(長城、梅林一村)大專學歷人口比重幾乎無變化,“本科及以上”學歷人口比重反而下降,“高中及以下”學歷人口比重是唯二增加的。這顯然是受該類型社區中小學生數量增加的影響,也反映了社會階層在某種程度上的固化。
(高中及以下)
(大專)
(本科及以上)
圖表16 典型社區學歷結構及其變化情況
五、結語
本次研究基于百度慧眼人口數據的【位置評估】功能,可以快速對城市社區人口特征進行多角度的“畫像”,從而為社區人口變化的縱向和橫向分析奠定數據基礎。從本研究分析可以發現,只要能將大數據與空間結合并盡可能提高數據精度,即便是最簡單、最基礎的數據,也蘊含著豐富的空間特征信息。未來我們可進一步優化研究思路與方法,聯系如社區房屋容積率、房屋租售價格、職住分布等相關數據擴展研究范圍,從更多維度對特定區域進行更深入的研究。
注釋:
[1]代表性主要考慮區位(原深圳經濟特區內、外)、社區類型(一般住區、中高端住區、城中村)、配套(是否有優質學位等)、建筑形態(高層、中高層、多層、低層)等因素。
[2]在學歷結構上,“六普”將6歲以上人口作為統計對象,而百度慧眼平臺是將6歲以下兒童算作“未上過學”,包含在“高中及以下”學歷人口中。本研究按照慧眼平臺的算法重新計算2010年的人口學歷結構,以統一口徑。
[3]在年齡結構上,“六普”的年齡段劃分為“19歲以下”和“20-24歲”,百度慧眼平臺的標準為“18歲以下”和“19-24歲”。本研究統一設置“24歲以下”年齡段進行對比。