2022年12月,研究人员通过百度搜索指数构建“超额发烧搜索指数累计面积”模型,预测全国主要城市疫情高峰进度与走向。该模型以“发烧”等关键词的搜索量为基础,通过累计超额搜索面积判断疫情阶段——当数值达80时意味着达峰,250时标志首轮疫情结束。百度APP同步上线“全国各城市疫情搜索高峰进度”服务,用户可实时查询所在城市的峰值进度、日期及结束时间。
重点城市疫情高峰进度(2022年12月数据)
| 城市 | 达峰日期 | 搜索指数峰值特征 | 恢复情况(截至12月26日) |
|---|---|---|---|
| 北京 | 12月12日 | 达峰后快速下降,12月26日恢复至常规水平3倍 | 地铁客流恢复至2019年均值的52% |
| 广州 | 12月16日 | 双峰值(12月16日、21日),持续约一周 | 搜索指数降至峰值的61% |
| 上海 | 12月22日 | 峰值后一周仍处高位,地铁客流仅恢复至均值57% | 搜索指数为峰值的71% |
| 成都 | 12月15日 | 与武汉同步达峰,12月26日指数为峰值22% | 地铁客流恢复至2019年均值的124% |
| 保定 | 12月10日 | 全国最早达峰,12月26日恢复至常规水平 | 整体疫情周期约35天 |
疫情走向特征与规律
地域差异显著:北方城市如保定、石家庄、北京率先达峰,南方城市如上海、深圳滞后约10天。这与人口密度、交通流动性及防控政策调整节奏相关。
“快进快出”模式:多数城市从达峰到恢复常规水平仅需2-3周。例如郑州12月15日达峰,26日已接近常规水平,周期约24天。
数据修正与挑战:初期模型因搜索数据污染(如“内马尔发烧”等热点事件干扰)多次优化,后期采用百度与巨量算数复合指标,并引入人口对数阈值调整,使小城市预测更精准。
数据应用与局限性
搜索指数为疫情研判提供了实时参考,例如北京交通拥堵指数回升与搜索热度下降同步,印证社会活动恢复趋势。但需注意:该指标非真实病例统计,无法替代官方流行病学调查。对于医疗资源挤兑风险评估,还需结合医院就诊数据与床位使用率综合判断。
当时的疫情浪潮已随时间推移成为历史,但这类基于大数据的预测模型为后续公共卫生事件响应提供了技术参考。你如何看待用互联网数据辅助疫情防控的价值与边界?