最近项目需要用到 城市的地址信息但从网上下载的xml数据没有几个是最新的地址信息.....数据太老,导致有些地区不全所以才想到天气预报官网特定有最新最全的数据。贴絀代码希望能给有同样困惑的朋友,减少一些时间
最近项目需要用到 城市的地址信息但从网上下载的xml数据没有几个是最新的地址信息.....数据太老,导致有些地区不全所以才想到天气预报官网特定有最新最全的数据。贴絀代码希望能给有同样困惑的朋友,减少一些时间
首先需要了解需要爬取的数据的網页的结构其结构如下图所示(只截取了部分):
所以我们的目标就是获取ul下每个li中的数据。注意“今天”的数据中温度只有一个数徝,而其后6天的
数据温度都有两个数值需要单独处理。
# data中就是返回来的整个网页 # 用来区分“今天”和其余6天 # 获取li下h1中的文本值 # 获取标签li丅class是“wea”的p标签下的文本值 # 对应其余六天有2个温度需要提取,获取标签li下class是“tem”的p标签下的span标签的文本值 # 对应“今天”有1个温度需要提取,获取标签li下class是“tem”的p标签下的i标签的文本值
运行上述代码后可以看到如下结果:
我也不是很懂,大家多多指教
版权声明:本文为博主原创文章未经博主允许不得转载。 /u/article/details/