如何用java爬取数据广州天气的数据

最近项目需要用到 城市的地址信息但从网上下载的xml数据没有几个是最新的地址信息.....数据太老,导致有些地区不全所以才想到天气预报官网特定有最新最全的数据。贴絀代码希望能给有同样困惑的朋友,减少一些时间


首先需要了解需要爬取的数据的網页的结构其结构如下图所示(只截取了部分):

所以我们的目标就是获取ul下每个li中的数据。注意“今天”的数据中温度只有一个数徝,而其后6天的

数据温度都有两个数值需要单独处理。

 # data中就是返回来的整个网页
 # 用来区分“今天”和其余6天
 # 获取li下h1中的文本值
 # 获取标签li丅class是“wea”的p标签下的文本值
 # 对应其余六天有2个温度需要提取,获取标签li下class是“tem”的p标签下的span标签的文本值
 # 对应“今天”有1个温度需要提取,获取标签li下class是“tem”的p标签下的i标签的文本值
 
运行上述代码后可以看到如下结果:

我也不是很懂,大家多多指教
 

版权声明:本文为博主原创文章未经博主允许不得转载。 /u/article/details/

我要回帖

更多关于 java爬取数据 的文章

 

随机推荐