根据比例的基本性质:两内项之
你對这个回答的评价是
本项目的所有代码和相关文章僅用于经验技术交流分享,禁止将相关技术应用到不正当途径因为滥用技术产生的风险与本人无关。 文章仅源自个人兴趣爱好不涉及怹用,侵权联系删
上一次简单罗列了字体反爬的前世今生()
和上一篇文章分析的是一样的不信的话我们再看一下详情页:
根据上篇文章分析,我们直接查找文中如何对字体进行处理或者说加密
我们可以看到票房数据被替换了是被stonefont这个@font-face的名称给替换了,我们去搜索这个stonefont
我们通过这个woff地址去下载woff文件用FontCreator打开,看到这样
刷新动态的字体文件结合动态的字体坐标,符合上一篇所说的字体反爬第三阶段我们这佽采用KNN的思想去解决它!
如果不信的话,我们可以多找几个字体文件用python的第三方库matplotlib,分别对同一个数字根据坐标测试一下:
# 建立映射將数字和对应的编码建成字典形式: # 新抓取文字文件.woff,用来做映射测试 # BytesIO 是指在内存中操作二进制 # 采集数据并替换获取正确数据
完美抓到票房金额。光整理都整理了两天小小爬虫需要学的东西太多了。
根据比例的基本性质:两内项之
你對这个回答的评价是
下载百度知道APP,抢鲜体验
使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案