字体反爬

字体反爬

点点

2021-03-29 09:04 阅读 463 喜欢 0

例如我们定义一个字体<1> 但是对应的svg显示为<5> ,那么肉眼看到的是5 ,通过源码或抓取得到的确是1。 之前的时候是通过一个字体文件,现在慢慢演变为动态字体,每次看到的都不同,所以现在我们需要对字体进行解析,得到最终的数据。

反爬

http://glidedsky.com/level/crawler-font-puzzle-1 ,关于字体反爬的一个课题。

目标地址

根据给予的地址,可以看到不同的源码与数字,那么我们可以通过控制台找到这种字体,通过页面中的base64来指定的字体文件。 先将base64 转为 ttf 文件

代码或工具都可以: https://www.motobit.com/util/base64-decoder-encoder.asp 工具转换。

代码转换(nodejs):

const base64str = xxxx由于太长,此处不写了;//data:font;charset=utf-8;base64, 之后的内容,不要逗号 const fs = require('fs'); fs.writeFileSync('./demo.ttf',Buffer.from(base64str,'base64')); 通过fontcreator软件打开后可以看到,字体展示与unicode标注的都是不同的。

现在,我还没找到除了ocr识别外的更好的办法,之前看文档有说可以从ttf中拿到映射关系的,不过没处理出来..能力有限。而且,这个我也没有使用ocr,直接使用了一个下标判断。

将ttf解析为xml ,并转为对象,然后获取下标,得到映射

const font = require('font-carrier'); const xml2json = require('xml2json');

//加载字体 let transFont = font.transfer('./demo.ttf'); let str = transFont.toString(); let json = xml2json.toJson(str); let obj = JSON.parse(json); let fonts = obj.svg.defs.font.glyph; let map = {}; //就目前来看,还没找到对应的映射关系,比较理想的是,根据下标,除去第一个,从0开始。 fonts.forEach((t, i) => { if (i>0) { let code = t.unicode;//4 let index = i - 1;//0 //对应的意思就是:给浏览器一个字符串4 ,显示出来是 0 。 map[code] = index; } }) console.log(map); 剩下的就是一页一页的抓取,然后获取ttf并解析,最终进行匹配了..

转载请注明出处: http://sdxlp.cn/article/zitifanpa.html


如果对你有用的话,请赏给作者一个馒头吧 ...或帮点下页面底部的广告,感谢!!

赞赏支持
提交评论
评论信息(请文明评论)
暂无评论,快来快来写想法...
推荐
当我们换了新电脑后,怎样可以把微信的聊天记录迁到新电脑上哪?伙伴来这里我教你,简单实用。
通过pm2来实现nodejs应用的集群,不过之前没做session共享,导致.. 登录不上啊 啊啊啊,无奈,又重新对redis进行了集成。 以下记录下自己集成redis 以及实现pm2 的集群管理的过程。 自己项目的整体结构是这样组成的:nodejs + express + mysql + pm2
为什么要读取图片呢?有一大堆的ppt文件,里面全是图片,想将这些图片全部拿到,然后存储在数据库中,在线上预览,一张张的保存很是麻烦。 找了几个文档都是读取pptx,没有读取ppt的怎么办,先转为pptx ,于是就有了批量将ppt格式转为pptx格式的文章...
嗯很多小伙伴私信小编,说是推广劵不会使用,大数据时代有非常多的推广平台与渠道,以后赚钱的赛道将是多方面线下与线上的多平台的互动,小红书是一款非常受欢迎的社交电商平台,拥有着庞大的用户群体和优质的内容创作者。对于品牌主来说,小红书是一个非常好的推广平台,可以帮助品牌主快速地提升品牌知名度和销售额
智能手机的微信是目前受众用户群体广泛的社交平台,现在通过微信联系,然后微信上的数据也是非常重要的,无论是聊天记录的文字、语音、图片还是视频都是非常重要,如果微信聊天语言误删除怎么恢复呢?那么有什么方法可以帮你恢复呢?
智能化的时代,上班打卡必备神器,再也不怕扣钱了
手机是我们常用的生活工具,给手机增加一个密码不安全,给手机软件再增加一个密码就更加安全了,很多用户再使用手机的时候都想要知道荣耀手机怎么给软件加密码,下面就让小编给小伙伴们介绍一下给软件加密码的方法。
智能化的时代,当微信的出现,QQ聊天软件现在基本上已经沦为工作与游戏的专用了,用久了之后我们还是建议时不时清理一下没用的聊天记录,毕竟现在这两款软件已经升级为“3A”大作了,电脑里除了视频照片就属QQ/微信占用空间最多。当然我们也可以选择备份聊天记录,这样一来换电脑或者有需要都可以直接完全备份,下面就跟着小编一起来看看具体如何操作吧。