字体反爬

字体反爬

点点

2021-03-29 09:04 阅读 440 喜欢 0

例如我们定义一个字体<1> 但是对应的svg显示为<5> ,那么肉眼看到的是5 ,通过源码或抓取得到的确是1。 之前的时候是通过一个字体文件,现在慢慢演变为动态字体,每次看到的都不同,所以现在我们需要对字体进行解析,得到最终的数据。

反爬

http://glidedsky.com/level/crawler-font-puzzle-1 ,关于字体反爬的一个课题。

目标地址

根据给予的地址,可以看到不同的源码与数字,那么我们可以通过控制台找到这种字体,通过页面中的base64来指定的字体文件。 先将base64 转为 ttf 文件

代码或工具都可以: https://www.motobit.com/util/base64-decoder-encoder.asp 工具转换。

代码转换(nodejs):

const base64str = xxxx由于太长,此处不写了;//data:font;charset=utf-8;base64, 之后的内容,不要逗号 const fs = require('fs'); fs.writeFileSync('./demo.ttf',Buffer.from(base64str,'base64')); 通过fontcreator软件打开后可以看到,字体展示与unicode标注的都是不同的。

现在,我还没找到除了ocr识别外的更好的办法,之前看文档有说可以从ttf中拿到映射关系的,不过没处理出来..能力有限。而且,这个我也没有使用ocr,直接使用了一个下标判断。

将ttf解析为xml ,并转为对象,然后获取下标,得到映射

const font = require('font-carrier'); const xml2json = require('xml2json');

//加载字体 let transFont = font.transfer('./demo.ttf'); let str = transFont.toString(); let json = xml2json.toJson(str); let obj = JSON.parse(json); let fonts = obj.svg.defs.font.glyph; let map = {}; //就目前来看,还没找到对应的映射关系,比较理想的是,根据下标,除去第一个,从0开始。 fonts.forEach((t, i) => { if (i>0) { let code = t.unicode;//4 let index = i - 1;//0 //对应的意思就是:给浏览器一个字符串4 ,显示出来是 0 。 map[code] = index; } }) console.log(map); 剩下的就是一页一页的抓取,然后获取ttf并解析,最终进行匹配了..

转载请注明出处: http://sdxlp.cn/article/zitifanpa.html


如果对你有用的话,请赏给作者一个馒头吧 ...或帮点下页面底部的广告,感谢!!

赞赏支持
提交评论
评论信息(请文明评论)
暂无评论,快来快来写想法...
推荐
云端恢复微信聊天记录,现在的手机都是支持云端数据的,对于部分手机来说,内存不足可能就需要来备份,备份后如何后期查看,接下来就让小编带着小伙伴们一起去看看有关微信云端恢复聊天记录的相关消息。
方法很简单,一学就会,来看看下面文章就知道 了,希望能够帮助到您。
电脑普遍的当下,很多小伙伴们在买的时候,都会选择笔记本,现在大部分新款笔记本电脑都是Windows 11系统,有些用户遇到了自动安装软件问题,想知道如何解决,接下来小编就给小伙伴们介绍一下具体的操作步骤。
最近很多小伙伴都在找自己的微信图标更换方式,不修改所有桌面图标的情况下仅修改微信图标,那我们具体该怎么操作呢,怎么将微信图标修改成自己想要的样式?
随着科技的发展,钉钉的出现让很多的小伙伴们吃尽苦头,动不动的好忘记打卡,还得走回去再打,还有时间限制,动不动就罚钱,领导还会告诉小伙伴们,罚钱不是目的,目的是让小伙伴们养成好习惯,帮助小伙伴一起成长,嘿嘿,好东西来了,免费的呦!
现在智能化的时代,微信与QQ是最流行的聊天软件,但是咱们一直被吃内存而烦恼,个人建议进行备份后,再进行清理,现在小编教小伙伴们如何清理QQ的聊天记录。
近期很多小伙伴们给小编私信,问这些个问题,今天,小编给小伙伴们介绍同步电脑版和手机版微信的聊天记录的方法,希望对小伙伴们有所帮助。
微信是我们经常使用的软件之一,在pc端上怎么打开并找到其存储位置呢?