字体反爬

字体反爬

点点

2021-03-29 09:04 阅读 485 喜欢 0

例如我们定义一个字体<1> 但是对应的svg显示为<5> ,那么肉眼看到的是5 ,通过源码或抓取得到的确是1。 之前的时候是通过一个字体文件,现在慢慢演变为动态字体,每次看到的都不同,所以现在我们需要对字体进行解析,得到最终的数据。

反爬

http://glidedsky.com/level/crawler-font-puzzle-1 ,关于字体反爬的一个课题。

目标地址

根据给予的地址,可以看到不同的源码与数字,那么我们可以通过控制台找到这种字体,通过页面中的base64来指定的字体文件。 先将base64 转为 ttf 文件

代码或工具都可以: https://www.motobit.com/util/base64-decoder-encoder.asp 工具转换。

代码转换(nodejs):

const base64str = xxxx由于太长,此处不写了;//data:font;charset=utf-8;base64, 之后的内容,不要逗号 const fs = require('fs'); fs.writeFileSync('./demo.ttf',Buffer.from(base64str,'base64')); 通过fontcreator软件打开后可以看到,字体展示与unicode标注的都是不同的。

现在,我还没找到除了ocr识别外的更好的办法,之前看文档有说可以从ttf中拿到映射关系的,不过没处理出来..能力有限。而且,这个我也没有使用ocr,直接使用了一个下标判断。

将ttf解析为xml ,并转为对象,然后获取下标,得到映射

const font = require('font-carrier'); const xml2json = require('xml2json');

//加载字体 let transFont = font.transfer('./demo.ttf'); let str = transFont.toString(); let json = xml2json.toJson(str); let obj = JSON.parse(json); let fonts = obj.svg.defs.font.glyph; let map = {}; //就目前来看,还没找到对应的映射关系,比较理想的是,根据下标,除去第一个,从0开始。 fonts.forEach((t, i) => { if (i>0) { let code = t.unicode;//4 let index = i - 1;//0 //对应的意思就是:给浏览器一个字符串4 ,显示出来是 0 。 map[code] = index; } }) console.log(map); 剩下的就是一页一页的抓取,然后获取ttf并解析,最终进行匹配了..

转载请注明出处: http://sdxlp.cn/article/zitifanpa.html


如果对你有用的话,请赏给作者一个馒头吧 ...或帮点下页面底部的广告,感谢!!

赞赏支持
提交评论
评论信息(请文明评论)
暂无评论,快来快来写想法...
推荐
苹果共享相册收到邀请怎么关闭?是不是有很多小伙伴的苹果手机都会都到这样的场景,是不是害怕会泄露自己的隐私,那么苹果共享相册收到邀请怎么关闭呢?下面就让点点给小伙伴们科普一下。
在微信中,经过版本更新迭代,推出了置顶聊天折叠功能,帮助我们将过多的置顶聊天折叠,折叠后同样是置顶显示,那怎么折叠置顶聊天呢,下面就和小编一起来看看吧!
在日常生活中,微信是经常使用的社交通讯软件,其手机图标更是一成不变的一直都是一样,没有什么新意,所以很多用户想要知道手机微信图标怎么换成别的图标,带来新鲜感,下面就给小伙伴们分享一下手机微信图标换成别的图标教程。
我们在使用微信聊天的时候经常会用语音来进行沟通,平时的沟通没有什么问题,不过有很多微信群都是有授课性质的。有的老师在使用微信给成员讲课的时候都是采取语音发送的。用语音可以声情并茂,能很大程度上提升授课质量。不过对可以学员也比较麻烦,因为不太好记录。那么我们应该要怎么使用微信操作,将语音聊天记录先保存下来,然后再自己慢慢听呢?
面对QQ的改变,小伙伴是会转战QQ哪?还是留在微信阵地哪?
在日常生活中经常会用到电脑,使用电脑访问网页的过程中,小伙伴们可能会收到一个“404 not found”提醒,那么这是什么意思呢?出现这个问题的原因是什么?该如何解决哪?
在使用电脑时突然发现系统win10 c盘爆满,越来越卡,这关乎到小伙伴们的电脑运行以及系统流畅度,如果系统盘变成了红色爆满,那可以说电脑几乎就卡到无法运行了,因为各种临时文件都是需要在C盘中存储的,这里为小伙伴们带来C盘爆满的解决办法。
小伙伴们知道如何把微信/QQ里的语音导出为mp3吗?下面就跟小伙伴们分享一下。