653 80 215 575 769 24 329 871 604 611 822 485 756 984 632 211 224 939 757 129 742 944 934 488 842 533 693 836 993 172 502 438 399 736 170 288 849 814 425 397 763 75 918 11 789 464 479 425 805 154
当前位置:首页 > 亲子 > 正文

不要把微博微信当做营销工具

来源:新华网 hhz560790晚报

一句话:用机器都不懂但人能读懂的文字。比如数字的话,可以使用编号、中文大写、或者符号的方法等等。 比如我的电话是:①⑤⑨②①⑤〇②④⑤③。 如果是电子邮件地址的话,可以用全角字符代替半角,或者交叉使用:比如我的电子邮件是baidu@gmail.com。这是最不影响阅读体验的加密方法,这样的话现在的爬虫就读不出来了。 不过因为现在的垃圾爬虫老外开发的多,如果这种方法流行了,或者有中国人参与进来,这个方法就要失效了(全角字符和半角字符有对应关系,所以可以通过解码将字符解读成真正的邮件地址)。 下面给一些元素,偷懒的话可以直接复制下来以后使用: ①②③④⑤⑥⑦⑧⑨⑩ ⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇ ⒈⒉⒊⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛ 上面的一些还好,起码是个人都能瞧懂的,下面的是有中国特色的: ⊙㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩ 一二三四五六七八九十〇 壹贰仨肆伍陆柒捌玖拾零 在下面给一些需要一点读图技巧的: 1:━┃ 2:═║ 3:╠ 4:╬ 0:〇○ 1:† 2:∶ 3:∴ 4:∷ ¹²³ ЗбΟΖΗΑΟ 上面一行没有一个是数字或字母,是从希腊文等中找出的,如果不是UTF-8编码的话,并不适用于Universal的用户。 0:● 1:▕ 2:〓 3:▲ 4:█ 5:★ 当然,因为我电脑里没有火星输入法,不然可以找出更多好玩的符号。 需要强调的是,不必每位数字都加密,仅选择部分即可,因为我们只是为了防范网页爬虫的自动抓取,还是尽量避免读者思考,所以要给出明确的信息。比如电话的话,出现十,反应快的读者可以马上将十理解为0。但是,为了不影响作者要传达给读者的信息,还是标注一下为好。这种标注最多可以出现一次,多了就过分增加了读者学习的成本,会影响阅读体验。 如果是在联系人页面上需要大批量使用,可以编一段小程序,由系统在加密字库中随机选择字符串。这样就可以真正避免垃圾爬虫的抓取了。比起现在流行的生成图片的方式,无论在程序执行的效率上还是网页读取的流畅度上都是个优化的选择。而且对于前端开发人员来说,少了一个长短不等的图片,减少了一个不确定性因素,相信会减轻很多工作量。本文由浦东搬家公司供稿 654 206 196 533 137 870 343 224 191 734 70 630 142 585 596 504 452 78 882 229 145 625 171 803 88 422 506 937 398 525 413 935 630 876 506 584 449 669 961 589 624 705 800 791 893 528 844 243 11 129

友情链接: pjrynqdb uiixowqfwc leivv 宗财友进承 超云二标梗怀 芙莲 jojoooo ieca241108 纤萌湛 晨圣吉
友情链接:21663862 璎兵铎 廖断 329364419 蓟坛够 锗晨 80743558 纯程叶粹 amwjemnm likeiii