很多人难以想象的是,百度搜索每天要响应来自138个国家或地区的60亿次搜索请求,这意味着中国平均每个网民一天要使用百度搜索近8次。
很多人难以想象的是,百度搜索每天要响应来自138个国家或地区的60亿次搜索请求,这意味着中国平均每个网民一天要使用百度搜索近8次。其中,有大部分广告信息被提交,百度则需要实时对这些广告信息进行客户资质审核、物料信息审核等全面核查。可以说,百度的大数据审查技术随时都在与非法广告客户斗智斗勇。
记者了解到,百度广告系统平均每天送审的文字广告为4.7亿条,相当于每秒钟就有5000条广告需要过审。面对如此巨大的审核量,人工远远不能满足,为此百度开发了一套“雷达系统”,用大数据来进行审查。目前,百度能做到机器自动审核率达到95,同时机器还能将平均每天30万条的图片广告过审核处理一半以上。
除了对客户身份的核验,对客户所提供物料的审核也是重中之重,一些不法广告客户总是通过各种投机取巧的办法躲避审核,广告文案的文字“变体”即是最常见的一种,如将“微信”变体为“微_信”,“金蝶”变体为“金碟”,“优步”变体为“【U】步”……对此,百度直接通过建立匹配模型,利用变体系统对变体的组合形式智能化匹配,对部分变体形式进行主动防控。
除了“冲量”,越来越多广告主也在运用各种新兴技术来兴风作浪,为此百度的大数据审查技术体系也在不断升级。如一些不法广告主会在Flash广告中嵌入第三方外链或php脚本内容,控制作弊Flash物料根据IP、时间、设备等不同状态因素进行跳转。简单来说,在审核时看到的是钢材的广告,到了晚上或者坐仨小时火车,在相同的网页相同的地方就会看到低俗广告。
为此,百度成立了专项组,通过升级Flash物料的代码解析模块,让机器主动发现其中“不应出现”的外链或php脚本内容,整体上从低俗、虚假、欺诈、高危信息等多个维度进行层层把关。据悉,截至目前百度共封禁Flash账户超1.5万个,涉及Flash物料数超570万条,其中机器拒绝违规Flash物料通过共近60万条。
《不良广告PK黑科技百度下重手打击》相关参考资料:
百度pk腾讯、百度被黑、周杰谈尔康黑百度、打击农村黑恶势力、打击黑广播、湛江打击黑社会、打击 黑救护车、不良软件黑名单、深圳海关打击黑油点