原标题:盼盼防盗门防不住的“李鬼”:百度要重拳出击了
又到了一年一度的“3·15”消费者权益保护日每年都会有很多企业在3·15上被点名批评,但也有很多企业因为一些山寨厂商蒙受不白之冤
这些山寨厂商往往用仿照品牌名的变体词通过搜索引擎进行推广,具有极强的欺骗性一不小心消费者就可能吃了亏。为此百度正利用人工智能技术打击五花八门的变体词,全面查处虚假违法互联网广告维护互联网安全和网民合法权益。
“变體词虚假广告”是投机者牟利的惯用伎俩该手段常通过替换某个字体、改变顺序等方式迷惑网民,例如将“朌朌防盗门”混淆形近的“盼盼防盗门”“平果维修”混淆同音的“苹果维修”,或在“App Store”设置关键词保护的情况下绕道“app-store”试图仿冒正规平台。
头痛的是“變体词虚假广告”具有很强的迷惑性,投机者们“钻汉语空子”的能力惊人百度提供的资料显示,基于现有系统品牌及变体规则的词库達到几十万还包括更大数量的关键词变体词、谐音词、关联词。通过百度的这份内容丰富的变体词限制关键词词库我们可以看到百度技术系统与巧妙利用丰富汉语词汇的投机者间存在着复杂的博弈关系。在这场猫鼠游戏中AI技术的作用更为显现,天平已经开始出现不可逆转的倾斜
据悉,百度针对变体词有专门的技术专利其中“一种授权信息的识别方法及装置”技术专利在2016年就得到了国家的权威认证。该技术通过解析获取预定网站的内容能够识别所述预定网站的内容中的徽标信息,并根据预定授权信息和所述徽标信息确定所述预定網站的合法性
“盼盼”防盗门的品牌保护就是一个典型的例子。此前有推广客户以“朌朌”进行推广,试图以假乱真“盼盼”防盗门百度技术系统监测到此情况后,自动升级添加“朌朌”的变体词据百度技术人员介绍,“盼盼”的品牌变体词十分常见但“盼盼”洇有很多重合度,如熊猫盼盼、盼盼食品还有盼盼防盗门等,所以技术会根据相关内容进行识别最后展示相应的搜索结果。
目前“盼盼”防盗门全名是“亚萨合莱盼盼门业”,因此在展示结果上会排在后面百度技术人员称,“品牌名称越短对技术的挑战越大。”隨着机器学习能力快速提升百度的变体词限制量也以指数级扩展。
数据显示2018年以来百度变体词虚假广告总数超过7亿,其中品牌变体词占到近30%庞大的变体词库量背后是打击压力的增大,同时也显现出百度AI赋能后的效果显著通过机器系统对发布者进行资格审查和内容审查是第一道防线,真正的难点在于在广告上线后的动态审查百度利用机器系统实现对95%以上的信息进行扫描过滤,每天过滤超过4.7亿条剩丅的5%的内容审查,百度还雇了上千人的队伍进行人工核查
“百度对虚假广告是零容忍。”百度内容安全中心的负责人强调“但人工筛選远远不够,百度AI技术的发展给我们提供了武器就像突然拥有了几亿双眼睛帮你看互联网上的信息,骗子的小聪明根本逃不过去在技術的支持之下,我们全面扩大变体词的策略从而有效保护品牌,使网络平台更加风清气正”
值得注意的是,百度变体词监管的策略也茬不断优化2018年以来百度依靠新体系下线了近2亿变体词物料。同时百度加大对变体词的打击力度。2018年2月北京假冒“苹果”维修第一案開出27万余元的罚单,百度进一步强化对“苹果维修”的品牌保护加强变体词限制力度,还增加了“部分搜索结果并非苹果官方维修店建议到苹果官网查询”的提示语。
业内人士表示此前全网品牌变体词占比巨大,对网民与品牌权益均造成了巨大的损害如今,百度通過AI技术专利的加持对品牌实现了有力保护,和既保障了品牌也保障了消费者的合法权益。