|
首先,特征的选取,方法不同当然,要先说,对于那些无论从公众角度还是从学术角度都广泛认同的特征,并不在此列,例如—关键词的命中。那么两个公司从自己不同的想法和用户需求角度,延伸出了不同的特征。例如,谷歌的用户分布在世界各地,那么语言以及地域的特征就变得尤为明显,中国人就给中文的网页,法国人就给法语的网页,当然,即使大家都用英语搜索,那么不同地域的用户看到的结果也大不相同。而百度,由于建立初期的目标明确为中文市场,那么地域及语言的热症就会在意的很少。再比如,谷歌有个Gmail的账号体系,而百度有百度产品体系,例如:贴吧,文库等等,那两者所能获得的用户的个性化标签也就截然不同,那由于两家的自身定位不同,最终获取的特征会不尽相同。其次,两家使用特征的方式不一样我们这里只是进行一个概念的科普,目前利用特征的主要途径有两种:1:人工规则;2:机器学习。两者最大的区别在于,前者的规则制定主要是靠开发人员拍脑门决定的,后者的规则,则是由精通统计学方法的机器算出来的。当然,这两种方法各有利弊,人工制定的规则更加精准,但是相对而言,由于人为的因素,会显得有些武断,这会导致后期变得复杂,庞大,灵活性不够;机器的学习,更加贴合世界的数据,但是需要通过大量的标注进行数据的采集,并且,对于比较罕见的查询,由于没有历史数据,会显得比较生硬。这样看来,即使两家公司用的是完全相同的特征,使用的方法也不大可能100%相同;都用机器,那么数据的标注和优化标准会不同;如果都用人工制定规则,那么具体规则也会不同。最终的叫焦点,那就是用户的真实需求。从这个角度来说,百度还真的不是更懂中文,而是他们更懂中国网民,尤其,中国的大部分网民,还是草根的!总结下,谷歌对于多语言多地域的搜索会更好,而百度更能够满足草根网民的基本需求。但是追起根源,依旧是有绝大部分的用户需求来决定的! |
|