用户在进行搜索的时候,其实他在心目中是有比较清晰的需求的,整个过程是一个寻找答案的过程,从最初的需求表达,到他最后找到答案。
尤其是在移动互联网时代,在手百这样一个封闭的app里头,我们能够track到他的每一步。这就给我们提供了足够多的训练的数据,所以我们可以有很高的识别率。
我们不仅仅能够有很高的语音识别率,实际上整个过程使得我们能够构建出来最好、最丰富的知识库。我们知道从需求到结果,到底是一个什么样子,这些东西都是我们非常有价值的东西。
但是在别的场景里头,有时候即使你技术特别好的话呢,可能也不能够争得过别人。比如你随便拍一件商品去识别,淘宝识别出来的结果,比我们现在拍照搜索的结果要更加精确。因为大量的商品库在他那里头,商家都把数据都给标注好了。那么这对我们的启示是什么?
除了我们自己已经有的这些个大量丰富的query到最后用户行为数据之外,我们也应该积极的到外头去找那些对我们有价值的相关的数据。让他们上到百度的平台上来,我们利用这些数据,打磨我们算法,做出最优秀的用户体验和产品和服务来。