Algorithm 版 (精华区)
发信人: Lerry (想不开·撞树), 信区: Algorithm
标 题: 技术的胜利(2)
发信站: 哈工大紫丁香 (2002年06月05日17:30:27 星期三), 站内信件
技术的胜利
本报记者 肖春江
----------------------------------------------------------------------------
----
十破一立
百度生意做得好,不只缘于其产品好,市场有需求,还有李彦宏的市场推广手段。
给人印象最深的就是,其推出的“中文搜索引擎十大误区”言论和“本土化”服务标准
。
2000年6月,随着中文搜索引擎的热卖,李彦宏推出“中文搜索引擎十大误区”概念,为
其独家的中文搜索产品从舆论上鸣锣开道:
误区1:网站目录就是搜索引擎
搜狐、新浪等公司开发的网站搜索服务并不是真正的搜索引擎,而是基于网站的目录,
即互联网上每一个网页的每一个词都被搜索引擎所收录。
误区2:搜索引擎就是门户站点
搜索引擎完全可以为内容提供商、门户网站提供专业的搜索服务,而不必直接面对网民
,是一种典型的ASP模式。
误区3:搜索引擎的概念已经过时
互联网搜索引擎是一个全自动的软件服务,非常容易在搜索结果网页中插入具有很高针
对性的广告,所以一旦投入运转,其收益与成本的比率远高于一般的网站内容服务。在
中国,搜索引擎是排在电子邮件之后的第二大互联网应用。
误区4:中文搜索引擎技术已经成熟
中文和英文的搜索引擎都不成熟。中文搜索引擎技术出现的时间并不比英文的晚多少,
然而发展速度却远远赶不上英文。两者的差距主要体现在数据库的规模上。
误区5:中文搜索引擎速度很慢
某些中文网站的网页搜索服务外包给了一些服务器在境外的应用服务提供商(ASP),如
AltaVista或Google等, 由于用户搜索需要占用国际出口带宽,因而速度较慢。
误区6:中英文混合检索词是不被支持的
许多网页搜索服务不能对“MP3”、“甲A”、“F-1一级方程式”等中英混合查询做出恰
当的反应,是技术还不到位的结果。中英文混合检索词完全可以实现。
误区7:中文搜索引擎的相关性无法与英文相媲美
中文与英文最大的不同之处在于中文有“词”的概念,检索字串与网页中文字的简单匹
配并不见得就是语义上的匹配;要想提高中文搜索的相关性,必须结合中文“词”和中
文“字”,并使用一些先进的算法,如新一代信息检索(IR)算法、超链分析(Link A
nalysis)等。中文搜索也有许多英文搜索望尘莫及之处,如中文网页极少有针对搜索引
擎的欺骗(Spamming)行为,中文没有单复数、时态等的变化,大多数先进的算法也完
全适用于中文。
误区8:用户要找的信息在网上不存在
大多数的中文搜索引擎网页数据库较小,收集上百万的就算大的了;另外很多搜索引擎
不支持新的中文编码标准,如GBK,所以许多网上存在的信息无法找到。
误区9:搜索引擎数据更新最快要30天
对于那些依靠境外服务器提供搜索的网站来说,这也许是对的;百度搜索整个中文网页
的数据库可以最快每天更新一次。
误区10:搜索引擎不能查找动态生成的网页
目前世界上没有一家主要的搜索引擎支持动态网页,因为大多数负责搜索网页的蜘蛛软
件不敢去碰动态网页,怕被变化无穷的动态系统黑洞吸进去出不来。解决动态网页查找
的问题已经是人心所向。
提出问题的目的,是为了解决问题,更确切地说,是为百度的产品找准方向。李彦宏紧
接着去打“本土化”牌进行市场造势。在本土化方面,他强调:第一,对于外包给了一
些服务器在境外的应用服务提供商的用户,百度的本土服务器解决了用户搜索需要占用
国际出口带宽而影响速度的问题。其次,适合中国国情,比如在语言处理上,中文与英
文有很大的区别,英文没有“词”的概念,但中文“词”的概念是很突出的,所以百度
对中文搜索引擎的开发首先是基于“词”的开发。第三,具有“个性化”特色,百度可
以根据不同的要求进行定制不同的功能的产品,且能对服务进行即时更新。
新浪网就是因此“迷恋”上了百度。百度搜索引擎是第一个商业化的中文互联网搜索引
擎,一段时间内还会在中文搜索引擎市场上保持技术优势。但美国AltaVista、Google、
Excite等搜索引擎目前都在积极开发汉化产品,向中国进军。这是百度的主要竞争对手
。李彦宏的战略、战术多是瞄准它们。
只做ASP
百度搜索引擎不是单纯卖软件,也不是一个网站。它是一个搜索引擎ASP。“我们提供服
务器、带宽、软件、维护和升级,用户只要做一个界面,再不需要做其他更多的事情。
这样一套系统和服务,最低消费一年15万美元。”李彦宏说。
“根据美国的经验,网站搜索引擎外包是一个趋势,也是一个比较成功的模式。既做门
户又做技术是一件很累的事情,两边都做不好。”在李彦宏眼里,网站与搜索引擎的关
系是一个产业链条的专业分工的问题。
“雅虎是所有早期互联网公司,包括Excite、Lycos、AltaVista和Infoseek在内唯一一
个没有自己开发全文检索网页级搜索引擎技术的公司,这就使雅虎在成本上比其他公司
更低,因此最早开始赚钱。”
雅虎在1996年决定不再自行开发搜索引擎,而选用Inktomi公司来为自己提供后台技术支
持(后来换为Google)。“搜索引擎是一个技术含量非常高的产品,需要大量投入、不
断创新,而外包出去,找专门的搜索引擎公司来做,就大大节省了开支。”李彦宏认为
国内网站也应该走雅虎这条路。当然,这就为他创造了市场。
现在百度数据库拥有3000万网页数据。由于百度按照合作伙伴的访问量进行收费,访问
量越大,百度收入就越高。“我们希望能接访问量比较大的网站,比如说新浪一天3400
万的访问量,几十家小网站加起来的访问量也没有这么多。我们的定位主要是对大的网
站。所以,我们并不追求网站的数量,而是网站的质量。”
百度关注的不是现在这几家门户网站,而是更多地把目光投向了整个中国的互联网领域
,李彦宏称这是最根本的东西。“许多传统企业也在做自己的网站,整个国民经济对于
互联网的依赖会越来越强。而我们做的是互联网最基本的一些应用——信息的检索和传
递,这个市场相当大。”李彦宏说,“当然,不可否认,一开始选择去做门户,还是因
为门户名气比较大,对以后的市场会有帮助。况且他们的确重视在这方面的投入,能买
你的东西。”
百度会陆续推出一些更适合企业用的和适合于垂直门户的搜索引擎,下一步将把目标放
到传统企业而不是网站。但是,从现在的市场看,应该说这种算盘打得还稍微有点早。
尽管如此,还有眼前的生意等着。“根据我们2000年签单的情况,我们预计2001年的收
入增长至少是10倍。”李彦宏说。
采访手记:李彦宏不让员工将宠物带进办公室,这违背了硅谷企业的习惯;百度坚持以
技术起家,凭实在的本领闯荡,却深得硅谷企业的精髓。当李彦宏说百度刚刚创业一年
就占领了60%~70%的市场份额时,记者看到他的下属没有怀疑、游移或不以为然的眼光
。2000年的9月,百度又拿到1000万美元的风险投资。
一直不好意思把“成功”这顶帽子送到.com公司的头上,怕说大话的人暗笑记者傻帽;
也怕身边的人说自己闭着眼说瞎话。现在终于在.com背后找到了一个可以戴此帽子的人
。尽管是.com“养活”了百度,李彦宏的成功,对中国的喧嚣的.com业创业者或多或少
还是一个讽刺。但对于目前国内的创业者,这点不是很重要,重要的启示仍是提出老问
题:
技术如何转化成有生命力的产品?科技人员如何创业?在李彦宏回国下海之前,国内也
有大批的技术人员弄潮互联网。互联网技术也不仅搜索引擎一项,为什么都没弄出像这
个从硅谷回来的小伙子那样的名堂来?
据说张朝阳曾多次要拉李彦宏加盟搜狐。李彦宏则坚持做ASP,不做网站。“挣钱不是整
个互联网的特点,那是商业的特点。”李彦宏说。新经济和传统经济都要有稳固的技术
驱动才能发展。在.com业界,创业者往往被钱障目,匆忙中忘记了企业的内功—技术创
新;在传统产业领域,创业者又往往难逃技术的圈囿,在对市场想当然的基础上期望心
想事成。如果双方的精英结合一下,味道会不错。
“我有一个理念:搜索引擎这个东西不应该成为一个网站特色的东西,它并不能够使一
个网站跟另外一个网站区别开来。它是一个公共设施,不管是哪一个网站,也不管是哪
一个企业的内部网,都应该有搜索功能。就像电一样,高级酒店也好,一般的房间也罢
,什么样的房间都应该有电。”李彦宏的这个想法,也算是技术和市场兼顾吧?
--
当一个女孩儿觉得她不太容易了解那个男人的时候,她会爱他。
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 天外飞仙]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.435毫秒