Google百度等搜索引擎采用的技术(1)

  现代的搜索引擎如Google,Yahoo,百度,Live,SoSo,Ask,有道,搜狗等等,采用的技术基本都差不多,今天看到一篇这方面的文章,比较专业,详细介绍了搜索引擎的技术细节。

一、搜索引擎总体介绍

  1.1,搜索引擎定义

  “搜索引擎”技术,完全来源于历史悠久的全文检索技术。
  “搜索引擎”从字面上可拆分为“搜”、“索”、“引擎”三个含义。
  “搜”就是大量信息的抓取,抓取回来后的信息进行智能提取、排重、质量分析等处理。
  “索”就是大量处理后信息的存储、信息排序、快速查询等。
  “引擎”就是指系统不但能存储亿级的数据,而且还能有巨大的并发处理能力,这样的系统才有资格被叫着“引擎”。

  1.2,搜索引擎和移动搜索引擎

  搜索引擎也可以看成为“专家系统”,通过把数百亿互联网网页所提供的信息,作为其庞大的“知识库”,通过用户的输入词,找到相关信息。

  从技术上来讲,基于手机的移动搜索引擎,在其技术上和搜索引擎是完全一样的。

  用户查询信息的媒体,由PC被手机替代,可以随时随地提供搜索服务,用户更方便地进行信息查询。并且,手机的用户群体是远大于PC用户群体,所以,移动搜索引擎肯定是搜索引擎领域未来发展的重点和方向。

  1.3)搜索引擎主要核心技术
  搜索引擎主要核心技术为:
  (1)中英文分词语言处理;
  (2)排序算法;
  (3)网络爬虫;
  (4)查询/存储技术

  开发搜索引擎系统主要涉及到的具体技术为:
  (1)http网络协议.
  (2)多线程技术.
  (3)socket通信.
  (4)高效服务端程序开发.

(论文作者:屈波)

收藏到QQ书签
0 我顶!
上一篇(Previous posts): 蓦然回首忆童年往事



2 条评论(comments)

(提示:以下内容由网友发表,评论包含的网址未经验证,请保持警惕!)
  1. 小墨

    额……是论文……我以为原创

  2. Yacca

    论文才是经过研讨的好东西啊

发表评论(Leave a comment):

(网友评论仅供网友表达个人看法,并不表明一亿度同意其观点或证实其描述)

(含人身攻击、广告、恶意网址、机器发送的评论,统统删除)

【返回互联网络】 【返回首页

Copyright © 2008-2009 YiYidu Inc. All rights reserved.
44 queries in 0.257 seconds.