网络营销论坛

 找回密码
 注册(请使用中文注册)

一键登录:

头条号:秦韵莞香台湾齿条无线通讯模块东莞网络推广
嘉创智能引擎推广研磨齿条东莞网络推广外包东莞品牌策划
查看: 1001|回复: 4

[推广技巧] 2013年百度搜索引擎工作原理

[复制链接]

该用户从未签到

发表于 2014-2-3 10:10:37 | 显示全部楼层
//@网络营销论坛:转发微博
6 e" Q  J7 L' p" o  M: }# ^; @! U( O, [$ }
  I$ R# ^+ i- B4 |" ?' i& A& J
                               
登录/注册后可看大图
来自 一虎八奶 的新浪微博
回复 支持 反对

使用道具 举报

  • TA的每日心情
    开心
    5 天前
  • 签到天数: 1656 天

    [LV.Master]伴坛终老

     楼主| 发表于 2013-9-6 08:32:38 | 显示全部楼层 |阅读模式

    马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

    您需要 登录 才可以下载或查看,没有帐号?注册(请使用中文注册)

    x
    根据上图解释的搜索引擎工作原理,笔者要一步一步为大家解释,讲解。进行完整的seo培训服务。  K& c+ ^4 F, D; L. D
    1、www:我们的互联网,一个巨大的、复杂的体系;
    * b5 h; g( ~+ I( n2 ^7 Q2、搜集器:这个我们站长们就都熟悉了,我们对它的俗称也就是蜘蛛,爬虫,而他的工作任务就是访问页面,抓取页面,并下载页面;
    % e; w9 N, E. c/ X4 y5 ^

    seo

    seo

    ; ?) H7 L+ D- b& Y7 J% K! b3、控制器:蜘蛛下载下来的传给控制器,功能就是调度,比如公交集团的调度室,来控制发车时间,目的地,主要来控制蜘蛛的抓取间隔,以及派最近的蜘蛛去抓取,我们做SEO的可以想到,空间位置对SEO优化是有利的;" H9 S4 }$ N- h* ^  V) H
    4、原始数据库:存取网页的数据库,就是原始数据库。存进去就是为了下一步的工作,以及提供百度快照,我们会发现,跟MD5值一样的URL是不重复的,有的URL有了,但标题就是没有,只有通过URL这个组件来找到,因为这个没有通过索引数据库来建立索引。原始数据库主要功能是存入和读取的速度,以及存取的空间,会通过压缩,以及为后面提供服务。网页数据库调度程序将蜘蛛抓取回来的网页,进行简单的分析过后,也就是提取了URL,简直的过滤镜像后存入数据当中,那么在他的数据当中,是没有建立索引的;
    5 r' N* y" Y! Q% l' f5、网页分析模板:这一块非常重要,seo优化的垃圾网页、镜像网页的过滤,网页的权重计算全部都集中在这一块。称之为网页权重算法,几百个都不止;
    # a* b9 y$ Q. [. D6、索引器:把有价值的网页存入到索引数据库,目的就是查询的速度更加的快。把有价值的网页转换另外一个表现形式,把网页转换为关键词。叫做正排索引,这样做就是为了便利,网页有多少个,关键词有多少个。几百万个页面和几百万个词哪一个便利一些。倒排索引把关键词转换为网页,把排名的条件都存取在这个里面,已经形成一高效存储结构,把很多的排名因素作为一个项存储在这个里面,一个词在多少个网页出现(一个网页很多个关键词组成的,把网页变成关键词这么一个对列过程叫做正排索引。建议索引的原因:为了便利,提高效率。一个词在多少个网页中出现,把词变成网页这么一个对列过程叫做倒排索引。搜索结果就是在倒排数据库简直的获取数据,把很多的排名因素作为一个项,存储在这个里面);2 M$ |9 q: y! [7 B! ^1 ^. p7 ?
    7、索引数据库:将来用于排名的数据。关键词数量,关键词位置,网页大小,关键词特征标签,指向这个网页(内链,外链,锚文本),用户体验这些数据全部都存取在这个里面,提供给检索器。为什么百度这么快,就是百度直接在索引数据库中提供数据,而不是直接访问WWW。也就是预处理工作;8 e( H9 y( v& S# ^) U! \% U6 O
    8、检索器:将用户查询的词,进行分词,再进行排序,通过用业内接口把结果返回给用户。负责切词,分词,查询,根据排名因素进行数据排序;
    6 I1 `0 r; {0 L% V" L/ W9、用户接口:将查询记录,IP,时间,点击的URL,以及URL位置,上一次跟下一次点击的间隔时间存入到用户行为日志数据库当中。就是百度的那个框,一个用户的接口;
    1 ^: w0 N! e1 c# S8 Q) L10、用户行为日志数据库:搜索引擎的重点,SEO工具和刷排名的软件都是从这个里面得出来的。用户使用搜索引擎的过程,和动作;
    + U# ~) E4 C' L( T; p" h11、日志分析器:通过用户行为日志数据库进行不断的分析,把这些行为记录存储到索引器当中,这些行为会影响排名。也就是我们所说的恶意点击,或是一夜排名。(如果通过关键找不到,那么会直接搜索域名,这些都将会记入到用户行为数据库当中);) N( ~+ C2 Z8 M0 u1 S+ z* [4 V5 i
    12、词库:网页分析模块中日志分析器会发现最新的词汇存入到词库当中,通过词库进行分词,网页分析模块基于词库的。
    # e& r# X' `3 @5 M- k* A) K3 t强调:做seo优化,做的就是细节……
    & d$ m8 p; C! Y2 D0 z$ }& I" ~$ D+ l7 D) D# w$ B

    9 P( f9 g: h0 ]3 }; G9 ^                               
    登录/注册后可看大图
    该贴已经同步到 junzi124的微博
  • TA的每日心情
    郁闷
    2013-11-6 14:20
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    发表于 2013-10-7 14:44:49 | 显示全部楼层
    空间位置对SEO优化是有利的
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2014-1-2 10:39
  • 签到天数: 79 天

    [LV.6]常住居民II

    发表于 2013-11-11 13:24:46 | 显示全部楼层
    长见识。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    2014-1-13 08:33
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2013-11-20 09:16:00 | 显示全部楼层
    学习咯
    回复 支持 反对

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条



    QQ|Archiver|手机版|小黑屋|东莞网站建设|网站地图|网络营销论坛 ( 粤ICP备17101804号 

    GMT+8, 2019-12-11 00:55 X3.2

    Powered by Discuz!

    快速回复 返回顶部 返回列表