<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>网站运营 &#187; 综合资讯</title>
	<atom:link href="http://www.lvyanchao.com/fenlei/zonghezixun/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.lvyanchao.com</link>
	<description>网站推广，搜索引擎优化和营销（seo&#38;sem）</description>
	<lastBuildDate>Mon, 04 Apr 2011 14:22:46 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.1</generator>
		<item>
		<title>Nokia打算跟进WP7平台</title>
		<link>http://www.lvyanchao.com/nokia-win7/</link>
		<comments>http://www.lvyanchao.com/nokia-win7/#comments</comments>
		<pubDate>Wed, 09 Jun 2010 05:57:20 +0000</pubDate>
		<dc:creator>吕彦超</dc:creator>
				<category><![CDATA[综合资讯]]></category>
		<category><![CDATA[Nokia]]></category>
		<category><![CDATA[WP7平台]]></category>

		<guid isPermaLink="false">http://www.lvyanchao.com/?p=296</guid>
		<description><![CDATA[Mobile-Review.com的老板Eldar Muntazin泄露了一张诺基亚公司的幻灯片，表明诺基亚对Windows Phone还是有相当兴趣的。 该幻灯片的主要内容就是诺基亚对2010年度在应用程序、OVI服务和系统平台等领域的的发展规划，让人惊讶的是诺基亚居然将Windows和本 公 司的Symbian 和 Maemo同等看待。 如果诺基亚真的研发Windows Phone 7手机的话，那么对于这两大巨头来说都是一种双赢，毕竟诺基亚硬件+微软的软件这种组合非常具有震撼力。 口袋互联对诺基亚手机的硬件品质有着莫名的青睐，大学时期那款Nokia手机多次自由落体肢解后还能正常使用真是太神奇了。 虽然Symbian系统也非常好用，但是面对现在的智能手机时代，我感觉Symbian真的有点落伍了，这么多年进步也不是很明显。所以能引入 Windows Phone 7系统的话，口袋互联一定举双手赞成，并以实际行动购买一台来表达我无与伦比的激动心情。]]></description>
			<content:encoded><![CDATA[<p>Mobile-Review.com的老板Eldar Muntazin泄露了一张诺基亚公司的幻灯片，表明诺基亚对Windows Phone还是有相当兴趣的。<br />
该幻灯片的主要内容就是诺基亚对2010年度在应用程序、OVI服务和系统平台等领域的的发展规划，让人惊讶的是诺基亚居然将Windows和本 公 司的Symbian 和 Maemo同等看待。</p>
<p style="text-align: center;">
<p style="text-align: center;">
<p style="text-align: center;">
<div id="attachment_299" class="wp-caption aligncenter" style="width: 540px"><a href="http://www.lvyanchao.com/wp-content/uploads/2010/06/13375101635421039.jpg"><img class="size-full wp-image-299   " title="Nokia打算跟进WP7平台" src="http://www.lvyanchao.com/wp-content/uploads/2010/06/13375101635421039.jpg" alt="Nokia打算跟进WP7平台" width="530" /></a><p class="wp-caption-text">Nokia打算跟进WP7平台</p></div>
<p><span id="more-296"></span>如果诺基亚真的研发Windows Phone 7手机的话，那么对于这两大巨头来说都是一种双赢，毕竟诺基亚硬件+微软的软件这种组合非常具有震撼力。</p>
<p>口袋互联对诺基亚手机的硬件品质有着莫名的青睐，大学时期那款Nokia手机多次自由落体肢解后还能正常使用真是太神奇了。</p>
<p>虽然Symbian系统也非常好用，但是面对现在的智能手机时代，我感觉Symbian真的有点落伍了，这么多年进步也不是很明显。所以能引入 Windows Phone 7系统的话，口袋互联一定举双手赞成，并以实际行动购买一台来表达我无与伦比的激动心情。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lvyanchao.com/nokia-win7/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>上海SEO联谊会第五期活动成功举办</title>
		<link>http://www.lvyanchao.com/sh-seo/</link>
		<comments>http://www.lvyanchao.com/sh-seo/#comments</comments>
		<pubDate>Thu, 20 May 2010 01:21:16 +0000</pubDate>
		<dc:creator>吕彦超</dc:creator>
				<category><![CDATA[综合资讯]]></category>
		<category><![CDATA[上海seo]]></category>
		<category><![CDATA[上海SEO联谊会]]></category>
		<category><![CDATA[搜索引擎优化]]></category>

		<guid isPermaLink="false">http://www.lvyanchao.com/?p=280</guid>
		<description><![CDATA[2010年5月15日，上海SEO联谊会第五期活动成功举办，主题为百度SEO与谷歌SEO到底有些什么不同？如何围绕两个搜索引擎展开不同的网站 优化工作？这是一个广受网络营销行业关注的话题，但由于搜索引擎算法的保密性限制，所以对这个问题，SEO专家对此看法不一，百家争鸣。 上 海SEO大会现场 大会 现场听众 为了帮助广大的搜索引擎优化从业人员，以及关注此行业的企业更进一层次了解这个话题，上海SEO联谊会于5月15日举办了一场名为“百度SEO与谷 歌SEO之区别”的技术交流会。多位来自网络营销公司或者大型网站的SEO专家为大家慷慨呈现了自己多年的项目经验，专家们通过实际案例，向与会者讲解了 自己对于两大搜索引擎优化的不同见解，会场上，各位专家的听众不竞相同，许多观点甚至完全相反，但对于观众来说，专家的观点都是一个非常好的借荐。活动现 场气氛热烈，观众受益匪浅。 上 海Seo大会现场 “我们追求的就是这种百家争鸣的效果！”本次活动的举办者之一陈超（网名刑天）、赖军（月影）向笔者坦诚 道，“搜索引擎优化没有绝对正确的方法，也没有一直正确的方法。只要各位专家能够拿出证据，证实自己的做法方法，就是值得观众去学习。这样的活动我们还将 会继续举办下去。” 组织者之一陈超（刑天） 组织者之一赖军（月影） 本次活动邀请的演讲嘉宾有： 上海达闻高级SEO分析师—杨潇波 上海易闻创始人—康轶文（kyw） 上海易点首席SEO分析师—陈塨； 上海奇商首席SEO讲师—姜东栋 久学培训网创始人—陈志文 上海心蕊营销副总监—赖军（月影） 上海SEO联谊会是一个纯民间的网络营销技术交流组织，活动的宗旨是聚集上海SEO行业的精英，向上海以及周边的互联网企业普及搜索引擎优化技术， 促进上海的搜索引擎优化技术的发展。 作者：赖 军@月影SEO搜索营销博客 原文链接：http://028seo.org/archives/341 版权所有，转载请以链接形式注明作者及原始出处。]]></description>
			<content:encoded><![CDATA[<div>
<p>2010年5月15日，上海<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>联谊会第五期活动成功举办，主题为百度<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>与谷歌<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>到底有些什么不同？如何围绕两个搜索引擎展开不同的网站 优化工作？这是一个广受网络营销行业关注的话题，但由于搜索引擎算法的保密性限制，所以对这个问题，<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>专家对此看法不一，百家争鸣。<span id="more-280"></span></p>
<div id="attachment_342"><a rel="attachment wp-att-342" href="http://www.lvyanchao.com/?attachment_id=342"><img title="上海SEO大会现场" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-xc.jpg" alt="上海SEO大会现场" width="600" height="450" /></a></div>
<div>上 海<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>大会现场</div>
<div id="attachment_342">
</div>
<div id="attachment_344"><a rel="attachment wp-att-344" href="http://www.lvyanchao.com/?attachment_id=344"><img title="shanghai-seo-union-xc-tingzhong" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-xc-tingzhong.jpg" alt="大会现场听众" width="600" height="450" /></a></div>
<div>大会 现场听众</div>
<div id="attachment_344">
</div>
<p>为了帮助广大的搜索引擎优化从业人员，以及关注此行业的企业更进一层次了解这个话题，上海<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>联谊会于5月15日举办了一场名为“百度<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>与谷 歌<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>之区别”的技术交流会。多位来自网络营销公司或者大型网站的<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>专家为大家慷慨呈现了自己多年的项目经验，专家们通过实际案例，向与会者讲解了 自己对于两大搜索引擎优化的不同见解，会场上，各位专家的听众不竞相同，许多观点甚至完全相反，但对于观众来说，专家的观点都是一个非常好的借荐。活动现 场气氛热烈，观众受益匪浅。</p>
<div id="attachment_343"><a rel="attachment wp-att-343" href="http://www.lvyanchao.com/?attachment_id=343"><img title="上海SEO大会现场" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-xc2.jpg" alt="上海SEO大会现场" width="600" height="450" /></a></div>
<div>上 海Seo大会现场</div>
<div id="attachment_343">
</div>
<p>“我们追求的就是这种百家争鸣的效果！”本次活动的举办者之一<a href="http://www.chons.cn/" target="_blank">陈超（网名刑天）</a>、<a href="http://028seo.org/">赖军（月影）</a>向笔者坦诚 道，“搜索引擎优化没有绝对正确的方法，也没有一直正确的方法。只要各位专家能够拿出证据，证实自己的做法方法，就是值得观众去学习。这样的活动我们还将 会继续举办下去。”</p>
<div id="attachment_345"><a rel="attachment wp-att-345" href="http://www.lvyanchao.com/?attachment_id=345"><img title="组织者之一陈超（刑天）讲话" src="http://028seo.org/wp-content/uploads/2010/05/chenchao-xingtian.jpg" alt="组织者之一陈超（刑天）" width="600" height="426" /></a></div>
<div>组织者之一陈超（刑天）</div>
<div id="attachment_345">
</div>
<div id="attachment_346"><a rel="attachment wp-att-346" href="http://www.lvyanchao.com/?attachment_id=346"><img title="组织者之一赖军（月影）主持" src="http://028seo.org/wp-content/uploads/2010/05/laijun-yueying.jpg" alt="组织者之一赖军（月影）" width="600" height="450" /></a></div>
<div>组织者之一赖军（月影）</div>
<div id="attachment_346">
</div>
<p>本次活动邀请的演讲嘉宾有：</p>
<div id="attachment_347"><a rel="attachment wp-att-347" href="http://www.lvyanchao.com/?attachment_id=347"><img title="上海达闻高级SEO分析师—杨潇波" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-jiabing-Boson.jpg" alt="上海达闻高级SEO分析师—杨潇波" width="600" height="450" /></a></div>
<div>上海达闻高级<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>分析师—杨潇波</div>
<div id="attachment_347">
</div>
<div id="attachment_348"><a rel="attachment wp-att-348" href="http://www.lvyanchao.com/?attachment_id=348"><img title="上海易闻创始人—康轶文（kyw）" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-jiabing-Kyw.jpg" alt="上海易闻创始人—康轶文（kyw）" width="600" height="451" /></a></div>
<div>上海易闻创始人—康轶文（kyw）</div>
<div id="attachment_348">
</div>
<div id="attachment_349"><a rel="attachment wp-att-349" href="http://www.lvyanchao.com/?attachment_id=349"><img title="上海易点首席SEO分析师—陈塨；" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-jiabing-Chengong.jpg" alt="上海易点首席SEO分析师—陈塨；" width="600" height="442" /></a></div>
<div>上海易点首席<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>分析师—陈塨；</div>
<div id="attachment_349">
</div>
<div id="attachment_350"><a rel="attachment wp-att-350" href="http://www.lvyanchao.com/?attachment_id=350"><img title="上海奇商首席SEO讲师—姜东栋" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-jiabing-jiangdongdong.jpg" alt="上海奇商首席SEO讲师—姜东栋" width="600" height="450" /></a></div>
<div>上海奇商首席<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>讲师—姜东栋</div>
<div id="attachment_350">
</div>
<div id="attachment_351"><a rel="attachment wp-att-351" href="http://www.lvyanchao.com/?attachment_id=351"><img title="久学培训网创始人—陈志文" src="http://028seo.org/wp-content/uploads/2010/05/shanghai-seo-union-jiabing-Chengzhiwen.jpg" alt="久学培训网创始人—陈志文" width="600" height="413" /></a></div>
<div>久学培训网创始人—陈志文</div>
<div id="attachment_351">
</div>
<p>上海心蕊营销副总监—赖军（月影）</p>
<p>上海<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>联谊会是一个纯民间的网络营销技术交流组织，活动的宗旨是聚集上海<span class='bm_keywordlink'><a href="http://www.lvyanchao.com/" rel="nofollow">SEO</a></span>行业的精英，向上海以及周边的互联网企业普及搜索引擎优化技术， 促进上海的搜索引擎优化技术的发展。</p>
<p>作者：赖 军@<a href="http://028seo.org/">月影SEO搜索营销博客</a><br />
原文链接：<a href="http://028seo.org/archives/341">http://028seo.org/archives/341</a><br />
版权所有，转载请以链接形式注明作者及原始出处。</p>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.lvyanchao.com/sh-seo/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Google搜索引擎工作原理介绍</title>
		<link>http://www.lvyanchao.com/google-yuanli/</link>
		<comments>http://www.lvyanchao.com/google-yuanli/#comments</comments>
		<pubDate>Fri, 30 Apr 2010 02:40:48 +0000</pubDate>
		<dc:creator>吕彦超</dc:creator>
				<category><![CDATA[综合资讯]]></category>
		<category><![CDATA[google优化]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[搜索引擎优化]]></category>

		<guid isPermaLink="false">http://www.lvyanchao.com/?p=264</guid>
		<description><![CDATA[这篇文章是基于Google创始人Lawrence Page和Sergey Brin一篇早期的论文翻译整理简化而成。尽管Google一直在修正不同因素对网页的权重影响以期排除作弊网站对搜索结果的干扰和获得最好的搜索结果，但其核心思路并没有改。 Google采用了两个重要的特性，因此而获取了准确的查询结果：第一，Google利用网页的链接结构计算出每个网页的等级排名，这就是所谓的PageRank；第二，Google利用了链接提供的信息进一步改善搜索结果。 PageRank的计算： PageRank的基本思路是：如果一个网也被其他网页多次指向，这就说明本网页比较重要或者质量较高。除了考虑网页链接数量之外，Google还要参考链接网页本身的级别，以及这个网页有多少正向链接到其它网页。当然“重要”的网页的链接就会有更高的权重。PageRank的简化计算公式： PR(A) = (1-d) + d (PR(T1)/C(T1) +…+ PR(Tn)/C(Tn))? PR(A) :网页A页的PageRank值；? PR(Ti) :链接到A页的网页Ti的PageRank值；? C(Ti) :网页Ti的出站链接数量；? d :阻尼系数，0 PageRank可以通过结合链接权重的向量矩阵的提归计算而获得(关于PageRank的深入分析，我在方便的时候会另外写一篇文章介绍)。 随机冲浪模型： PageRank可以被理解为用户的一个行为模型。我们假设一个随机的网站浏览者”random surfer”给以一个随机的网页，他会继续点击网页中的链接直到他厌倦了而从新开始浏览一个新的随机的网页。PageRank可以理解为某个网页被随机访问的概率。而阻尼系数d则是随机访客不顺着网页的链接继续浏览下去，而从新开始一个随机冲浪的概率。对有一些网页，可能会人为的改变它的阻尼系数，这样就可以阻止一些作弊网站误导Google而获得较高的PageRank的可能性。 你也可以这样自觉理解PageRank：一个高PageRank的网页是那些有很多网页指向的网页，或者是有一些重要网页指向的网页。Google假定，如果一个网页被很多其他不同的网页引用，就说明这个网也值得一看。另外，如果一个网页为yahoo这样的网站指向，也通常值得一看。 链接描述文本(anchor text) Google对连接描述文字进行了特殊的处理。大多数的搜索引擎都是把链接文本和它所在的页面相关联，而Google还把链接文本和它指向的文档相关联。这样做的原因是链接描述往往提供了一个对被指向的网页更准确地描述。 除了PageRank和链接描述以外，Google还采用了一些其它的特性：首先，Google记录了所有关键字的位置信息(hits)，它在搜索中充分的使用了关键字的相关性分析。其次，Google记录了一些视觉信息，比如字体的大小等等。大字以及加粗的字体比网页中的其它字体有更高的权重。 另外，Google认为，不是直接呈现给访问者的的文本信息都可能被烂用，并用以误导搜索引擎。所以Google对metadata的文本给以较小的重视。 系统结构分析： Google的整体系统结构如图所示： 先由URLserver发送一系列的URL地址让网站爬虫crawlers去采集。网页采集后交给存储服务器Store server。存储服务器压缩网页内容后存放到信息仓库repository。所有的新的网页都被赋予一个docID。索引功能由索引器indexer和排序器sorter来执行完成。Indexer读取repository的文件，并将其转换为一系列的关键字排序，称为命中hits。Hits记录了关键字，出现在文件的位置，字体的相对大小和字母的大小写。Indexer然后将这些hits放到一系列的桶barrels中，建立了部分排序的好了的正向索引。Indexer还分离出网页中的所有链接，将重要的信息存放在Anchors文件之中。这个文件包含的信息可以确定链接的指向和链接的描述文本。 URLresolver读取Anchors文件并将相对URLs转换为绝对URLs，并依次放到docIDs中。它再将链接的描述文本放到正向索引，并将docIDs与链接的描述文本相对应。同时，它也产生一个链接links和docIDs相对应的数据库。这个links数据库将被用于计算所有网页的PageRanks。 然后，排序器sorter从barrels中取得按docID排序的网页，再将其按照wordID产生一个反向索引。Sorter还在反向索引产生一个wordIDs及其偏移的列表。一个叫做DumpLexicon的程序将这个列表结合搜索引擎的词库再产生一个可以被搜索器searcher使用的新的词库Lexicon。由网页服务器构成的搜索引擎Searcher利用这个新的词库配合反向索引和PageRanks来回答查询。 命中列表Hit Lists 命种列表Hit Lists记录了一系列的关键字出现在一个网页中的信息，包括在网页中的位置，字体的相对大小和字母的大小写。Hit Lists占用了正向和反向索引里的绝大部分的空间。 命中分为两类：特别命中fancy hits和普通命中plain hits。fancy hits包括了在URL,标题, anchor text, or meta tag出现的关键字，所有在其它位置出现的关键字均为plain hits。一个plain hit由大小写位1 bit，字体大小3bits和用来表示关键字在网页的位置所组成12位bits信息(所有位置大于4095的均表志为4096)。 [...]]]></description>
			<content:encoded><![CDATA[<p><span style="font-weight: normal;">这篇文章是基于Google创始人Lawrence Page和Sergey Brin一篇早期的论文翻译整理简化而成。尽管Google一直在修正不同因素对网页的权重影响以期排除作弊网站对搜索结果的干扰和获得最好的搜索结果，但其核心思路并没有改。</span></p>
<p>Google采用了两个重要的特性，因此而获取了准确的查询结果：第一，Google利用网页的链接结构计算出每个网页的等级排名，这就是所谓的PageRank；第二，Google利用了链接提供的信息进一步改善搜索结果。<span id="more-264"></span></p>
<p><strong> PageRank的计算：</strong></p>
<p>PageRank的基本思路是：如果一个网也被其他网页多次指向，这就说明本网页比较重要或者质量较高。除了考虑网页链接数量之外，Google还要参考链接网页本身的级别，以及这个网页有多少正向链接到其它网页。当然“重要”的网页的链接就会有更高的权重。PageRank的简化计算公式：</p>
<p>PR(A) = (1-d) + d (PR(T1)/C(T1) +…+ PR(Tn)/C(Tn))? PR(A) :网页A页的PageRank值；? PR(Ti) :链接到A页的网页Ti的PageRank值；? C(Ti) :网页Ti的出站链接数量；? d :阻尼系数，0</p>
<p>PageRank可以通过结合链接权重的向量矩阵的提归计算而获得(关于PageRank的深入分析，我在方便的时候会另外写一篇文章介绍)。</p>
<p><strong> 随机冲浪模型：</strong></p>
<p>PageRank可以被理解为用户的一个行为模型。我们假设一个随机的网站浏览者”random surfer”给以一个随机的网页，他会继续点击网页中的链接直到他厌倦了而从新开始浏览一个新的随机的网页。PageRank可以理解为某个网页被随机访问的概率。而阻尼系数d则是随机访客不顺着网页的链接继续浏览下去，而从新开始一个随机冲浪的概率。对有一些网页，可能会人为的改变它的阻尼系数，这样就可以阻止一些作弊网站误导Google而获得较高的PageRank的可能性。</p>
<p>你也可以这样自觉理解PageRank：一个高PageRank的网页是那些有很多网页指向的网页，或者是有一些重要网页指向的网页。Google假定，如果一个网页被很多其他不同的网页引用，就说明这个网也值得一看。另外，如果一个网页为yahoo这样的网站指向，也通常值得一看。</p>
<p><strong> 链接描述文本(anchor text)</strong></p>
<p>Google对连接描述文字进行了特殊的处理。大多数的搜索引擎都是把链接文本和它所在的页面相关联，而Google还把链接文本和它指向的文档相关联。这样做的原因是链接描述往往提供了一个对被指向的网页更准确地描述。</p>
<p>除了PageRank和链接描述以外，Google还采用了一些其它的特性：首先，Google记录了所有关键字的位置信息(hits)，它在搜索中充分的使用了关键字的相关性分析。其次，Google记录了一些视觉信息，比如字体的大小等等。大字以及加粗的字体比网页中的其它字体有更高的权重。</p>
<p>另外，Google认为，不是直接呈现给访问者的的文本信息都可能被烂用，并用以误导搜索引擎。所以Google对metadata的文本给以较小的重视。</p>
<p><strong> 系统结构分析：</strong></p>
<p><strong> Google的整体系统结构如图所示：</strong></p>
<p><strong><img src="file:///D:/backup/140462/Local%20Settings/Temporary%20Internet%20Files/Content.IE5/Z6GVR1KL/f406cf838d0297cb0e1d6d2c82bc5a34%5B1%5D.jpg" alt="" /></strong></p>
<p>先由URLserver发送一系列的URL地址让网站爬虫crawlers去采集。网页采集后交给存储服务器Store server。存储服务器压缩网页内容后存放到信息仓库repository。所有的新的网页都被赋予一个docID。索引功能由索引器indexer和排序器sorter来执行完成。Indexer读取repository的文件，并将其转换为一系列的关键字排序，称为命中hits。Hits记录了关键字，出现在文件的位置，字体的相对大小和字母的大小写。Indexer然后将这些hits放到一系列的桶barrels中，建立了部分排序的好了的正向索引。Indexer还分离出网页中的所有链接，将重要的信息存放在Anchors文件之中。这个文件包含的信息可以确定链接的指向和链接的描述文本。</p>
<p>URLresolver读取Anchors文件并将相对URLs转换为绝对URLs，并依次放到docIDs中。它再将链接的描述文本放到正向索引，并将docIDs与链接的描述文本相对应。同时，它也产生一个链接links和docIDs相对应的数据库。这个links数据库将被用于计算所有网页的PageRanks。</p>
<p>然后，排序器sorter从barrels中取得按docID排序的网页，再将其按照wordID产生一个反向索引。Sorter还在反向索引产生一个wordIDs及其偏移的列表。一个叫做DumpLexicon的程序将这个列表结合搜索引擎的词库再产生一个可以被搜索器searcher使用的新的词库Lexicon。由网页服务器构成的搜索引擎Searcher利用这个新的词库配合反向索引和PageRanks来回答查询。</p>
<p><strong> 命中列表Hit Lists</strong></p>
<p><strong><img src="file:///D:/backup/140462/Local%20Settings/Temporary%20Internet%20Files/Content.IE5/2PDIFM54/Forward-Reverse-Indexes%5B1%5D.jpg" alt="" /></strong></p>
<p>命种列表Hit Lists记录了一系列的关键字出现在一个网页中的信息，包括在网页中的位置，字体的相对大小和字母的大小写。Hit Lists占用了正向和反向索引里的绝大部分的空间。</p>
<p>命中分为两类：特别命中fancy hits和普通命中plain hits。fancy hits包括了在URL,标题, anchor text, or meta tag出现的关键字，所有在其它位置出现的关键字均为plain hits。一个plain hit由大小写位1 bit，字体大小3bits和用来表示关键字在网页的位置所组成12位bits信息(所有位置大于4095的均表志为4096)。</p>
<p><strong> 正向索引：</strong></p>
<p>正向索引由64个桶barrel组成。每个barrel存放了一个特定范围的wordID’s。如果一个网页包含的关键字属于某个barrel范围，这个docID就记录到这个特定的barrel之中。docID与wordID’s以及这些关键字的命中列表hit lists一起记录在这个barrel中。</p>
<p><strong> 反向索引</strong></p>
<p>反向索引与正向使用相同的barrels，唯一的区别是反向索引由排序器sorter处理。对每一个有效的wordID，词库lexicon中包含了指针指向具体的barrel。它指向由docID组成的doclist列表，以及他们的所对应的命中列表hit lists。这个doclist代表了那个单词在所有文件中所出现的列表。</p>
<p>Google采用了两组反向索引inverted barrels。一组包含了标题和anchor hits，另一组则包含所有的hits。这样，google先检查第一组short barrels，如果返回的匹配结果不够多，然后再查询第二组long barrels</p>
<p><strong> Google查询流程如下：</strong></p>
<p>1.解析查询关键字2.转换关键字为wordIDs3.在短桶short barrels中寻找每个关键字在doclist的起点4.扫描这个doclists直到有个网页与查询全部匹配5.计算这个网页的查询排名Rank6.如果在短桶short barrels doclist列表已经查完，寻找每个关键字在长桶long barrels doclist的起点，重复第4步7.如果还没有查完doclist，重复第4步8.将匹配的网页根据计算出的rank排序，并返回前k个查询结果。</p>
<p><strong> Google的排名系统</strong></p>
<p>Google包含了比其它搜索引擎更多的网页信息。每一个hit list包含了位置，字体，大小写信息。另为Google还参考了anchor text以及网页的PageRank。没有一个单一的因素会对搜索结果的排序产生太大的影响。</p>
<p>让我们来看一下单个关键字的查询：Google先查看对应于这个单词的网页的命中列表hit list。Google区分每个hit由几种不同的类型(标题, anchor, URL,大字体,小字体等等),每一种类型都有自己的类型权重type-weight。这些type-weights组成一个由类型向量。Google计算每一种类型的命中记数，然后这些命中记数又转换为计数权重Count-weights。计数权重开始以线性增加，然后很快就逐渐停止，这样太多的命中记数就会没有作用。Google在将Count-weights和type-weight相乘计算出网页的IR score。最后这个IR score与PageRank相结合得到最终的搜索排序结果。</p>
<p>对于多关键词的搜索，计算方法就比较复杂一些。现在多个命中列表必须要全部扫描，这样对那些出现在文章中靠近的hits就比那些分开较远的hits有更高的权重。那些相接近的hits被匹配到一起，然后计算出这些相匹配的hits的相关度proximity。相关度是基于这些hits出现在文章中的距离决定的，并被分为10个不同的值，分别表示为短语匹配(phrase match)到根本不匹配(not even close)。命中计数不仅计算每种类型，而且还计算每个类型和他们的相关度匹配。每个类型和相关度配对有一个type-prox-weight权重。这个记数器被转换为计数权重。然后这个计数权重于与类型相关权重type-prox-weights相乘得到文章的IR score。当然最后是IR score与PageRank相结合得到最终的搜索排序结果。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lvyanchao.com/google-yuanli/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Facebook将超越Ask成为美国第四大搜索引擎</title>
		<link>http://www.lvyanchao.com/facebook/</link>
		<comments>http://www.lvyanchao.com/facebook/#comments</comments>
		<pubDate>Tue, 13 Apr 2010 14:13:46 +0000</pubDate>
		<dc:creator>吕彦超</dc:creator>
				<category><![CDATA[综合资讯]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[搜索引擎]]></category>

		<guid isPermaLink="false">http://www.lvyanchao.com/?p=227</guid>
		<description><![CDATA[　　和YouTube一样，作为非专业搜索引擎的Facebook依靠庞大用户量，也正在成为搜索后起之秀。美国业内人士分析指出，Facebook已经超越了美国在线，成为美国第五大搜索。 　　业内人士利兹·加恩斯(Liz Gannes)分析了三月份comScore的美国搜索报告。根据他的计算，美国在线份额为2.5%，Facebook的份额为2.7%，美国在线已经被Facebook赶超。 　　排在Facebook之前的，分别是Ask.com(3.1%)，微软必应(7.8%)，雅虎(11.3%)以及Google(59.7%)。 　　加恩斯预计，几个月之后，Facebook将会超越Ask.com，跻身第四大搜索。另外，微软目前是Facebook的大股东，如果微软能够收购Facebook，并实现和雅虎的搜索联盟，微软必应有望斩获美国搜索市场的35%到40%，从而和Google实现美国市场的双寡头垄断。 　　此前在Facebook和搜索引擎的关系上，在多年的“十大搜索关键词”评选中，Facebook名列各搜索第一名。而Facebook眼下正在从一个热门“搜索对象”蜕变成“搜索引擎”。]]></description>
			<content:encoded><![CDATA[<p>　　和YouTube一样，作为非专业搜索引擎的Facebook依靠庞大用户量，也正在成为搜索后起之秀。美国业内人士分析指出，Facebook已经超越了美国在线，成为美国第五大搜索。</p>
<p>　　业内人士利兹·加恩斯(Liz Gannes)分析了三月份comScore的美国搜索报告。根据他的计算，美国在线份额为2.5%，Facebook的份额为2.7%，美国在线已经被Facebook赶超。<span id="more-227"></span></p>
<p>　　排在Facebook之前的，分别是Ask.com(3.1%)，微软必应(7.8%)，雅虎(11.3%)以及Google(59.7%)。</p>
<p>　　加恩斯预计，几个月之后，Facebook将会超越Ask.com，跻身第四大搜索。另外，微软目前是Facebook的大股东，如果微软能够收购Facebook，并实现和雅虎的搜索联盟，微软必应有望斩获美国搜索市场的35%到40%，从而和Google实现美国市场的双寡头垄断。</p>
<p>　　此前在Facebook和搜索引擎的关系上，在多年的“十大搜索关键词”评选中，Facebook名列各搜索第一名。而Facebook眼下正在从一个热门“搜索对象”蜕变成“搜索引擎”。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lvyanchao.com/facebook/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>雁荡山旅游-自然之奇</title>
		<link>http://www.lvyanchao.com/%e9%9b%81%e8%8d%a1%e5%b1%b1%e6%97%85%e6%b8%b8-%e8%87%aa%e7%84%b6%e4%b9%8b%e5%a5%87/</link>
		<comments>http://www.lvyanchao.com/%e9%9b%81%e8%8d%a1%e5%b1%b1%e6%97%85%e6%b8%b8-%e8%87%aa%e7%84%b6%e4%b9%8b%e5%a5%87/#comments</comments>
		<pubDate>Sat, 06 Mar 2010 09:28:27 +0000</pubDate>
		<dc:creator>吕彦超</dc:creator>
				<category><![CDATA[综合资讯]]></category>
		<category><![CDATA[旅游游记]]></category>
		<category><![CDATA[雁荡山]]></category>
		<category><![CDATA[雁荡山旅游]]></category>

		<guid isPermaLink="false">http://www.lvyanchao.com/?p=58</guid>
		<description><![CDATA[“一景多变，移步换形”，位于温州雁荡山被作为十大名山之一，有着它的不平凡。去过雁荡山的游客都知道雁荡山以峰、瀑、洞、嶂见长，素有“海上名山”、“寰中绝胜”之誉，史称“东南第一山”。其实雁荡山的特点远不尽如此，自古至今雁荡山都是游客们喜欢去的地方，周末旅游，假期游玩都喜欢涉足于山绕之间，处在雁荡山之间会更加让人感受到大自然的孕育和怀抱。大自然永远都是那么的让人无穷向往。的确，小的时候就想着自己是武侠片中的英雄豪杰，隐居雁荡山中，和自己喜欢的人在一起，一起游玩，一起唱歌，一起在雁荡山中过着神仙般的日子，该是无比的幸福。 对于我来说，每年都会有几次和朋友去雁荡山游玩，虽然去了很多次，但每次去都会有不一样的感受，在雁荡山中更能让人感到生命的意义，每一天活得更加快乐，每一天获得更加充实。 2009年6月，我们就商量着和几个同事一起去雁荡山游玩，好久都没有出去好好放松下，这周末正好没事，大家不防出去好好玩玩。几位同事也都没意见，于是我们就开始了周末雁荡山游玩的所有准备。到了周末我们一大早就上车，背着旅行包赶往我们鲜情的雁荡山。 大约到了响午的时候，我们终于到达雁荡山目的地。看着许多游客，我们一边乐一边背着包开始我们的雁荡山景区游。对于雁荡山来说，今年的游客特别多，可能是赶上暑假的的原因吧，也的确会有很多的人到雁荡山来玩，其实人多也才更加有意思！   和以前一样，我们先从雁荡山入口开始徒步，先到雁荡山灵峰，灵峰是雁荡山的东大门，雁荡山最华美的乐章之一。沿鸣玉溪而上，山腋两壁，危峰乱叠，溪涧潺潺。 然后就到灵岩，这里雁荡三绝之一，元代文学家李孝光云：“峭刻瑰丽，莫若灵峰；雄壮浑庞，莫若灵岩。” 接着我们又到了雁荡山大龙湫，大龙湫景区位于雁荡山中部偏西，古称西内谷。有很多游客在这里观看瀑布，被誉为“天下第一瀑”的雁荡山大龙湫，变幻多姿，真是让人叫绝。 雁荡山显胜门是我们的第三站，这里同样游客很多，其实也没什么，因为我们去的都是雁荡山风景比较漂亮的，每次来的时候也都要过来看看，这次我们当中有位新同事，顺便就让他感受下雁荡山的美丽景致。 从雁荡山显胜们出来后，我们又到了仙桥，仙桥景区在雁荡山最北端，传说是仙人王子晋骑鹤飞临之地。这里一百平方公里的景区内，山山水水间无不氤氲着清彻骨髓的仙气。和我们同行的游客都有些累了。只有我们几个还是那样，不停的走不停的跑，反正我是停不下来的，因为我不喜欢停下了休息，享受美景比休息更加舒服呢。嘿嘿 到了雁荡山雁湖，我们就更加的乐了，今年的雁荡山雁湖和去年的完全不一样，远处山雾迷蒙一边，显得雁荡山更加的神秘。 雁荡山三折瀑，在雁荡山众多瀑布中，三折瀑最为奇异，其中尤以中折瀑为极致——有人甚至称它为“雁山第一胜景”。据说包藏中折瀑的是冷却了的火山口，火与水如此相克又相生。 雁荡山羊角洞，是雁荡山八大景区中最具中国民间宗教文化色彩的地方。雁荡山羊角洞是我们最后去的地方，大约花了5个小时的时间我们走了雁荡山主要的景区，许多风景让我们流连忘返，很多地方也都没有呆太久，没有办法，时间有限，只有下次咋们再到雁荡山游玩。 游记时间：2009年6月22日]]></description>
			<content:encoded><![CDATA[<p>“一景多变，移步换形”，位于温州<strong>雁荡山</strong>被作为十大名山之一，有着它的不平凡。去过雁荡山的游客都知道雁荡山以峰、瀑、洞、嶂见长，素有“海上名山”、“寰中绝胜”之誉，史称“东南第一山”。<span id="more-58"></span>其实雁荡山的特点远不尽如此，自古至今<strong>雁荡山</strong>都是游客们喜欢去的地方，周末旅游，假期游玩都喜欢涉足于山绕之间，处在雁荡山之间会更加让人感受到大自然的孕育和怀抱。大自然永远都是那么的让人无穷向往。的确，小的时候就想着自己是武侠片中的英雄豪杰，隐居雁荡山中，和自己喜欢的人在一起，一起游玩，一起唱歌，一起在雁荡山中过着神仙般的日子，该是无比的幸福。</p>
<p>对于我来说，每年都会有几次和朋友去雁荡山游玩，虽然去了很多次，但每次去都会有不一样的感受，在雁荡山中更能让人感到生命的意义，每一天活得更加快乐，每一天获得更加充实。</p>
<p>2009年6月，我们就商量着和几个同事一起去雁荡山游玩，好久都没有出去好好放松下，这周末正好没事，大家不防出去好好玩玩。几位同事也都没意见，于是我们就开始了周末雁荡山游玩的所有准备。到了周末我们一大早就上车，背着旅行包赶往我们鲜情的雁荡山。</p>
<p>大约到了响午的时候，我们终于到达<strong>雁荡山</strong>目的地。看着许多游客，我们一边乐一边背着包开始我们的雁荡山景区游。对于雁荡山来说，今年的游客特别多，可能是赶上暑假的的原因吧，也的确会有很多的人到雁荡山来玩，其实人多也才更加有意思！</p>
<div> </div>
<p>和以前一样，我们先从雁荡山入口开始徒步，先到雁荡山灵峰，灵峰是雁荡山的东大门，雁荡山最华美的乐章之一。沿鸣玉溪而上，山腋两壁，危峰乱叠，溪涧潺潺。</p>
<p>然后就到灵岩，这里雁荡三绝之一，元代文学家李孝光云：“峭刻瑰丽，莫若灵峰；雄壮浑庞，莫若灵岩。”</p>
<div><img src="http://www.dujiala.com/images/poi/poiid_10225/jspic1.jpg" alt="心情日记，雁荡山，雁荡山旅游" /></div>
<p>接着我们又到了雁荡山大龙湫，大龙湫景区位于雁荡山中部偏西，古称西内谷。有很多游客在这里观看瀑布，被誉为“天下第一瀑”的雁荡山大龙湫，变幻多姿，真是让人叫绝。</p>
<p><strong>雁荡山</strong>显胜门是我们的第三站，这里同样游客很多，其实也没什么，因为我们去的都是雁荡山风景比较漂亮的，每次来的时候也都要过来看看，这次我们当中有位新同事，顺便就让他感受下雁荡山的美丽景致。</p>
<div><img src="http://www.dujiala.com/images/poi/poiid_10225/jspic2.jpg" alt="心情日记，雁荡山，雁荡山旅游" /></div>
<p>从雁荡山显胜们出来后，我们又到了仙桥，仙桥景区在雁荡山最北端，传说是仙人王子晋骑鹤飞临之地。这里一百平方公里的景区内，山山水水间无不氤氲着清彻骨髓的仙气。和我们同行的游客都有些累了。只有我们几个还是那样，不停的走不停的跑，反正我是停不下来的，因为我不喜欢停下了休息，享受美景比休息更加舒服呢。嘿嘿</p>
<div><img src="http://www.dujiala.com/images/poi/poiid_10225/jspic3.jpg" alt="心情日记，雁荡山，雁荡山旅游" /></div>
<p>到了雁荡山雁湖，我们就更加的乐了，今年的雁荡山雁湖和去年的完全不一样，远处山雾迷蒙一边，显得雁荡山更加的神秘。</p>
<p><strong>雁荡山</strong>三折瀑，在雁荡山众多瀑布中，三折瀑最为奇异，其中尤以中折瀑为极致——有人甚至称它为“雁山第一胜景”。据说包藏中折瀑的是冷却了的火山口，火与水如此相克又相生。</p>
<p>雁荡山羊角洞，是雁荡山八大景区中最具中国民间宗教文化色彩的地方。雁荡山羊角洞是我们最后去的地方，大约花了5个小时的时间我们走了雁荡山主要的景区，许多风景让我们流连忘返，很多地方也都没有呆太久，没有办法，时间有限，只有下次咋们再到雁荡山游玩。</p>
<div>游记时间：2009年6月22日</div>
]]></content:encoded>
			<wfw:commentRss>http://www.lvyanchao.com/%e9%9b%81%e8%8d%a1%e5%b1%b1%e6%97%85%e6%b8%b8-%e8%87%aa%e7%84%b6%e4%b9%8b%e5%a5%87/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Hello world！</title>
		<link>http://www.lvyanchao.com/hello-world/</link>
		<comments>http://www.lvyanchao.com/hello-world/#comments</comments>
		<pubDate>Wed, 03 Mar 2010 03:24:15 +0000</pubDate>
		<dc:creator>吕彦超</dc:creator>
				<category><![CDATA[SEO优化]]></category>
		<category><![CDATA[wordpress]]></category>
		<category><![CDATA[XHTML+CSS]]></category>
		<category><![CDATA[前端体验]]></category>
		<category><![CDATA[搜索引擎优化]]></category>
		<category><![CDATA[综合资讯]]></category>
		<category><![CDATA[网站策划]]></category>
		<category><![CDATA[网站运营]]></category>
		<category><![CDATA[网络工具]]></category>
		<category><![CDATA[网络推广]]></category>
		<category><![CDATA[网络编程]]></category>
		<category><![CDATA[营销策划]]></category>
		<category><![CDATA[随笔网志]]></category>
		<category><![CDATA[网站优化]]></category>
		<category><![CDATA[网站优化技巧]]></category>
		<category><![CDATA[网站优化方案]]></category>
		<category><![CDATA[网站优化服务]]></category>

		<guid isPermaLink="false">http://457399.508.hostcn.cn/blog/?p=1</guid>
		<description><![CDATA[欢迎使用 WordPress 。这是系统自动生成的演示文章。编辑或者删除它，开始您的博客！]]></description>
			<content:encoded><![CDATA[<p>欢迎使用 WordPress 。这是系统自动生成的演示文章。编辑或者删除它，开始您的博客！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lvyanchao.com/hello-world/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

