2006-10-19

转贴-google为什么不能搜索


搜go456 (北京社区) 2006-10-19 00:34指出违规贴
[主题]:请大家打开GOOGLE首页,搜索"南京大屠杀"或"钓鱼岛",看看能搜出结果吗?出现的无非是:"该页无法显示"的提示,而且在以后的短时间内,将不能使用GOOGLE进行搜索。 但是如果搜索"尖阁列岛"(即我中国钓鱼岛的鬼子叫法),就可以搜到结果。 这摆明是对我中华人民共和国,对所有华夏儿女的蔑视! 丑恶的美国鬼子企图从互联网上对我国进行信息封锁!用心极其险恶! 请大家亲身实验一下,如果我说的对,就转发一下,让所有中国人都知道!坚决抵制googLe,用我们中国人自己的搜索引擎-百度!!! 把googLe赶出中国! 是中国人就发个群以上,没有Q币,也不送太阳
编辑 

adam0_0 (嘉峪关社区) 2006-10-19 01:28指出违规贴
  LZ你试过么?  我刚刚试过  可以搜到的~
编辑  

adam0_0 (嘉峪关社区) 2006-10-19 01:51指出违规贴
  (转自 Invision Power Board )  这个先不好说死,有些地区好像可以搜索。还有人说尖阁列岛也不能搜索......  这不是google的初衷,而是google的无奈。不相信你搜一下“法轮功”,也会出现相同的情况,南京大屠杀,钓鱼岛等也属于比较敏感的政治词汇。  现在给你解释一下原理:  Great fire wall听说过么? 这是我们国家在中国与境外互联网的所有出口上设置的放火墙,用于过滤敏感词汇(大家都明白是什么样的词吧?)与屏蔽相关网站(例如:wiki百科)。  当GFW发现TCP数据包报文负载中有其需要过滤的敏感词汇的时候就会截下这个包,取得包的源IP,向这个IP发送reset位置位的TCP包导致连接断开,并且会使你五到十分钟内无法访问你刚才请求的网站(不懂的话去复习一下TCP/IP,看看这个reset是设计用来在什么情况下使用的)。  出现不能连接的情况后想马上重新上的话,拨号获得动态IP的用户可以断开重新连接,获得一个不同的IP就可以马上重新登陆www.google.com了。固定IP的话只能等解封了。  相反,www.google.cn就不会发生这种情况,不信你可以搜一下试试,因为google.cn的服务器在中国,而且和政府达成了协议,加入了过滤。搜索“南京大屠杀”,可以看到搜索结果的下方会出现提示“据当地法律法规和政策,部分搜索结果未予显示。”这就是为什么www.google.com不能用的原因。  google的创始理念里有don't be evil这一条,所以google绝对不会做出封锁信息的举动,而是我们的政府。如果你像你所说有“良知”、“血性”的话,我想知道你想做什么,能做什么?  google.cn是google的妥协,google因为google.cn的设立甚至还受到了美国国会的质询,因为这妨害了中国公民自由获取信息的权利。可是在这样的情况下,google又能怎样呢?  baidu人为操纵搜索结果,主动过滤信息不说。竞价排名使得搜索结果没有公正性可言。网上看到一个比喻,你问google你老爸是谁,用google的他会告诉你谁最可能是你的老爸另外按相似度给出排名,问baidu的话谁出的钱最多baidu就会告诉你谁就是你的老爸。  在没有google的日子里,我宁愿用sogou,yahoo也不用baidu。  希望这位同学以后三思而后言。
编辑  

eapep (深圳社区) 2006-10-19 08:45指出违规贴
  那是google被中--国--政--府屏蔽掉了~!  懂不懂~?!不懂不要装懂,还来误导别人,学多点再来说话

2006-10-04

用Google Sitemaps帮助你SEO

作者:Matthew Coers(mailto:mcoers#profitchoice.com)译者:Sheneyan(子乌)时间:2006.07.12英文原文: Search Engine Optimization with Google Sitemaps
子乌注:这篇文章对google推出的免费服务google sitemap进行了一些应用上的分析,对于优化站点能起到很大帮助。
什么是Google Sitemaps?
Google Sitemap看起来只是一个简单的XML文档,它列出了你网站上所有页面,但是实际上Google Sitemap所做的远远比列出页面要重要的多。实际上, 通过这东东你能够瞥见一点Google的想法--而且它你能够告诉你很多关于Google如何看待你的网站!
为什么你应该使用Google Sitemaps?
直到Google Sitemaps在2005年夏天发布之前,针对Google优化一个网站最多仍只是一个猜谜游戏。一个网站的页面也许会被Google从索引中删除,但是站长对此却一头雾水。与此类似,一个站点内容会被检索到,也许只是因为搜索算法的某种怪癖,而唯一被评价(rank)的 页面也许是“关于我们”,或者是公司的新闻报道而已。
作为站长,我们只是由于google爬虫(Googlebot)的一时兴致而被访问到,而这看起来武断的算法会让一个站点一夜之间提升或者是降低了在搜索引擎上的排名。我们没有办法和google就一个站点而进行沟通--无论是了解到发生了什么事情,或者是当网站进行更新时告诉Google。
这一切在Google发布了Sitemaps之后已经发生了改变,但是这个东东在2006年2月Google用几个新工具更新了它之后才变得真正有用起来。
所以,Google Sitemap严格来说是个什么东东,以及你如何使用他来提升你的网站的排名?好吧,这里有两个使用Google Sitemaps的根本原因:
1、Sitemap给你提供了一个告诉Google关于你的网站有价值信息的途径;2、你能够通过Sitemaps来了解Google关注你网站的什么内容。
关于你的站点,你能够告诉Google些什么
不管相信与否,Google需要确信那些站长有能够与其交流关于他们站点重要信息的方式。虽然Google爬虫对于寻找和分页网页的工作做得很出色,它还是缺乏对于一个网页和其它网页相比的相对重要性的评价能力。毕竟,在互联网上许多重要的页面并不都被正确的“优化”,而且很多人并不在意他们花在连接那些最好的内容上所消耗的时间(and many of the people who couldn’t care less about spending their time on linking campaigns create some of the best content)。
因此,google给你这种能力:告诉他们一个给盯页面相对于其它所有页面的重要程度(使用0.0到1.0来作为尺度)。使用这个系统,你能够告诉Google你的首页是1.0,而你的每个产品板块是0.8,而你的独立产品页面是0.5。而关于你的公司的地址以及联系方式的页面只能评价为0.2。
你还能告诉Google你的页面多久会被更新以及每个页面最后被修改的时间。比如,你的首页也许会每天更新,而一个具体的产品页也许一年只会维护一次。
关于你的站点,Google能告诉你些什么
你拥有告诉Google哪些信息是有用的的能力,但是你甚至不需要为了享受拥有一个Google Sitemaps账号的自得而创建一个sitemap文件。
那是因为即使没有一个Sitemap文件,你仍然能够了解到任何Google爬虫从你的站点上发现的任何错误。就像你可能了解的那样,你的站点不会因为爬虫抓取页面有困难而被“中断”。 Google Sitemaps将告诉你那些它无法抓取的页面以及没法跟进(follow)的链接。因此,你能够在你的页面被google从索引中干掉之前了解到你的页面中存在的问题并即时修复它们。
你也能够了解到人们通过何种途径搜索到你的站点。当然,大多数网站分析工具都能够给你这个信息,但是如果你使用的工具没提供这个功能的话,那从google那里免费的获得它总还是不错滴。
但是这个Sitemap程序最好的部分是在2006年2月新增加的页面分析模块(section)。这个页面提供给你两个关键字(word)的清单。第一个清单包含了那些google爬虫基于你的网站内容分析出来的和你的网站相关的关键字(站点内容栏)。第二个清单则包含了爬虫发现的和你的网站链接的关键字(入口链接栏)!
不幸的是,google将每个清单中关键字的数目限制在20个(子乌注:我现在看sitemap并不止20个,可能是google扩充了吧)。因而,入口链接栏就被一部分类似“http”、“www”、“com”之类的关键字所浪费掉(子乌注:我的关键字里面居然有一些什么:看、大、站、中、最、毫秒之类毫无意义的单词……难道搜索“毫秒”能跑出我的站来么?不过无聊时倒是可以抓一些无意义的关键词,看如何组合才能找到自己的网站),而这些关键字基本上对于所有的网站都有效(嗨,Google,就不能把这些关键词从报告中屏蔽掉么?)。那就是说,这个清单能够提供给你一个判断你的网站优化措施是否有效的途径。
当你比较这两个清单,你能够对Google如何看待你的网站有个了解。如果出现在你站点内容栏的关键词并不真正能代表你希望google爬虫认为的你的网站,那你就该明白你需要加倍努力(tweak your copy??)以让它更多地关注到你的核心内容。
另一方面,如果你的入口链接中并不包含任何你认为合适的关键字,也许你应该将注意力放在在那个方向上。
除此以外,你需要努力让这两个清单变得一致(子乌注:汗,我的俩清单的差距真大……),你应该让你的入口链接关键字尽可能的匹配你的站点内容关键字。这就意味着Google对你的站点的重心有个清晰的认识。
Sitemaps程序的额外好处(子乌注:这是好处??)
Google已经开始通告那些参与Sitemaps(Sitemaps-participating)的站长--如果他们正在违反Google的Webmaster Guildlines的任何一条的话。这是一条非常有价值的信息--当你的站点突然被Google撤销索引,而你根本不知道为什么的时候。
只有Sitemaps参与者能够得到这个消息,而且还得取决于google的决定。实际上,如果你创建的网站毫无价值并且不提供原创内容,或者你创建了上千个桥页跳转去别的网页的话(子乌注:我的收藏夹算不算),google并不会通知你这些。google不会让那些sp@ammers获得任何有助于提升他们技术的线索。
如何开始使用Google Site Maps呢?
首先你要去申请一个Google账号。如果你已经有了Gmail,Adsense,或者Adwords账号,那就行了。如果没有,你能够去google账号页面注册一个账号。
如果你熟悉XML,创建你的sitemap文件相当简单,即时你不会,你也能够使用第三方工具比如列在google网站的那些。Google也有一个"Sitemap Generator" ,你能够下载并安装到你的服务器上,但除非你是python脚本的老手,你最好还是选择那些第三方工具。
无论如何,一旦你拥有了你的google账号而且你的sitemap文件已经创建,剩下的事情就很简单了。你所需要作的就是:
1、用你的账号登录;2、输入你的网站地址在“添加站点(Add Site)”框中,并点击确定(OK);3、点击你添加进管理站点的链接,并将你的sitemap文件加入到你的账号中。
Google Sitemaps --一个杰出的SEO工具
Google Sitemaps帮助Google爬虫迅速找到你站点上新的内容。它们也帮助你告诉google什么是重要的,什么是新的,而什么是经常变化的。提供给站长的这个工具将为你了解搜索引擎(尤其是google)如何看待你的站点起到很大作用。
使用这些信息,你能够迅速的提升你站点的排名并清除任何google发现的问题。你还可以使用这个google提供的工具来衡量你的站点优化措施的成效,使你能将你的时间和精力专注于能给你带来最大成功的行为上。
关于译者
子乌:一个不专注于自己工作的程序员,喜欢一切和工作没什么关系的技术。
关于作者
Matthew Coers 是一个互联网营销专家。他的网站,http://ProfitChoice.com 包含了一些在线教程,它们被设计来指导企业家如何创建一个站点如何在网上赚钱。 可以下载他的免费互联网营销报告:7 Days to Website Success

2006-10-03

捷足先登学用CSS:HTML结构化 (The Early Bird Catches the CSS: Planning Structural HTML)

捷足先登学用CSS:HTML结构化

作者:阿捷 2005-4-15 12:29:43


作者Virginia DeBolt照片

你正在学习CSS布局吗?是不是还不能完全掌握纯CSS布局?通常有两种情况阻碍你的学习:


第一种可能是你还没有理解CSS处理页面的原理。在你考虑你的页面整体表现效果前,你应当先考虑内容的语义和结构,然后再针对语义、结构添加CSS。这篇文章将告诉你应该怎样把HTML结构化。


另一种原因是你对那些非常熟悉的表现层属性(例如:cellpadding,、hspace、align="left"等等)束手无策,不知道该转 换成对应的什么CSS语句。当你解决了第一种问题,知道了如何结构化你的HTML,我再给出一个列表,详细列出原来的表现属性用什么CSS来代替。


结构化HTML


我们在刚学习网页制作时,总是先考虑怎么设计,考虑那些图片、字体、颜色、以及布局方案。然后我们用Photoshop或者Fireworks画出来、切割成小图。最后再通过编辑HTML将所有设计还原表现在页面上。


如果你希望你的HTML页面用CSS布局(是CSS-friendly的),你需要回头重来,先不考虑“外观”,要先思考你的页面内容的语义和结构。


外观并不是最重要的。一个结构良好的HTML页面可以以任何外观表现出来,CSS Zen Garden是一个典型的例子。CSS Zen Garden帮助我们最终认识到CSS的强大力量。


HTML不仅仅只在电脑屏幕上阅读。你用photoshop精心设计的画面可能不能显示在PDA、移动电话和屏幕阅读机上。但是一个结构良好的HTML页面可以通过CSS的不同定义,显示在任何地方,任何网络设备上。


开始思考


首先要学习什么是"结构",一些作家也称之为"语义"。这个术语的意思是你需要分析你的内容块,以及每块内容服务的目的,然后再根据这些内容目的建立起相应的HTML结构。


如果你坐下来仔细分析和规划你的页面结构,你可能得到类似这样的几块:



  • 标志和站点名称

  • 主页面内容

  • 站点导航(主菜单)

  • 子菜单

  • 搜索框

  • 功能区(例如购物车、收银台)

  • 页脚(版权和有关法律声明)


我们通常采用DIV元素来将这些结构定义出来,类似这样:


<div id="header"></div>

<div id="content"></div>

<div id="globalnav"></div>

<div id="subnav"></div>

<div id="search"></div>

<div id="shop"></div>

<div id="footer"></div>

这不是布局,是结构。这是一个对内容块的语义说明。当你理解了你的结构,就可以加对应的ID在DIV上。DIV容器中可以包含任何内容块,也可以嵌套另一个DIV。内容块可以包含任意的HTML元素---标题、段落、图片、表格、列表等等。


根据上面讲述的,你已经知道如何结构化HTML,现在你可以进行布局和样式定义了。每一个内容块都可以放在页面上任何地方,再指定这个块的颜色、字体、边框、背景以及对齐属性等等。


使用选择器是件美妙的事


id的名称是控制某一内容块的手段,通过给这个内容块套上DIV并加上唯一的id,你就可以用CSS选择器来精确定义每一个页面元素的外观表现,包 括标题、列表、图片、链接或者段落等等。例如你为#header写一个CSS规则,就可以完全不同于#content里的图片规则。


另外一个例子是:你可以通过不同规则来定义不同内容块里的链接样式。类似这样:#globalnav a:link或者 #subnav a:link或者#content a:link。你也可以定义不同内容块中相同元素的样式不一样。例如,通过#content p和#footer p分别定义#content和#footer中p的样式。从结构上讲,你的页面是由图片、链接、列表、段落等组成的,这些元素本身并不会对显示在什么网络 设备中(PDA还是手机或者网络电视)有影响,它们可以被定义为任何的表现外观。


一个仔细结构化的HTML页面非常简单,每一个元素都被用于结构目的。当你想缩进一个段落,不需要使用blockquote标签,只要使用p标签, 并对p加一个CSS的margin规则就可以实现缩进目的。p是结构化标签,margin是表现属性,前者属于HTML,后者属于CSS。(这就是结构于 表现的相分离.)


良好结构的HTML页面内几乎没有表现属性的标签。代码非常干净简洁。例如,原先的代码<table width="80%" cellpadding="3" border="2" align="left">,现在可以只在HTML中写<table>,所有控制表现的东西都写到CSS中去,在结构化的HTML中, table就是表格,而不是其他什么(比如被用来布局和定位)。


亲自实践一下结构化


上面说的只是最基本的结构,实际应用中,你可以根据需要来调整内容块。常常会出现DIV嵌套的情况,你会看到"container"层中又有其它层,结构类似这样:


<div id="navcontainer">

<div id="globalnav">

<ul>a list</ul>

</div>

<div id="subnav">

<ul>another list</ul>

</div>

</div>

嵌套的div元素允许你定义更多的CSS规则来控制表现,例如:你可以给#navcontainer一个规则让列表居右,再给#globalnav一个规则让列表居左,而给#subnav的list另一个完全不同的表现。


用CSS替换传统方法


下面的列表将帮助你用CSS替换传统方法:


HTML属性以及相对应的CSS方法























































HTML属性 CSS方法 说明
align="left"

align="right"
float: left;

float: right;

使用CSS可以浮动 任何元素:图片、段落、div、标题、表格、列表等等


当你使用float属性,必须给这个浮动元素定义一个宽度。

marginwidth="0" leftmargin="0" marginheight="0" topmargin="0" margin: 0;

使用CSS, margin可以设置在任何元素上, 不仅仅是body元素.更重要的,你可以分别指定元素的top, right, bottom和left的margin值。

vlink="#333399" alink="#000000" link="#3333FF"

a:link #3ff;

a:visited: #339;

a:hover: #999;

a:active: #00f;

在HTML中,链接的颜色作为body的一个属性值定义。整个页面的链接风格都一样。使用CSS的选择器,页面不同部分的链接样式可以不一样。

bgcolor="#FFFFFF" background-color: #fff;

在CSS中,任何元素都可以定义背景颜色,不仅仅局限于body和table元素。

bordercolor="#FFFFFF" border-color: #fff;

任何元素都可以设置边框(boeder),你可以分别定义top, right, bottom和left

border="3"

cellspacing="3"
border-width: 3px;

用CSS,你可以定义table的边框为统一样式,也可以分别定义top, right, bottom and left边框的颜色、尺寸和样式。


你可以使用 table, td or th 这些选择器.


如果你需要设置无边框效果,可以使用CSS定义: border-collapse: collapse;

<br clear="left">

<br clear="right">

<br clear="all">

clear: left;

clear: right;

clear: both;

许多2列或者3列布局都使用 float属性来定位。如果你在浮动层中定义了背景颜色或者背景图片,你可以使用clear属性.

cellpadding="3"

vspace="3"

hspace="3"
padding: 3px;

用CSS,任何元素都可以设定padding属性,同样,padding可以分别设置top, right, bottom and left。padding是透明的。

align="center"

text-align: center;


margin-right: auto; margin-left: auto;

Text-align 只适用于文本.


象div,p这样的块级怨毒可以通过margin-right: auto; 和margin-left: auto;来水平居中


一些令人遗憾的技巧和工作环境


由于浏览器对CSS支持的不完善,我们有时候不得不采取一些技巧(hacks)或建立一种环境(Workarounds)来让CSS实现传统方法同 样的效果。例如块级元素有时侯需要使用水平居中的技巧,盒模型bug的技巧等等。所有这些技巧都在Molly Holzschlag的文章《Integrated Web Design: Strategies for Long-Term CSS Hack Management》中有详细说明。


另外一个关于CSS技巧的资源站点是Big John和Holly Bergevin的“Position is Everything”。


理解浮动行为


Eric Meyer的《Containing Floats》将帮助你掌握如何使用float属性布局。float元素有时候需要清除(clear),阅读《How To Clear Floats Without Structural Markup》将非常有帮助。


更多帮助


已有的《CSS Discussion》 列表是很好的资源,它收集了一个WiKiA讨论组的信息,其中包括CSS布局总结(css-discuss.incutio.com/?page= CssLayouts),CSS 技巧总结 (css-discuss.incutio.com/?page=CssHack) 以及更多。