Posts Tagged sitemap

上一篇关于Ecpss跳转的文章成功了

源于考拉同学上行联系了我,得知他是搜ecpss跳转这个词找到我的

查了下,ecpss跳转这个词在google中文里排第六位左右,排上去的文章只有几句话,标题中只有“ecpss”,内容中包含“Ecpss跳转”而已;上一篇ECPSS跳转文章一发部,马上跃居第一位

这应该可以说明,一篇文章,是乱写还是为SEO而写关系很大,要养成内部优化的好习惯

一篇文章上去了,同样的词另一篇文章就下来了,这样也挺合理的

另外,收录的地址是http://www.crazylemon.net/zencart/3353.html?utm_source=rss&utm_medium=rss&utm_campaign=ecpss%25e8%25b7%25b3%25e8%25bd%25ac%25e6%258e%25a5%25e5%258f%25a3-for-zen-cart

怀疑是wordpress sitemap ping功能造成的

可恶的是,百度上的排名新的文章居然没有,而新文章同步到新浪博客的居然排第一了,这博客还是今天刚开的。。。。\

看来为了百度流量,同步到各大博客还是有必要的

  • Share/Bookmark

Tags: , , , , , , , , , , ,

zen cart 1.39版与现有sitemap xml不兼容

因为sitemap xml模块用xsl文件来控制样式

而zen cart 1.39版为安全性考虑,并不让这类文件可访问,在.htaccess里

所以sitemap xml文件打开时会报错

解决方法是在admin/includes/.htaccess里把xsl文件类型加到allow里

  • Share/Bookmark

Tags: ,

什么情况下google spider会来抓取新站页面

有个想法,想测试下什么情况下google spider(谷歌蜘蛛)会来踩点,即来抓取一个新站

1、有效外链,即已被GG收录并经常更新的网站的dofollow链接

2、无效外链,即已被GG收录并经常更新的网站的nofollow链接

3、刷刷流量,即通过软件刷,不过估计GG是测不到的

4、加入google网站管理员工具

5、Google Analytics,据说很强大的东西,可我不喜欢

6、到GG官方提交地址提交网址

7、用Google浏览器打开几次网页玩玩

8、用装有google工具体栏的浏览器玩

9、用sitemap去ping

10、让其它搜索引擎收录,看google会不会看不下去主动来收

11、用google多搜几次我的网址,不信它不好奇

12….

还有什么想法的跟上

  • Share/Bookmark

Tags: , , ,

lightinthebox的robots.txt

User-agent:*
Disallow: /cache/

User-Agent: almaden
Disallow: /
User-Agent: ASPSeek
Disallow: /
User-Agent: Axmo
Disallow: /
User-Agent: BaiduSpider
Disallow: /
User-Agent: booch
Disallow: /
User-Agent: DTS Agent
Disallow: /
User-Agent: Downloader
Disallow: /
User-Agent: EmailCollector
Disallow: /
User-Agent: EmailSiphon
Disallow: /
User-Agent: EmailWolf
Disallow: /
User-Agent: Expired Domain Sleuth
Disallow: /
User-Agent: Franklin Locator
Disallow: /
User-Agent: Gaisbot
Disallow: /
User-Agent: grub
Disallow: /
User-Agent: HughCrawler
Disallow: /
User-Agent: iaea.org
Disallow: /
User-Agent: lcabotAccept
Disallow: /
User-Agent: IconSurf
Disallow: /
User-Agent: Iltrovatore-Setaccio
Disallow: /
User-Agent: Indy Library
Disallow: /
User-Agent: IUPUI
Disallow: /
User-Agent: Kittiecentral
Disallow: /
User-Agent: iaea.org
Disallow: /
User-Agent: larbin
Disallow: /
User-Agent: lwp-trivial
Disallow: /
User-Agent: MetaTagRobot
Disallow: /
User-Agent: Missigua Locator
Disallow: /
User-Agent: NetResearchServer
Disallow: /
User-Agent: NextGenSearch
Disallow: /
User-Agent: NPbot
Disallow: /
User-Agent: Nutch
Disallow: /
User-Agent: ObjectsSearch
Disallow: /
User-Agent: Oracle Ultra Search
Disallow: /
User-Agent: PEERbot
Disallow: /
User-Agent: PictureOfInternet
Disallow: /
User-Agent: PlantyNet
Disallow: /
User-Agent: QuepasaCreep
Disallow: /
User-Agent: ScSpider
Disallow: /
User-Agent: SOFT411
Disallow: /
User-Agent: spider.acont.de
Disallow: /
User-Agent: Sqworm
Disallow: /
User-Agent: SSM Agent
Disallow: /
User-Agent: TAMU
Disallow: /
User-Agent: TheUsefulbot
Disallow: /
User-Agent: TurnitinBot
Disallow: /
User-Agent: Tutorial Crawler
Disallow: /
User-Agent: TutorGig
Disallow: /
User-Agent: WebCopier
Disallow: /
User-Agent: WebZIP
Disallow: /
User-Agent: ZipppBot
Disallow: /
User-Agent: Xenu
Disallow: /
User-Agent: Wotbox
Disallow: /
User-Agent: Wget
Disallow: /
User-Agent: NaverBot
Disallow: /
User-Agent: mozDex
Disallow: /
User-Agent: Sosospider
Disallow: /
Sitemap:http://localhost/sitemapindex.xml

看来除了google和yahoo,lightinthebox不打算让别的搜索引擎收录了

百度site一下,只收了首页,title是兰亭国际,挺有趣的

  • Share/Bookmark

Tags: , , , , , , , , , , , , ,

zen cart sitemap xml language=en

zen cart sitemap xml功能,生成XML文件时,地址后面有个?language=en,不论是否影响优化,看着碍眼

去除方法,后台sitemap xml->Generate language_id for default language改为false

然后重新生成,如果不行话,删了原来的,并关闭浏览器重新生成,cookie问题

  • Share/Bookmark

Tags: ,

google收录页面好快

发现自己博客上发完一篇文章都是立马被google收录,这感觉挺不错的

不知道和wordpress的xml-sitemap插件关系大不大,也懒得去做SEO试验了

今天不想睡,继续一个人的空虚

另外发现傲游有时发神经,我的博客源代码中文字符全变乱码了

在IE和firefox则是正常的

晚上忙得头晕,怎么不去死,额。。。

昨天很疯,又灌趴下几个人,自己没事,但麻木了

  • Share/Bookmark

Tags: , , , ,

网站遭遇攻击

一网站受到攻击,看了下,还真有意思

一、攻击时请求的都是子页面,没有请求主页,看来是预先设置或收集了目标站的sitemap

二、攻击来源IP来自全球各地,大约有两百多个,来路域名居然都是http://www.whitehouse.net

这网站像个恶搞白宫的,很早注册,PR值也达到了6,不知道是真来源,还是伪装的,不过基本可以肯定黑客的技术和资源都很不错

三、请求是通过程序处理的,所以CNZZ代码得不到本地执行,无法通过CNZZ得到统计数据

四、最高时每秒并发也只是近百,但足以让服务器响应http 500错误了

五、关了SEO URLS时(主要是去掉.htaccess的rewrite规则),情况好转,因为对方请求的是伪静态子页面,全部404 not found

六、解决办法,收集攻击来源IP,过滤下,在.htaccess里阻止掉,代码如下:

<Files 403.shtml>
order allow,deny
allow from all
</Files>

deny from XXX.XXX.XXX.XXX
……

这样做,这些来源IP的请求全部403了,哈哈

经处理,后来攻击停了,持续了5小时左右,看来对方也累

这次bluehost居然没有主动关闭空间,很是奇怪啊,CPU使用率都超高了,访问日志文件也飙得很快

  • Share/Bookmark

Tags: , , , , , , , , ,

zen cart xml sitemap更新

如果Use Existing Files这项为true的话,就算用批量表(easy populate)更改了产品信息什么的,xml sitemap也是不认帐的,会判定为产品或目录没更新,直接用现有的xml文件生成,因为它只认数据库表里记录的last modified;而easy populate是不更新这项数据的

所以,需要进后台更改更新下相应的目录或产品,就算不改数据,只是走个形式,重要的是表记录值会有变动

另外,产品名或目录中的空格千万不要弄成全角的,否则显示出来不是空格而是像ii的字符,乱码了

  • Share/Bookmark

Tags: ,

关于GOOGLE的沙盒期

先摘录网友的一些说法:

前几天才大体做完了我的提供流量统计服务的站,很快就看到google收录了,可是最近2天发现,google好像停止收录了,询问了几个seor,才知道,我的站可能进入google沙盒了。进去沙盒,基本上是每个新站的必经之路,所以现在收集了一些内容,整理出现在的文章,希望遇到这种问题的站长朋友不要着急,按照google的路子慢慢来,争取尽快走出沙盒期。

  何谓沙盒?

  Google沙盒用一句简单的话说就是你的网站在Google的测试期还没有参与正式的排名。之所以出现沙盒现象,主要是Google针对过度进行SEO——尤其采用了作弊如“制造”大量导入链接而获得高排名的网站采取的防备措施。因此,如果你的网站在发布不久后以核心关键字在Google排名中出现由高走低的不稳定现象,多半是被Google请进了沙盒。

  沙盒出现时,可能的误解?——认为google降权!

  google降权和google沙盒是两回事。沙盒是指新站在Google搜索结果的审核期,稍不留神就会进去,但是也很容易摆脱出来,可以等待,也可以使用一些技巧,一般都出现在新站中,偶尔饿有一前以上的站出现,而且搜索关键词在引擎当中是无法找到网站的,除非site能够找到,更确切的是说网站仍然收录,但是不予排名,并且在沙盒中的网站Google不给予pr值。

  降权是指网站在优化当中可能优化过度或是用了黑帽等手段,被Google惩罚,其现象是排名统一的搬后几页,site也能找到所有结果,而且Google对网站的更新速度等仍未改变,并且pr值不会因此有什么变动,通常降权后的网站什么都没有改变,改变的唯一是排名,它也仍然能够发挥友情链接的作用,帮助其它网站提升排名。

  如何应对?

  无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,试着与google友善。当排名在短时间内迅速上升时不应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容,提高内容质量,获得更高质量的导入链接,增加网站访问量,才能将排名优势一直保持下去。

  在沙盒时期,站长应该主要做的是完善网站,主要是补充网站的内容,最好的是原创的内容喽!这样才能让Google补充新鲜的血液的同时你的网站才能够Google更好地收录。当你的网站还在被Sandbox沙盒效应影响的时候,你应该利用这段时间来增加网站的内容,寻求更多的导入链接。实际上有了沙盒效应,对很多网站运行者来说,可能是一件好事。因为在大概半 年的时间里,你只能把精力放在网站内容上面。而不会去考虑排名。但是从长远来看,一旦沙盒效应结束,你的导入链接的年龄也足够长了,会被记入算法当中。你的网站也有了足够的内容,那么你的网站排名会有一个质的飞跃。

  简单说下具体操作:

  1,进一步完善内链,根据GG管理员工具对SITEMAP进行修改,及少数残留不规范页面修改

  2,坚持更新(做不到每天一更新,也要做到两三天一更新),更新内容需在首页有呈献。内容上为最新的一些行业新闻,且在别的网站出现较少的,至少修改后做成伪原创。

  3,到一些站长网、365key、YAHOO知识人等搜索引擎更新快的地方,根据问题组织发表“原创文章”,然后将链接帖在答案处。注意个细节,答案不要帖全,后面用省略号,这样做,至少可以把访问者引入我们的文章页。

  真正的站长不但会为进入沙盒抱怨google,而是把这当作一种契机,努力发展、优化、更新网站,这样,沙盒期过后,网站一般会有一个很好的权重,也就有一个很好的排名。

  最后说一下:1.Google的Sandbox-沙盒效应一般会持续6个月,这6个月内新站应该不断完善各方面SEO,沙盒效应过后,一般会有不错的排名。

  2.百度对新站也有一个“建立信任期”,一般是2个月。这两个月内,过多得修改网站结构,修改文章标题,会造成百度对站点信任度的降低。

这样子说有点可怕,因为时间是来不及了,希望网站不被列入沙盒

我自己的博客当时也被列入过,持续了三四个月,后来一更新PR就从0到3了,某些关键字排名和访问量也突然大增

  • Share/Bookmark

Tags: , , , , , ,

Ask.com和bing(微软必应) sitemaps 提交方法

2007年4月,四大搜索引擎Google、Yahoo、Live Search和Ask 在同一天宣布支持sitemap robots 协议,使得网站地图sitemap 协议更好地得到普及。除此之后,Google 和Yahoo 还分别提供了专门的sitemaps 文件提交入口,这有助于搜索引擎更好地发现网站的sitemaps 文件。

据SEL 介绍,Ask.com 也开始提供向用户提供sitemaps 网站地图文件提交入口,不过有点与众不同。它是通过ping 工具来向Ask 提交的,即get参数,用法如下:

http://submissions.ask.com/ping?sitemap=http://www.crazylemon.net/sitemap.xml

注意要输入完整的sitemap 文件地址。如果看到“Your Sitemap submission was successful”提示界面即表示提交成功。

同时,微软必应(bing)也有提供sitemaps 网站地图文件提交入口,用法如下

http://cn.bing.com/webmaster/ping.aspx?sitemap=www.crazylemon.net/sitemap.xml

不管有没有效,都提示Thanks for submitting your sitemap.

很恶心

  • Share/Bookmark

Tags: , , , , , , ,