Posts Tagged user

google管理员工具提示robots.txt语法有误的解决

网站使用了google管理员工具,但在抓取工具的权限这一项里,老是有问题,具体是:

第 1行:?User-agent:*   语法有误

认真检查了robots.txt文件,并没有那个门号或其它字符

上网查了下,才知道是编码问题

因为我习惯用UE将所有文件保存成utf-8格式,而google管理员工具是不能正常读取这种格式的

解决方法,保存为ANSI格式

  • Share/Bookmark

Tags: ,

FlashFXP 命令行参数

FlashFXP 帮助中有一些介绍,查看FlashFXP Help — Advanced — FlashFXP Command Line Options

::FlashFXP启动后,修复注册表位置为当前路径。
C:\FlashFXP\FlashFXP.exe -repair

::FlashFXP启动后,修复注册表信息。
C:\FlashFXP\FlashFXP.exe -setreg

::FlashFXP启动后,立刻最小化。
C:\FlashFXP\FlashFXP.exe -min

::FlashFXP启动后,最小化至系统托盘。
C:\FlashFXP\FlashFXP.exe -tray

::FlashFXP启动后,设置本地路径为 D:\TDDownload
C:\FlashFXP\FlashFXP.exe -local=”D:\TDDownload”

::FlashFXP启动后,使用指定用户名、密码和端口登陆到指定的FTP服务器。
::remotepath为目录名,不写则为FTP根目录。如果remotepath ,不存在则返回至FTP根目录。
C:\FlashFXP\FlashFXP.exe ftp://user:password@IP:port -remotepath=”/tmp”

::也可以不使用 -remotepath参数 直接写成
C:\FlashFXP\FlashFXP.exe ftp://user:password@IP:port/tmp

::上传文件
C:\FlashFXP\FlashFXP.exe -upload ftp://user:password@IP:port -localpath=”D:\TDDownload\test.txt” -remotepath=”/tmp/test.txt”

::下载文件
C:\FlashFXP\FlashFXP.exe -c4 -local=”D:\TDDownload” -download ftp://user:password@IP:port -remotepath=”/tmp/test.txt” -localpath=”D:\TDDownload\test.txt”

Flashfxp不用任何工具就可以查看密码

这里给大家介绍了一个小方法可以方便的查看到站点的保存用户名及密码。

依次点击“站点”——“站点管理器”,然后在快速连接或者下面的站点列表处右击站点名称。

然后选择“复制到剪切板”这时会弹出一个“是否复制用户名和密码”,点击是。

然后粘贴到记事本里面就是明文显示的啦。

结合上一编文章,很容易实现在网站管理系统中,点击网站相应按钮打开对应的网站FTP

  • Share/Bookmark

Tags: , , , ,

msn官方在线状态接口(JSON形式)

MSN提供了查询MSN在线状态的接口:

http://messenger.services.live.com/users/zxxmicki@live.com/presence/?cb=showpresence

zxxmicki@live.com请更改为自己的MSN ID

返回数据是JSON形式的字符串,如下:

showpresence({ “icon”:{ “url”:”http\u003a\u002f\u002fwww.wlmessenger.net\u002fstatic\u002fimg\u002fpresence\u002fAway.gif”,”height”:16,”width”:16 },”statusText”:”Away”,”status”:”Away”,”displayName”:”zhuang”,”id”:”zxxmicki\u0040live.com”,”result”:{ “code”:200,”response”:”OK” } });

可用preg_match()函数直接进行判断得到在线状态

  • Share/Bookmark

Tags: , , , ,

Mysql删除指定字段的重复记录

delete users_groups as a from users_groups as a,
(
select *,min(id) from users_groups group by uid having count(1) > 1
) as b
 where a.uid = b.uid and a.id > b.id;
保留id最小的那个uid值
  • Share/Bookmark

Tags: , , , ,

cPanel没有backup选项的解决方法

买了个VPS,发现cPanel界面里没有backup选项,这个选项一般是在Files目录里的

强行进去,即通过frontend/x3/backup/index.html地址进入backup功能,可以操作,但操作并得不到执行

其实是因为whm里没有设置好,因为使用的是默认设置,不同的服务器商可能默认设置也不同

具体设置方法如下:

进入WHM->Main >> Packages >> Feature Manager

编辑Default Feature List,如果你的packages使用的是它的话

勾选 Backup Manager    Backup Wizard 两个选项即可

Packages >> Feature Manager里面的设置是开启相应的cpanel功能,说明如下:

The feature manager allows you to disable/enable features inside of each users cPanel. Once you build a feature list you should edit the package you wish to assign it to and add the feature list.

The feature lists for cPAddons (user installable scripts) can be found by following the link in the feature list editor
Two special feature lists called “default” and “disabled” will affect all users.

  • Share/Bookmark

Tags: , , , ,

浏览器脚本之Navigator对象

Navigator 对象包含有关浏览器的信息。

注释:没有应用于 navigator 对象的公开标准,不过所有浏览器都支持该对象。

IE: Internet Explorer, F: Firefox, O: Opera.

Navigator 对象集合

集合 描述 IE F O
plugins[] 返回对文档中所有嵌入式对象的引用。

该集合是一个 Plugin 对象的数组,其中的元素代表浏览器已经安装的插件。Plug-in 对象提供的是有关插件的信息,其中包括它所支持的 MIME 类型的列表。

虽然 plugins[] 数组是由 IE 4 定义的,但是在 IE 4 中它却总是空的,因为 IE 4 不支持插件和 Plugin 对象。

4 1 9

Navigator 对象属性

属性 描述 IE F O
appCodeName 返回浏览器的代码名。 4 1 9
appMinorVersion 返回浏览器的次级版本。 4 No No
appName 返回浏览器的名称。 4 1 9
appVersion 返回浏览器的平台和版本信息。 4 1 9
browserLanguage 返回当前浏览器的语言。 4 No 9
cookieEnabled 返回指明浏览器中是否启用 cookie 的布尔值。 4 1 9
cpuClass 返回浏览器系统的 CPU 等级。 4 No No
onLine 返回指明系统是否处于脱机模式的布尔值。 4 No No
platform 返回运行浏览器的操作系统平台。 4 1 9
systemLanguage 返回 OS 使用的默认语言。 4 No No
userAgent 返回由客户机发送服务器的 user-agent 头部的值。 4 1 9
userLanguage 返回 OS 的自然语言设置。 4 No 9

Navigator 对象方法

方法 描述 IE F O
javaEnabled() 规定浏览器是否启用 Java。 4 1 9
taintEnabled() 规定浏览器是否启用数据污点 (data tainting)。 4 1 9

Navigator 对象描述

Navigator 对象包含的属性描述了正在使用的浏览器。可以使用这些属性进行平台专用的配置。

虽然这个对象的名称显而易见的是 Netscape 的 Navigator 浏览器,但其他实现了 JavaScript 的浏览器也支持这个对象。

Navigator 对象的实例是唯一的,可以用 Window 对象的 navigator 属性来引用它。

顺便提一个,在Firefox中,即navigator.appName=Netscape时,是支持另一个东西的,即navigator.language

其它的三个language倒是不支持

  • Share/Bookmark

Tags: , , , , , , ,

cPanel添加域名强制检查DNS servers问题

用cPanel时,常遇到这类问题

Error from park wrapper: Using nameservers with the following IPs: ………   Sorry, the domain is already pointed to an IP address that does not appear to use DNS servers associated with this server.  Please transfer the domain to this servers nameservers or have your administrator add one of its nameservers to /etc/ips.remotedns and make the proper A entries on that remote nameserver.

其实就是为所有权检查,还有一些安全而考虑的

有的服务器商就去掉了这种检验机制,因为DNS更改时延造成的麻烦很大

而bluehost的检验机制更为强大

如何关了?如果你有WHM管理权限,可按如下处理:

Fix the option in WHM. In whm->tweak settings, make sure that this option is checked:

Quote:
Allow Creation of Parked/Addon Domains that resolve to other servers (i.e. domain transfers) [This can be a major security problem. If you must have it enabled, be sure to not allow users to park common internet domains.] 

This really is redundant any more and doesn’t need to be used. Just make SURE to follow the instructions and NOT allow users to park common domains.

This can (at times) become a security issue, but only if you don’t keep a close eye on what your users are doing.

  • Share/Bookmark

Tags: , , , , , , ,

GOOGLE翻墙代码

<?php
ini_set(‘max_execution_time’, 60);//脚本最大允许执行时长祿  表示没有限制
ini_set(‘memory_limit’, ’128M’);//限制最大占用的内存 28M
ini_set(‘error_reporting’, 0);
ini_set(‘display_errors’, 0);
ini_set(‘magic_quotes_runtime’, 0);//默认为off,意为不转义从文件读取或数据库中查询获得的数据
ini_set(‘magic_quotes_sybase’, 0);//是否采用Sybase形式的自动字符串转义★★
ini_set(‘default_mimetype’, ‘text/html’);//设置默认mime类型为text/html
ini_set(‘default_charset’,'UTF-8′);//设置默认编码为UTF-8
ini_set(‘default_socket_timeout’, ’60′);//默认socket超时(祿
ini_set(‘date.timezone’, ‘UTC’);//设置时区 //date_default_timezone_set(‘UTC’);
//检查gzip加速支持情儿
if ( extension_loaded(‘zlib’) && strstr($_SERVER["HTTP_ACCEPT_ENCODING"],”gzip”) ) {
 ob_start(‘ob_gzhandler’);
} else {
 ob_start();
}
//header(‘Content-Type: text/html; charset=UTF-8′);
//header(‘Content-language: zh-CN’);
//header(‘Expires:-1′);
header(‘Server: gws’);
header(‘X-Powered-By: gushu’); 

$str1 = array(
     ‘<title>Google</title>’,
     ‘Google 搜索</title>’,
     ‘www.google.com.hk’,
     ‘zh-TW’
     );
$str2 = array(‘
     <title>CrazyLemon提供Google在线翻墙搜索服务</title>’,
     ‘CrazyLemon提供Google在线翻墙搜索服务</title>’,
     ‘www.crazylemon.net/google’,
     ‘zh-CN’
     );
     //echo $_SERVER["QUERY_STRING"];
if(!empty($_SERVER["QUERY_STRING"])){
 $q = str_replace(‘hl=zh-TW’,'hl=zh-CN’,$_SERVER["QUERY_STRING"]);
 $url = ‘http://www.google.com.hk/search?’.$q;
}else{
 $url = ‘http://www.google.com.hk/’;
}
$user_agent = $_SERVER["HTTP_USER_AGENT"];
$referer_url = ‘http://www.gushu.cn/’;
//$url 需要抓取的页面地址
//$user_agent 需要返回的user_agent信息 如“baiduspider”或“googlebot
$ch = curl_init();
curl_setopt ($ch, CURLOPT_URL, $url);
//curl_setopt ($ch, CURLOPT_HEADER, 1);
curl_setopt ($ch, CURLOPT_USERAGENT, $user_agent);
curl_setopt ($ch, CURLOPT_REFERER, $referer_url);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION,1);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
/*
curl_setopt ($ch, CURLOPT_HEADER, 1);
curl_setopt ($ch, CURLOPT_COOKIE, $_COOKIE);
curl_setopt ($ch, CURLOPT_POST, $_POST);
*/
if(!curl_errno($ch))
{
 $google =str_replace(“/search”,”/google/search”, curl_exec ($ch));

 echo str_replace($str1,$str2,$google);
}
curl_close($ch);

ob_end_flush();
?>

如何把一段文本里的A标签都去掉?

preg_replace(array(“/\<a[^\>]+\>/i”,”/\<\/a\>/i”), “”, $string);

  • Share/Bookmark

Tags: , , , , , , , , , , , , , ,

php远程下载文件到服务器

由于所买的虚拟主机没有申请SSH或根本不提供SSH访问,无法直接在shell里用get命令获取远程数据,在转移数据时只能通过FTP下载到本地再上传到另一台主机上,速度很慢,如果能直传就好了

解决方法如下,写个PHP文件在A主机上,直接通过PHP脚本下载B主机上的文件到A主机,代码如下:

<form method=”post”>
文件地址:<input name=”url” size=”50″ /><br>
操作密码:<input name=”pwd” size=”30″ />
<input name=”submit” type=”submit” />
</form>
<?php
$pwd=’abcd’;
if ($_POST['pwd']!=$pwd)
exit(‘Sorry ,you are not validate user!’);
// maximum execution time in seconds
set_time_limit (24 * 60 * 60);
if (!isset($_POST['submit'])) die();
// folder to save downloaded files to. must end with slash
$destination_folder = ‘temp/’;
 
$url = $_POST['url'];
$newfname = $destination_folder . basename($url);
$file = fopen ($url, “rb”);
if ($file) {
$newf = fopen ($newfname, “wb”);
if ($newf)
while(!feof($file))
{
fwrite($newf, fread($file, 1024 * 8 ), 1024 * 8 );
}
}
if ($file)
{
fclose($file);
}
if ($newf) {
fclose($newf);
echo ‘OK,File has been downloaded!’;
}
?>

基中$pwd是操作密码,这样不会被人乱下东西挤爆硬盘了

  • Share/Bookmark

Tags: , , , , , , , , ,

如何写robots.txt?(摘点石)

在国内,网站管理者似乎对robots.txt并没有引起多大重视,应一些朋友之请求,今天想通过这篇文章来简单谈一下robots.txt的写作。

 

robots.txt基本介绍

robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。

当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

另外,robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

robots.txt写作语法

首先,我们来看一个robots.txt范例:http://www.seovip.cn/robots.txt

访问以上具体地址,我们可以看到robots.txt的具体内容如下:

# Robots.txt file from http://www.seovip.cn
# All robots will spider the domain

User-agent: *
Disallow:

以上文本表达的意思是允许所有的搜索机器人访问www.seovip.cn站点下的所有文件。

具体语法分析:其中#后面文字为说明信息;User-agent:后面为搜索机器人的名称,后面如果是*,则泛指所有的搜索机器人;Disallow:后面为不允许访问的文件目录。

下面,我将列举一些robots.txt的具体用法:

允许所有的robot访问

User-agent: *
Disallow:

或者也可以建一个空文件 “/robots.txt” file

禁止所有搜索引擎访问网站的任何部分

User-agent: *
Disallow: /

禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)

User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/

禁止某个搜索引擎的访问(下例中的BadBot)

User-agent: BadBot
Disallow: /

只允许某个搜索引擎的访问(下例中的Crawler)

User-agent: Crawler
Disallow:

User-agent: *
Disallow: /

另外,我觉得有必要进行拓展说明,对robots meta进行一些介绍:

Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。

Robots META标签的写法:

Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。 content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。

INDEX 指令告诉搜索机器人抓取该页面;

FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

Robots Meta标签的缺省值是INDEX和FOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW。

这样,一共有四种组合:

<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,FOLLOW”>
<META NAME=”ROBOTS” CONTENT=”INDEX,NOFOLLOW”>
<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>

其中

<META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”ALL”>;

<META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”>可以写成<META NAME=”ROBOTS” CONTENT=”NONE”>

目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:

<META NAME=”googlebot” CONTENT=”index,follow,noarchive”>

  • Share/Bookmark

Tags: , , , , , , , , ,