2013八月8

Shell学习之Lynx

 

shell学习之awk

 

Shell学习笔记之grep

 

xargs命令-shell学习笔记

 

find的命令 – shell学习笔记

学习了下lynx命令,下面来总结下,lynx是遍历网页上的链接

遍历一个页面上的链接

1

 

 

$ lynx -dump "http://www.hozseo.com"

 

查询一个页面上的内部链接数量

2

 

$ lynx -dump "http://www.hozseo.co[......]

Read more

2013七月29

shell学习之awk

之前写了shell的grep命令,今天来总结下awk吧。awk的命令,就类似于在excel中进行检索文件一样,结合grep命令,可以进行数据的处理。

格式:awk 【参数】  ‘执行命令’   文件名

执行命令分为三个:BEGIN  #在扫描整个文件前执行的命令#

                                    命令   &[......]

Read more

2013七月23

Shell学习笔记之grep

grep是查找的命令,查找中不少时候需要用到正则表达式,这个需要多多练习掌握下

grep 逐行检索,显示全部

grep “xxxx" 文件名

 

 

-P 代表正则表达式

例如,要从日志中查找爬虫抓取的特定的URL

 

 

 

-oP 代表查找内容完全匹配输出打印,如上例中单独输出爬虫抓取特定URL

 

 

-An A代表after n代表行数,A5则是查找特定内容后5行

-Bn B代表before n代表行数,B5则是查找特定内容前5行

例如,查找/rec[......]

Read more

2013七月4

xargs命令-shell学习笔记

对于这个理解不是很好,需要再研究下:

  在使用find命令的-exec选项处理匹配到的文件时,find命令将所有匹配到的文件一起传递给exec执行。不幸的是,有些系统对能够传递给exec的命令长度有限制,这样在find命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是xargs命令的用处所在,特别是与find命令一起使用。

Find命令把匹配到的文件传递给xargs命令,而xargs命令每次只获取一部分文件而不是全部,不像-exec选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。在有些系统中,使用-exec选项[......]

Read more

2013七月4

find的命令 – shell学习笔记

不管当前路径是什么,如果想要在自己的根目录$HOME中查找文件名符合*.txt的文件,
使用~作为’pathname参数,波浪号~代表了你的$HOME目录。
$ find ~ -name “*.txt” -print
想要在当前目录及子目录中查找所有的‘ * . t x t’文件,可以用:
$ find . -name “*.txt” -print
想要的当前目录及子目录中查找文件名以一个大写字母开头的文件,可以用:
$ find . -name “[A-Z]*” -print
想要在/ e t c目录中查找文件名以h o s t开头的文件,可以用:
$ find /etc -[......]

Read more

2013七月2

浮躁的行业

SEO是一个比较浮躁的行业。随便来一个人就说自己是SEOer,仅仅的知道发外链,伪原创也可谓称作SEOer。我不知道其他行业是否也是如此,想想自己从菜鸟走到现在,也曾经浮躁过、也曾经自以为是过、也曾经认为自己的SEO水平很NB。想想当初,如果不是自己想要更进一步了解下的话,也不知道原来自己也是那么的浮躁。

整个SEO圈内中不断的充斥着快照回档、百度权重、降权了、site不在首位了、排名掉了=降权了等等等等这样那样的问题,就像今晚有人问我一样,为什么我网站一个关键词排名从10掉到了31。为什么?我也不知道为什么。或许那人同样认为我是个水货,呵呵无所谓了。

在日常工作[......]

Read more

2013七月1

Shell的一些基础命令

touch 新建一个文件/更新文件
mkdir 新建目录
cd. 当前目录
cd.. 当前目录的上一目录
ls 列出目录
ls – alh 显示当前目录
pwd 显示当前目录
cat 打开文件(顺序print)
tac 倒序

cat -v 可见不可见的字符全部显示出来(application: robots检测)
head -n1 从开头print几行(此处为1行)
tail -n1 倒序

mv 移动
cp 复制
rm[......]

Read more

2013六月26

一个Shell题目

编写Shell命令,把testlog文件按照以下格式输出

小时 次数
00 1598
01 2022
02 1885
03 2169
04 2326
总数 10000

其中

第一列为小时,第二列为每小时抓取的次数,最后一行为总数

参考知识
FS使用,BEGIN/END代码块,for循环,数组。

弄了两个晚上,太笨了,哎,。。。。。
shell截图

命令如下:
awk ‘BEGIN{FS=”/| “}{print $6}’ testlog | awk -F”:” ‘{print $2}’ | sort | uniq -c | awk ‘BEGIN{prin[......]

Read more

2013六月19

密码保护:流量掉了怎么办 – 学习笔记

SEO 要查看留言请输入您的密码。

无法提供摘要。这是一篇受保护的文章。

2013六月19

密码保护:关于日志分析 – 学习笔记

网站数据分析 要查看留言请输入您的密码。

无法提供摘要。这是一篇受保护的文章。

2013六月18

解决google网址构建中URL标准化问题

网址构建出了的是带有"?"的URL,那么这样就会出现了,多个URL对应一个页面,重复页面问题

怎么解决,将 ? 变为 #

 

再将以下代码:

_gaq.push(["_setAllowAnchor", true]);

插入到GATC中

2013六月13

布尔模型 – 百科

 

 

  布尔(Boolean)模型是基于集合论和布尔代数的一种简单检索模型。它的特点是查找那些于某个查询词返回为“真”的文档。在该模型中,一个查询词就是一个布尔表达式,包括关键词以及逻辑运算符。通过布尔表达式,可以表达用户希望文档所具有的特征。[1]由于集合的定义是非常直观的,Boolean模型提供了一个信息检索系统用户容易掌握的框架。查询串通常以语义精确的布尔表达式的方式输入 。

 

固定一个完全布尔代数 B 和一阶语言 L,后者由一组常量符号函数符号关系符号构成。L 的布尔值模型因[......]

Read more

2013六月13

密码保护:SEO靠客观事实及数据来做

SEO 要查看留言请输入您的密码。

无法提供摘要。这是一篇受保护的文章。

2013六月13

密码保护:再谈CTR – 学习笔记

SEO 要查看留言请输入您的密码。

无法提供摘要。这是一篇受保护的文章。

2013六月13

密码保护:收录 – 学习笔记

SEO 要查看留言请输入您的密码。

无法提供摘要。这是一篇受保护的文章。