转载此文是为了更好的学习SEO,对于YAHOO核桃的研究并不多,不过这篇文章是一个偶然的发现罢了,所以写了一篇研究过程,目前对于“百奥谷”这种研究只是基于一种表面现象。另外,YAHOO的博客搜索功能已经相当超前,看得出来博客搜索功能是YAHOO反攻的一个利器,希望能够看到更多的改进,对于百奥谷比赛,目前的情况没有什么大的变化,看起来,链接决定的因素太大了,百度前10的链接程序占绝对优势,核桃在此不进行细节分析!
今天在YAHOO上关于“百奥谷”的一点发现,百奥谷在YAHOO的分词规则
先看下图:
看到图中的搜索关键字是“百奥谷”吧!
那再看下图的形式,发现什么问题没有?
****************************************************
此百奥谷非彼百奥谷-百奥谷现象
反正就写一童话形式的吧,要不然就扯篇小说出来,每天一集
www.baiaogo.cn 7天前 快照
**************************************************
再一个看标题显红位置有三处,分词是这样的:百奥、百奥谷、百奥谷
TODO猜想了一下,估计第一个分的时候有点误解,不知道怎么分,然后第二个估计是因为有个“-”符号隔断,蜘蛛直接从这里分词,毕竟不可能组分成这样“彼百”“奥谷”。
很明显,所以接下来的描述部分,也是这样的:“以后就开始此百奥谷非彼百奥谷,...”
与标题的分词一模一样,也有可能YAHOO对这种表达式不能读懂,因为如果能读懂,蜘蛛应该判断从“此”字分前后,也就是“此”字为一个停止词,在它的前后进行分词,然后到“非彼”的时候再将“非彼”看作一个停止词,在它的前后进行分词,如果这样一来,这句话就不会被读成这样了。
不知道YAHOO的蜘蛛有没有识别表达式的能力,估计现在谷歌、百度也还没有做到吧,至少TODO并没有发现的!
因为前面已经将“百奥”分在一起,那么后面的两个“百奥谷”是很明显的“-”符号的作用,因为“百奥谷现象”中的“现象”是肯定会直接分成一组的,这个词太容易判断了!
假如回过头来再想一下,如果“-”符号是一个连词,那么可能YAHOO的蜘蛛就要更郁闷了,比如:此百奥谷非彼百奥谷与百奥谷现象
不知道YAHOO会怎么样去分它,TODO认为这个“与”字如果YAHOO都不能识别进行断词,那么就真是太搞笑了!你说呢?有想法就一起来讨论一下,发表你的评论吧!
评论列表:
假设一个网站上有se根本就没有收录的文章,如果我去采集了。我先收录了,算谁的,是类似于大站采小站么?
谢
你说的采集情况,对于SE来说是先入为主的
也就是他的原创会变成你的
但是SE没有收录并不表示SE没有访问过这些内容
也许在SE的库存里已经有记录了,只是你查的时间没有放出来而已
就像25号才放出来的内容,但是快照是20号的,这就是SE的库存内容
这是检验原创的核心时间点
不知道这么说你明不明白
你说的采集情况,对于SE来说是先入为主的
也就是他的原创会变成你的
但是SE没有收录并不表示SE没有访问过这些内容
也许在SE的库存里已经有记录了,只是你查的时间没有放出来而已
就像25号才放出来的内容,但是快照是20号的,这就是SE的库存内容
这是检验原创的核心时间点
不知道这么说你明不明白