文章特征指纹提取与指纹库创建日志(1)

| | Comments (0) | TrackBacks (0)
"零编辑"系统的模型已经搭建出来了,内容源暂时只设置了1个,到后期可拓展内容源,以确保站群内文章数量和质量都得到保障。但是这样自动采集回来的文章很难获得从搜索引擎过来的自然流量,因为搜索引擎有机制判断文章是否原创,转载文章过多的网站会被搜索引擎降权。

为了让搜索引擎认为网站内容都是原创的,就要和搜索引擎一样计算每篇文章的特征指纹,然后再想办法改变文章内容以变更特征指纹,诱使搜索引擎认为这是一篇原创文章。

手工尝试了一些方法,发现想修改文章的特征指纹、还不影响文章原意,非常困难,但是如果不做这个机制,那做再多的网站、复制再多的文章也是没有任何意义的,因而这个技术难点无论如何也要想办法解决。

先从最简单的东西做起,然后实践摸索吧。

0 TrackBacks

Listed below are links to blogs that reference this entry: 文章特征指纹提取与指纹库创建日志(1).

TrackBack URL for this entry: http://shangning.net/chinese/mt-tb.cgi/51

Leave a comment

友情链接

Google