通过技术判断访问者是男孩还是女孩

| | Comments (0) | TrackBacks (0)
所谓"判断"就是"猜",判断的准确就是技术高、判断不准就是技术差,技术高低的决定因素在于对历史数据的分析和把握,以及根据历史数据拟合出来的公式是否具有适普性。

网络上,你看不到我、我看不到你,如何通过技术去判断网络另一端、屏幕前面的人是男还是女呢?国外有两个有趣的小技术可以做这个判断:

一、语言表述辨别男女:

男生写字、写文、说话都有男生的风格,女生也有女生的写作特点和习惯,对样本(一大群男生和女生的聊天记录)进行分析、挖掘,最终得出男女文字差异,将这些字里行间的细微差异做成指纹,之后就可以用于对文章作者的性别进行判断了。

据说这个方法对性别判断准确率还是很高的,今后在网络上看到某个匿名的网络文学,便可用此方法对其作者性别进行判断。

二、上网行为辨别男女:

同语言表述相似,男女网民在上网的时候,所关注的新闻、网站、内容均有所差异。男生可能更喜欢看军事新闻、体育新闻;而女生则偏爱化妆品、流行服饰,如此的差异也被用于对网民性别进行判断。

在你访问某个网站的时候,那个网站的管理员便可收集你的上网历史记录,这个数据收集过程并非想象的那般容易,毕竟是跨域的隐私信息,因而操作系统和浏览器都不会将上网历史公开给管理员,管理员必须利用特殊的技巧才能收集到这些信息。

一旦管理员收集了这些信息,就可以进行分析,猜出访问者的性别。具体过程是这样的:首先管理员将网站分成两类,一类是男生网站、另一类是女生网站,每类中都有上百乃至上千个网站,当管理员对某个匿名用户进行分析的时候,如果"它"曾经访问过"男生网站",就给"它"增加一个男生积分、反之增加一个女生积分。

根据这个"它"的最终积分,就判断出其性别来了。

0 TrackBacks

Listed below are links to blogs that reference this entry: 通过技术判断访问者是男孩还是女孩.

TrackBack URL for this entry: http://shangning.net/chinese/mt-tb.cgi/141

Leave a comment

友情链接

Google