发布时间:2022-6-5 分类: 电商动态
谈谈几种用户识别方式。
用户分析是网站分析的重要组成部分。在分析用户之前,我们必须首先识别每个用户并区分哪些是“新客户”,哪些是“重复客户”。这不仅可以让您更清楚地了解访问过您网站的用户数量,还可以了解用户身份(用户ID,电子邮件,性别年龄等);它还可以帮助您更好地跟踪用户并发现他们的行为特征。 ,爱好和个性化设置,以更好地把握用户需求,增强用户体验。
通常当您的网站提供注册服务并且用户注册并登录到您的网站时,可以更容易地识别用户,因为该网站通常保存注册用户的详细信息;但是,您的网站无需注册。用户行为基于浏览,这对于用户识别来说更加困难。以下是一些用户识别的常用方法:
几种识别用户的方法
当用户未注册登录时,识别用户的唯一方法是保留用户浏览行为的点击流数据。通常,它们将保存在WEB日志中。有关WEB日志的详细说明,请参阅我之前的文章。 —— WEB日志格式。 WEB日志本身的缺陷可能导致用户识别不准确。有关WEB日志的缺陷,请参阅上一篇文章—— WEB日志的作用和缺陷,因此在选择用户识别方法的过程中,条件尽可能选择更准确的方法:
1.基于IP的用户识别
IP地址是最容易获取的信息,并且将包含在任何WEB日志中,但其局限性也很明显:伪IP,代理,动态IP,LAN共享相同的公共IP出口… …这些条件会影响基础IP识别用户的准确性,因此IP识别用户的准确性相对较低,目前一般不直接使用IP来识别用户。
2.基于IP +代理的用户识别
同样基于最简单的WEB日志形式,我们可以添加—— Agent,以提高以单一IP方式识别用户的准确性。代理程序也是WEB日志中通常包含的信息。在IP代理和公共IP的情况下,IP +代理可以适当地提高用户的分辨率。同时,代理还可以识别特殊的“用户”,例如网络爬虫。但同样的准确度并不高。
3.基于Cookie的用户识别
当您通过自定义Apache日志格式或JavaScript获取用户cookie时,您已经找到了一种更有效的用户识别方法。如果cookie未被清除(客户端可能包含多个cookie),则可以认为cookie被绑定到访问客户端计算机,因此使用cookie来识别用户实际上是指用户使用的客户端计算机。而不是用户本身。
识别带cookie的用户的方法当然也存在缺陷:最常见的是cookie被清除而用户无法对应原始记录;同时,因为客户端计算机将被共享,或者用户将在不同的计算机上访问您的网站,此时,cookie无法直接对应用户。
4.基于用户ID的用户识别
基于用户ID的用户识别是最准确的,因为通常用户以不同方式共享他们的用户ID,因此我们可以认为数据中的用户ID唯一地指向用户,并且几乎没有偏差。当然,使用用户ID来识别用户是先决条件:网站必须提供用户注册登录服务,并且用户ID可以通过某种方式记录在点击流数据中。
因此,对于需要用户ID注册和登录的网站,可以按以下顺序选择用户唯一标识符:当用户登录时,用户标识作为标准,当用户浏览未登记的标识时state,用户的cookie作为标准。如果用户未登录且cookie不可用,则以IP +代理为准;这将最大程度地识别唯一用户。
在这里,我们建议在网站日志中使用Cookie项目的自定义设置方法,以便更好地识别用户。 cookie是从客户端存储的cookie文件记录中获取的。此文件通常包含与cookieid同时的用户的用户标识(如果您的网站需要注册并且用户已登录到您)。网站和cookie尚未删除),因此在日志文件中记录cookie项时,可以优先查询cookie是否包含用户ID类的信息,如果存在,则将用户ID写入日志cookie项,如果没有,那么查找是否有cookieid,如果有记录,如果没有,则记录为“ - ””,以便日志中的cookie可以用作最有效的统计信息的用户唯一标识符当然,应该注意的是,这种方法只能由网站本身实现,因为用户ID作为用户的私人信息只知道cookie被设置并存储在cookie中,而第三方统计工具通常很难获得。
获取用户信息的方法
在使用上述方法唯一标识用户身份后,我们可以通过某些渠道收集用户的基本信息,功能信息和行为信息,然后为每个用户建立详细的配置文件:
1)用户注册时填写的用户注册信息和基本信息;
2)从网站日志获取的用户浏览行为数据;
3)从数据库获得的用户网站业务应用数据;
4)基于用户历史数据的推导和预测;
5)通过与用户直接联系或用户研究获得的用户数据;
6)第三方服务机构提供的用户数据。
识别并捕获用户信息的价值
通过用户识别和基本用户信息的收集,我们可以通过各种网站分析方法在网站上实现一些有价值的应用:
基于用户特征信息的用户分段;
基于用户的个性化页面设置;
基于用户行为数据的相关建议;
根据用户兴趣进行有针对性的营销;