UTM(Urchin tracking module,Urchin [ˈɜːtʃɪn] 跟踪模块)是在数据采集领域的一个标准数据结构范式,通过这个模型,对网页、界面的来源进行数据收集,进而分析营销效果和用户的行为路径。
UTM 简介
UTM 全称 Urchin tracking module,来源于海胆软件公司(Urchin Software Corporation), 2005 年它被 Google 收购,他们的软件为我们现在所知的谷歌分析(Google Analytics)打下了基础。
UTM 码是可以添加到一个链接中的一些文本,它能告诉谷歌分析(以及其他分析工具)关于每个链接的更多信息。下面是一个示例:
https://www.gairuo.com/p/utm?utm_campaign=ad&utm_medium=social&utm_source=wechat
上述 URL 中的几个 utm 开头的参数参考后端服务的处理,会收集到数据仓库并用于数据分析,进而分析营销效果和用户的行为路径。
UTM 代码可以跟踪介质和介质中的源,它变得更灵活的地方是你用来描述源代码的语言。也许你想把网站流量归因于一个社交网络,一种内容,甚至是网上广告的确切名称。
UTM 模型
UTM 以参数形式包含在 URL(网页地址)或者 APP、小程序的路径中,UTM 信息是外显的,可以通过浏览器的地址栏看到。
标准的 UTM 有五个参数:
如何设计
我们知道,在数据埋点上报时,不仅有 UTM 信息,还有一系列其他信息,这样会造成上报数据过大,影响服务性能(响应时间),同时也考虑到 UTM 的外显性,不需要将每个每个上报参数显示出来,所以我推荐以下设计方案:
形式:
https://www.gairuo.com/p/utm?utm=wx.mp.page.more.210316
思路:
- 只用一个参数 utm
- 值用点
.
隔开,按顺序代表一定的值,如果无值可以为空 - 每个位的值赋予一定的业务意义
上例的 UTM 是用于推广来源及效果跟踪分析的,我们对每一位进行业务解释:
- wx:网站推广渠道,来自微信,还可以用微博、知乎等
- mp:渠道的平台,来自公众号,还可以聊天、群组、朋友圈等
- page:渠道的形式,来自公众号文章,还可以有公众号菜单、公众号自动消息
- more:链接名称,公号文章中的更多链接,还可以有文章中的内嵌小程序等
- 210316:文章的发布时间,由于咱们进入21世纪了,网站大概率活不到22世纪,所以年份只保留两位就行
将数据经过 ETL 后进入到数据库,格式如下:
或者直接存储:
然后用 SQL 进行查询分析,详见案例:SQL 按 UTM 串统计访问情况 ( https://www.gairuo.com/p/hive-sql-case-utm-uv )。
另外,如果业务繁多、团队人员众多,在制定埋点规范时,控制第一位参数按业务分配,后边的参数设计权让渡给业务产品经理,在业务域内进行解释分析。
扩展
UTM 参数的数据没有限制,但为了保证统一,可以规定最多五位,最小两位,如果不够怎么办?可以对其中一位进行扩展,如以下形式:
https://www.gairuo.com/p/utm?utm=wx.mp.page.more.ios-210316-dark
我们对最后一位进行了扩展,增加了手机操作系统类型(iOS)和操作系统的界面色深模式(dark深色模式),注意扩展内容不能再用点相隔。扩展内容也可以是一种外显的列表、字典、JSON等格式。
这样,就为 utm 提供了无限可能。
设计要点
设计 UTM 时需要注意以下几点:
- 不要有隐私信息,可经过加密,如用户的ID、合作公司的名字,渠道的名字
- 整体内容和单个参数值不宜过长,因为是 URL 的一部分,URL 长度有限制,其本身还有其他参数
- 可以使用短链接技术来解决 URL 中 UTM 外显(一次传播)和 URL 整体过长不利用传播的问题,如微博的 url.cn 和 bit.ly
- UTM 可以记录到 cookie 中,请求接口时终端 header 里加入 utm 参数
用途
一些典型的应用场景:
- 网站或者 APP 在站外的推广效果
- 网站或者 APP 在站内的行为路径
- EDM 邮件的效果跟踪
- 网络及实体二维码的扫描效果