戳蓝字“CSDN云计算”关注我们哦!
作者: 刘丹
我们通过卖东西收集数据,数据是阿里最值钱的财富。
——马云
春天万物复苏,沉睡了一个冬季的爱美之心呼之欲出,连衣裙在姑娘的心里发了芽,不过这次有些意外,它竟然在热搜里先火了一把。
最近,网上掀起了一个关于“连衣裙客单价低于128”的讨论,竟然有人说具备这种特征的女孩不适合用来当女朋友。连衣裙客单价低于128是什么梗?“连衣裙客单价”是在淘宝搜索“连衣裙”弹出的衣服单价,这是淘宝针对消费者的消费水平做出的“特殊定制”。而一个女生的“连衣裙客单价低于128”,则意味着她搜索的连衣裙价格都低于128元,间接反映了她消费水平低。
其实,这句话最早出现于某知名财经博主,于2019年2月24日中午发布的一条微博,指出“连衣裙客单价低于128”是爱计较的女生的特征之一,原文如下:在我们电商行业,找女朋友有一条不为人知的铁律。不能找淘宝好评率低于98%,滴滴低于4.8,搜索核心词连衣裙,客单低于128的。以上三条同时满足的人,难伺候。
如此扎心的搜索,让不少年轻人纷纷打开淘宝,迫切的试探自己在电商平台究竟占据什么地位,而自己到底是不是所谓的“低价人群”,面对朋友圈疯狂的晒单背后,大数据的落地实际案例再次呼之欲出,那么关于大数据算法的讨论也一度受到业内的关注。
1
账单背后:大数据的力量
我们通常会遇到这样的情况,在淘宝京东等电商平台中,当我们搜索一件物品时,系统将会自动推荐同类物品,这是大数据在我们日常生活中最贴近的例子。而在我们购买一件物品时,账单背后,同样离不开大数据的支撑。
账单背后是一组不可小觑的数据,首先,庞大的用户基数,在浩瀚的网络中留下了海量的数据;其次,巨额的交易数据,记录了消费方式的变迁;最后,强大的大数据技术支持,每一笔的数额、时间、交易类型、手段等都被清清楚楚地记录并分析。
通过大数据账单,使得购物数据可以较为清楚的展示消费能力与偏好、理财数据展示财力、缴费还款数据展示信用价值。更值得探究的是,当我们的行为被大数据所记录的同时,大数据账单也同样影响着我们的消费习惯与生活习惯,比如当系统经常推荐我们低价或者高价的物品时,我们也会不自觉得跟着数据作为;在比如当年度账单统计出来时,我们迫不及待的宣告自己是一个剁手党时,也许下一年你会更加沉浸在“买买买”的痛快之中;再或者当你看到自己超额消费决定摆脱月光族,于是将自己的收入放入金库或进行科学的理财。这一系列被大数据影响的行为,同样是数据带来的魅力。
而更深层次的看待用户账单,我们发现数据不仅可以分析个人的消费能力,同样可以反应全国各地的各种状况,比如,区域经济发展状况、不同社会阶层的经济能力、不同地域的消费习惯与理念。当数据累积到一定程度时,我们甚至可以直接看出哪个群体是投资主流、哪个群体是消费大军、哪里最有钱。当搜索一条连衣裙都可以占据热点话题时,它背后的数据与算法终要见天日。
2
数据背后:社会的焦虑
即使是日常生活中,我们也就能感受到大数据背后的力量。可是,我们再回过头看看“低价人群”这一标签,多么讽刺与无奈,既然有低价人群,那一定就有“高价人群”,从最近朋友圈汹涌的“晒图“浪潮中可见一斑,他们晒出的连衣裙价格不仅高于128元,甚至还会出现上千上万价格的推荐,这无疑不是一种炫富手段,从而彻底找到了自己的存在感和认同感。
那么,淘宝究竟有没有这样的规则,是否给用户打上过这样刺眼的标签呢?对此,淘宝方面表示,根本不存在128元这条线。淘宝负责算法人员解释道,个性化推荐的初衷是满足用户多样化和实时变动的需求。用户的偏好不是静态的,算法难就难在要满足用户多样化场景下的需求,以及购物的差异化需求。“淘宝的系统是建立在大数据、实时计算等复杂技术体系下的AI系统,是对用户多元化、动态需求的理解和预测,不是简单的标签逻辑。”
也就是说,单一的消费数据绝不可能支撑“算法”, 即便为某个个体打上标签也需要多个维度的研究,比如手机号、住址、性别等基础数据,购买类别、客单价、购物频次等消费数据,浏览商品的类别、浏览时长、对于淘宝直播等其他内容的偏好,这些数据,都可以勾勒用户行为,最终描绘出用户画像。
其实,这个热点背后最让人不舒服的其实在于,“连衣裙低于128元的低价人群”被称为难伺候的主儿。那么,好评率长期保持在100%的人群,就是可以当做女朋友的最佳人选了吗?从不差评、从不麻烦客服,这就是一个人可以得意洋洋的地方吗,甘愿放弃维权的机会,笔者认为也可以称为懦弱的表现啊。
的确,有淘宝卖家称一件低于100元的衣服,本身是不怎么赚钱的,但是如果遇到精打细算,反复需要售后的消费者,其消耗的成本,最后这笔交易就真的不赚钱了。算法将用户挑选并分类出来,最后打上标签,好让商家可以对用户进行判断。讽刺的是,“低价人群”通过这次事件,不断地想要提高自己的客单价,而“高价人群”肆无忌惮的炫耀着自己的成绩。大数据给出的逻辑,有时更是野蛮的。在人们不愿被打上“低价人群”标签的同时,同样显示出了大数据背后人们的恐惧与不安。
3
准确or失败 数据预测为什么这么难?
大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。
举一个很著名的例子,在美国调查超市里最好卖的馅饼(Pie)是什么?每个人都回答是苹果派。看起来美国人最喜欢苹果派,但通过对大数据的分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不必为了对方而妥协,选择大部分人能够接受的苹果派,当馅饼变得足够小,小到只够一个人吃的时候,大家才会真正选择自己喜欢吃的,此时,苹果派只能排到第四、第五的位置。
也就是说,有时候大数据给我们的这一冰山一角,在没有更加细致的数据做支撑时,结果往往是不够准确的,就像“128元连衣裙”这个数据一样,当搜索出连衣裙价格真的低于128元,难道真的说明我只配穿低廉价格的衣服,是所谓的“穷人”吗?结论当然不是,毕竟当我想买LV、GUCCI、CHANEL的时候,也不会在淘宝上搜索购买吧。
所以,大数据真的有那么牛吗?大数据最根本之处在于信息收集方式出现了重大变化与革新。大数据的出现与大量信息直接在网络呈现关系非常紧密。微博、天猫、淘宝、微信等等都直接产生了大量包括定位、消息记录、消费记录、评价、阅读等等殊为庞大的信息,可以说互联网企业都自然的带有数据企业的标签。不过如果我们从数据的源头看的更仔细一些,还是会发现,其实很多数据依然是有巨大的采集与归类的需求。
现在人人都说大数据,但其实大家说的是 facebook,twitter等站点上每天产生的信息,而真正有效的数据并不完全在网络上,要依靠原始的方法来收集。从“128元连衣裙”热点背后,我们发现,数据方面还有很多基本层面的问题值得我们去探讨。
4
隐私难界定 大数据也不是万能的
大数据将我们暴露在众目睽睽下,甚至给我们打上了各式各样的标签。在大数据下,隐私难以界定,监管就成了难题。数字时代,人们最关心的就是隐私问题,但是对于隐私的界定仁者见仁,比如当你开车去机场赶飞机,路上交通很堵,这时候地图软件恰如其时的提醒你另一条路更加顺畅,这样的提醒贴心便利,自然受欢迎。但是,假若此时你去的是一个不愿让别人知道的地方,那么同样的情境下,如果地图软件的提醒不仅会暴漏自己的隐私,还会带来极其不爽的体验;再比如,最近你想出去旅游,查阅了很多攻略,随之旅行社推送的度假信息,你是非常接受的。但是如果制药厂商发现你有艾滋病,向你推送艾滋病药,相信没有多少人会接受这样的推送消息。
所以,隐私是分场合的,但厂商很难清楚地知道消费者所处的时间位置等具体情况。数据算法让我们尽享便利与捷径,但随之尴尬有时也会不请自来,而关于隐私泄露更是人们最为在意的一部分,由于很难界定隐私,所以在监管方面,同样考验着监管者与业界的智慧。
综上,大数据技术为人类社会带来了新的机遇,但大数据绝不是万能的,在其价值被认同的同时,也不能被刻意的夸大,当我们盲从于大数据,就容易产生片面错误的分析。首先是结果的不确定,其次是逻辑无规律,最后大数据是对过去已发生的事件进行经验总结,本身不具备创新性。这也就不难理解《流浪地球》预测10亿票房,却飚升到50亿,以及平时购买过LV的消费者,也在网络中搜出来128元连衣裙这样的事情了。所以,大数据为我们的生活带来了巨大变化的同时,切记盲目屈从与它。
福利
扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!
推荐阅读:
-
女神节 | 那些奋斗在IT领域的“女神”们
-
云漫圈 | 如何给女朋友解释什么是HTTP
-
趣挨踢 | 跳槽季,让我们一起攻克算法吧!
-
互联网没有春天
-
学 Python 没找对路到底有多惨?| 码书
-
这份“插件英雄榜Top20”才是Chrome的正确打开方式!
-
剧情反转! 创始人去世事件再爆新料, 1.8亿美元难道去了天堂?
喜欢就点击“好看”吧
昨晚,很多人都默默打开淘宝,搜索了一下连衣裙。甚至有几个男性朋友也很好奇搜了一下——他们从来没在网上买过连衣裙,甚至很少在上面购物。
但他们就像被某种病毒感染一样,想看一下第二条和第三条推荐结果。
这种莫名其妙的行为艺术,源头是网友“风中的厂长”发的一条微博:淘宝连衣裙客单价低于128,会被淘宝方面标注为“低价人群”。
这位网友进一步论证,淘宝连衣裙客单价低于128元,或者滴滴好评率低于4.8的女性,电商行业的人都不会和她们恋爱,因为这样的人往往会比较“难搞”、“难伺候”。
很多女性“吓得”赶紧打开淘宝,然后纷纷晒出自己连衣裙的客单价。我朋友圈里,很多女性朋友晒出的客单价大多远远高于128元。
相信这些朋友不但长舒一口气,内心也很是满足:这个数字,虽然证明自己花了不少钱,但也让自己脱离了“低价人群”的嫌疑。
这种“行为艺术”,形成了某种舆论,淘宝官方很快出来回应称,所谓128元客单价以下被系统默认为“低价人群”的事并不存在。用户的偏好不是静态的,算法难就难在要做出个性化推荐,对每个人的推荐,都是基于对其消费习惯的动态捕捉上。
一、大数据正在捕获我们,这是真的
淘宝官方的回应大抵是可信的:如果说消费习惯和人的性格之间真的有某种可靠的联系,那也一定有更复杂的解释,否则花那么多钱搞数据分析就完全是浪费了。
但是,这么多人相信“风中的厂长”所发布的“128定律”,并不是毫无来由。
到了2019年,一个普通的电商用户,也知道了“大数据”这个词。有过网购经历的人都知道,平台会根据自己的购买行为,做进一步的推荐。
你买了一件连衣裙,会给你推荐连衣裙。更高明的算法,可能还会给你推荐一款用来搭配的凉鞋。
如果你买的连衣裙是128元的,推荐的凉鞋价格也不会高到哪里去——价格,毕竟是一个考虑的因素。
把连衣裙客单价低于128(也可能是别的数字)的人统一划分为一个人群,用来分析她们的消费习惯、投诉数量,也不是没有可能,因为这可以改进平台的工作效率。
但是,把用户称作“低价人群”,总是不太礼貌的行为。更重要的是,一个花128元买连衣裙的女士,也完全有可能花几千块买一个包包。
网友纷纷晒出自己在某购物APP中的搜索结果。
真正厉害的算法,应该琢磨的恰恰是更个性的东西,最终让自己的推荐更打动消费者。
换句话说,大数据对人的捕获能力,可能已经远远超过了用128客单价来区分人群这种低级阶段。我们可能被以别的标准做了区分,或者被贴的标签远远不止价格这一个。大数据为我们提供了方便,更为商家提供了方便。
很多人相信这个“128定律”,本质上就是把大数据想得太简单了。他们是把“自己的数据”理解为大数据。
事实上,大数据不但动态捕捉你自己的数据,还会在海量的数据中进行计算,背后有复杂的模型——这可能不是多数非专业人士所能想象的,而大多数相信“128定律”的人,这时候的表现就像典型的文科生(并非黑文科生)。
二、标签与认同:为自己标一个价
更值得注意的,其实是网友的反应。他们相信“128定律”,除了对大数据的误解外,还有一种情感因素。
很多朋友并没有感到被这个所谓的“128定律”冒犯,她们乐此不疲地去看自己的连衣裙价格,甚至连男人们也行动了起来,跑去搜索——大家想知道,自己是否属于这个“低价人群”。
“128定律”是否靠谱并不重要,大家需要的是一个可以区分自己的标签,最好是一个“价格标签”。
在互联网时代,每个人都想“脱颖而出”,提高自己的“能见度”,如果能被淘宝这样的大平台标注为“高端人群”,我相信很多人都会毫不犹豫地发朋友圈晒出来。
其实,不少以“低价人群”自居的,其实也在以自嘲的形式,来标榜自己的身价。
想想吧,每年底,有多少人在晒自己的年度支付账单,一方面假装后悔地反省,一方面在晒自己是多么有钱,花钱越多的人,晒得就越开心。
支付宝2018年度账单。图/视觉中国
很少有人在乎,这个账单其实也是个人数据。
这是一种新的寻求认同的方式。大数据在“捕获”我们,在分析我们,甚至在算计我们,但是我们似乎不在乎。我们爱它呈现出来的“客观性”,我们发自内心地认可它给我们的“定义”。
三、警惕反向塑造自己
这才是最值得警惕的。我们似乎正在丧失对“自我”的掌控,越来越依靠这些大数据平台为我们描绘的“画像”。
更进一步,我们会根据这些“画像”来调整自己,让自己更符合平台对我们的设定。
这可能就是那些算法工程师梦寐以求的:他们不但要懂我们、分析我们,还要真正影响我们。
最终,我们会变得越来越像一个数据。或许有那么一天,系统会提示我们,“根据你的习惯,这件128元的连衣裙就是最适合你的”,而我们也会心安理得地接受。
但可以肯定,大数据算法不可能仅仅从你的某一个行为就定义你好不好打交道,适不适合做女朋友。把穿128块钱连衣裙等同于“低价人群”,是对大数据算法的降维打击,不准确,也不客观。
□ 张丰(媒体人)
编辑 王言虎 实习生 李文隽 校对 陆爱英