网上科普有关“豆瓣书评分和推荐靠谱吗? ”话题很是火热,小编也是针对豆瓣书评分和推荐靠谱吗?寻找了一些与之相关的一些信息进行分析 ,如果能碰巧解决你现在面临的问题,希望能够帮助到您 。
豆瓣读书的评分有非常非常明显的分野,具体是哪个时期我没有详细考证 ,但豆瓣的老用户,尤其是经常使用豆瓣读书的用户都应该有个类似的体验:某一天,你在豆瓣读书上的新书推荐看到了一本貌似很有意思的 ,评分很高的书。你把它买回家,读后却非常失望。至此,你突然意识到,某个时期之后出版的新书 ,它的豆瓣评分都是不可信的 。
譬如《未来简史》这本书籍,我之前看过这部书,觉得并不好看 ,对不起8.5的高分。看了goodreads,发现评分也只有3.69星 ,并不像豆瓣这样高(图一) ,就国内外对此书评价差别还挺大的。
而且,在亚马逊上还能看到截然相反的短评,有的人觉得这是“靠谱的未来预测” ,有的却说这本书籍"哗众取宠,没有科学支撑" (图二、图三)
另一方面,豆瓣上同样8.5分的书籍 ,比如《九故事》,《悟空传》,《庆余年》,我都觉得挺好看的 ,goodreads也都达到了4.15星的水平 。于是就有疑问,豆瓣书籍的评分是否可靠?会不会存在一些很多书籍的评分不中肯,影响的因素主要是哪些?针对此 ,我选取了部分不同年代,国内外不同出版社的不同书籍做了对比。
1. 数据概况
选取2001-2017, 国内出版 的书籍。限制豆瓣评分人数在2W以上,一方面讨论大家较为熟悉 、主流的书籍 ,另一方面也尽量减少水军等的影响。总共997本 。通过借助中信云机器学习平台,我们对其中书籍的评分做了比较和展示,其评分分布图如下(图四):
包含了很多我们耳熟能详的书籍 ,比如围城、肖申克的救赎、百年孤独等等(下图五)。
同时,我们通过应用中信云机器学习平台,对包含中信图书出版社在内的其它出版社出版的小说书籍 ,做了方差和评级分布图(如下图六所示),我们可以看到,中信小说的评分方范围在7分以上,STD差距主要分布在1.5-1.75之间 ,那让我们来看分析一下,到底评分的差异来自于什么?
2.评分的差异
2.1 未来简史VS时间简史
以上两本书(图七)的评分为例,两者评分相同 ,评价人数也很多(6K, 18K),但4星和2星的比例差别很大。什么意思呢?
● 时间简史:大家都觉得不错,所以评分集中在了4星
● 未来简史:同时有不少人觉得不错/较差 ,在2星和4星有不少的分布 。
也就是说, 尽管两者(平均)分数相同,但是背后的看法非常不同 ,评分差异很大, 这也正好对应了上面,未来简史出现两种截然相反的热评的情况。
2.2 怎么衡量评分差异
评分分布的差异 ,可以用方差来衡量,计算方法如下:
也就是计算 评分偏离平均分的程度? 。下文使用标准差(STD),方差开方即可 。可以做出标准差(STD) - 豆瓣评分(Rating )散点分布图(图九)。为了便于比较,做标准差97%范围线。
可以看到时间简史和未来简史的STD差别确实很大 ,未来简史的标准差排在前3% ,争议性是巨大的,而时间简史则小很多 。那么我们可以设问
这些小说的分数相同 ,但同样好看/不好看吗?
比如,时间简史和的未来简史分数一样,但他们一样好看吗?
当然不是。
如前面的比较 ,未来简史虽然评分较高,但其4星/2星和时间简史差别很大。为什么呢?大家可能早有耳闻,看评论也能看到 。通常 ,我们总是在讨论一本书籍评分的高低,只是平均分,当大家看法一致的时候 ,这个分数会很有参考价值。如果 当评分差异很大(STD很大)的时候,这个分数的作用就有限了。
3.类别的差异
对于同一类别,不同的出版社,评分和标准差之间存在较大的差异 ,那么,对同一出版社,不同类别的书籍的评分 ,会有多少种形状呢?我们选取了中信出版社的图书部分做了数据分析,用K-Means,输入数据为四个评分等级的比例。实际可以把类别分得很细 ,这里简单分成4种,比较有代表性,结果如下(图十 、图十一)
需要注意的是 ,高STD的书籍因为其形状差异很大,并不适用于进行分类判定 。
从上图看出,在每个形状下 ,也能看到STD高/低的书籍,比如人人都该买保险 ,二手时间 等等,综合来看 ,中信出版的图书在评分的7.6-8.8的书,STD都是比较稳定的,没有波动特别大的情况 ,所以类别之间的评分差异其实相差也不大。
4. 爆款图书评分的差异
我们针对中信出版社的历年舆情变化,图书爆款做了类比(如图十二)。
爆款数量变化如下图(图十三)
从图十二、图十三我们可以看到,中信出版社历年爆款图书大致呈正态分布 ,说明使用的数据量基本足够 。各个年代的爆款数量并没有一定的规律性。那对应的爆款书籍舆情分布又是怎样呢,如下图十四所示,
上图显示 , 中信爆款书籍的STD展示效果主要集中在1.3-1.6之间,对于这部分书籍我们取出部分在图下进行了书籍展示(如图十五)
从上图可以看出, 经典书籍 的评分和STD高度相关 ,评分高,STD会比较低。也就是说,尽管书籍评分是非常个人化的事情,每个人对书籍的评价会有所差别 ,但是放到豆瓣的大用户量下,评分的大众性很强,经典书籍的评分STD还是很小的 。也就是说 ,书籍的评分和出版的时间,爆款的程度没有正相关的联系。
5.评价差异最大的书籍是什么?
从上图我们看到各个评分的STD都有高有低,那么我们看一下STD的最大临界值是怎样的一个情况 ,从样例中,我们进行了STD差异最大的书籍进行了筛选,如下图所示:
评价差异大的原因可能来自多个方面 ,这里我们就不进行讨论了。
6.搜索内容相近书籍和评分是否准确?
大家如有看过兰大的高手寂寞之类的书籍,是否会有想继续找一些在内容和评分,以及评级上都能够与之媲美的书籍?豆瓣本身是有推荐机制的 ,如下图所示:
我们可以看到,豆瓣关联推荐的书籍,在评分、评级 、内容上有些和目标书籍相差有些大,为验证评分和评级的相似性 ,我们在中信云机器学习平台上,对豆瓣图书进行相似度建模,通过word2vec解析 ,来找到和目标书籍内容,评级,评分等最为接近的书籍 。
例如输入硅谷钢铁侠 ,我们通过对硅谷钢铁侠的数据标签进行建模解析,查出最接近此书内容的词云如下图(图二十一)所示。
我们从豆瓣查出两本书的评价情况,评分和评级构成都是极为相似。
在推荐的时候 ,查询鞋狗,第一关联也是能看到硅谷钢铁侠名列前茅,豆瓣的推荐和机器学习实测的推荐是相吻合的 。
总结
豆瓣的图书评分 ,大家都知道是显示的平均分,也都能看到分数的分布情况,在大多数情况下,这个平均分是有效的 ,因为大家的评价较为接近(STD较小),但是很少有人注意到评分的分歧大小(即STD的大小),当看到一部STD很大的书籍 , 平均分和我们感受不符时,我们会感到疑惑,进而觉得豆瓣的评分不靠谱 ,实际上,只是因为人民的评价差异太大(STD太大),使平均分的意义变得有限了而已。
豆瓣的图书推荐 ,通过对目标图书的内容标签,评分构成和区间等进行综合对比,从而推荐和目标图书最相近的书籍 ,从目前的机器学习测量样本数据观察,这个评分是比较准确的。
最后,分析有什么疏漏,或者没讲清楚的地方 ,也欢迎大家指出~
安利一下: 中信机器学习平台 , 有兴趣的朋友可以注册登陆试用一下。
豆瓣评分的分数是根据短评分数还是根据影评分数?
(很多人在看过我的文章后,开始逐渐关注自己的成长了 。通过我的经验让更多人变得更好 ,这就是我分享的动力吧!)
读书确实是一个性价比很高的自我成长方式,有时候,花上两天的时间 ,你就能看完人家用毕生心血研究出来的东西。但读书并不是万能的,很多人都是盲目地读书,别人说什么书好 ,他就读什么,一通操作下来,发现效果真是太慢了 ,或者是根本读不下去,也就陆续都放弃了。
其实读不下去的书,我把它分为两类情况,一类是作者写的都是你认知范围内的事情 ,读起来当真索然无味;一类是高深难啃的书籍,读了也读不懂,于是便读不下去 。
第一类其实是关于选书的问题 ,很多人在选书的时候,并没有先分析自己的需求,而是盯着各种榜单购书 ,或者赶上平台做活动,抱着不买就亏的心理,买了一堆书回来当摆设 ,有的翻几页,却发现讲的都是自己耳熟能详的故事,并没有获得新知。
其实所有的选书都应该从自己的问题出发 ,而不是从书单或排行榜进行选择。所以在选书的时候也是有方法的:
①确定需求
比如你想转行,或者在你的领域进行深耕,你就需要选择对你的职业和事业有帮助的书籍;比如最近比较拖延,那你可以看一下时间管理相关的书籍 。
比如最近孩子情绪不稳定 ,自己也时常感觉焦虑,就可以阅读一些讲亲子或者心理学的书籍。
你还可以对照自己已有的知识体系,缺失了哪个部分 ,进行补充就可以。如果你不确定自己的兴趣在哪,可以先买一本该领域的书,进行试错 。
②确定渠道
比如我在搜《非暴力沟通》的时候 ,豆瓣会给我推荐很多书,大多数都是同类的;还有微信读书也是,都会根据你定下来的书籍推测你的兴趣 ,去进行延伸和推荐。还有就是可以关注一些平台、公众号,加入一些读书会等等,都是获取某个领域书单的好办法。
③筛选
一切书单都只是参考 ,在你真正读之前,还是要经过筛选的环节,首先确定需求,甭管推荐书的平台有多牛、人有多牛 ,只要不符合自己的需求,那就先pass 。
光符合需求还不够,下一步就是进行测评 ,最好用的是豆瓣的评分+短评+书评,当然,好评和差评都是参考 ,最重要的是自己在阅读一定量的书籍以后,就会有自己的评判选书的标准。我总结了一个公式,供大家参考:
选书能力=了解自己的需求+甄别书籍质量
那第二类可能读不下去的书 ,就是很专业、高深难啃的书籍,当你在读书方面或者是某个领域方面,还是完全的小白 ,那一开始就不要去挑战那些晦涩的大头书籍,不是不读,只是时机未到。
就拿我自己来说,前段时间学了一个认知表达的课程 ,老师推荐了几本特别有深度的书,比如麦克卢汉的《理解媒介》,超级厚的一本书 ,我2个小时翻了大概70页,很多专业术语都看不明白,完全看不下去 ,其实很影响我阅读的积极性,后来索性放回到书架上。这几日我准备读本小说《烧纸》来找回读书的节奏,所以任何事情都是有循序渐进的过程 。
如果你喜欢故事 ,那就从小说切入,如果你喜欢心理学,就从入门级心理学切入 ,选择自己感兴趣的书本作为起步,能让事情变得简单很多。
总而言之,再厉害的阅读方法,也得你有心思去拿起一本书。
以上就是我遇到读不下去书时候的解决方法 ,如果你也有自己的读书经验,欢迎留言分享 。
不 ,很多影评都不靠谱
豆瓣上面的人都是大师级别的人 ,你不要和他们理论,只能说嘴巴上功夫了得。好**自己去品尝,每个人都有不同领悟····豆瓣上商业太重 ,所以不要相信他们的
豆瓣上的人,有些人为了一些利益嘴贱很····
关于“豆瓣书评分和推荐靠谱吗?”这个话题的介绍,今天小编就给大家分享完了 ,如果对你有所帮助请保持对本站的关注!
本文来自作者[别海宇]投稿,不代表缔安号立场,如若转载,请注明出处:https://oxylanechinavideo.com/cshi/202504-873.html
评论列表(4条)
我是缔安号的签约作者“别海宇”!
希望本篇文章《豆瓣书评分和推荐靠谱吗?》能对你有所帮助!
本站[缔安号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:网上科普有关“豆瓣书评分和推荐靠谱吗?”话题很是火热,小编也是针对豆瓣书评分和推荐靠谱吗?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您...