评价方法(简单多指标综合评价的三种方法)
多指标评价常用于一些对象需要比较的场景。在保持目的明确的情况下,对多个维度的绩效数据赋予不同的权重进行综合评价,最终形成排名。
首先涉及到这些数据的规范化,或者说标准化,本质上就是去掉维度,把维度理解为计量单位是可以的。这一步的重要性在于,多维度的评估和收集到的多维度数据横向上没有强耦合,性质不同,而维度-数量级的大概率不同。如果直接用原来的数值分析,那么你要花很大力气给出不同维度的最终权重,也不好解释。
纵向来看,同一维度不同对象的值在极端情况下可能相差很大,而归一化可以削弱这种影响。总之,维度转化为纯值后,评价不同对象之间的差距会更方便。
以下是几种方法的简要说明:
一、偏差标准化
很多名字,也叫线性标准化、最大化归一、极小极大法,都是一个意思,就是处理后X =(预处理X-最小值)/(最大值-最小值),其中最大值和最小值是指同一维不同对象的值的集合中的最大值。这样,这个集合中的所有值都可以根据大小差距映射到[0,1]的区间内,在某些情况下,最小值默认为0,即取决于集合中的值与最大值的比例关系。
举两个实际例子:
①现在,我要给A、B、C三家商户打0~10分。数据有两个维度,各占40%和60%,也就是说维度一的满分是4分。
每个维度的最大值得分最高,其余值按最大值的比值计分。最后将两个维度的得分相加,得到总分,如下表所示。需要注意的是,并不是所有维度中,最大值就是最高分,也存在值越高分越低的情况,比如差评。鉴于这种情况,在数值处理中应取倒数值。
(2)现在,我想通过向一个用户推荐一些餐馆。除了前面的评价和装修,我还需要考虑餐厅和用户的距离,或者说餐厅和用户搜索到的POI的距离。此时,得分y = 1-(x-min)/(max-min),x =用户或POI与餐厅的距离,min =用户或POI与城市中餐厅的最小距离,max =用户或POI与城市中餐厅的最大距离。空搜索还是关键词搜索,场景不同。
第二,z分数标准化
也称为Z标准化、标准差标准化和均值方差标准化。适用于大量没有明显边界的数据,最好满足高斯分布。公式为后处理X =(前处理X均值)/标准差。这里的均值和标准差是指同一维度上不同对象的集合值的均值和标准差。这样,一个分布的数据就可以转化为标准的正态分布,均值为0,标准差为1,处理后的值,用正号表示高于平均水平,用负号表示低于平均水平,这就很清楚了。
加工前:
后处理:
还应该注意,如果一些值尽可能低,那么最终的符号需要以相反的方式处理。
第三,非线性标准化
这种方法非常适合处理极值。要用这个,我们要看你有没有需求。比如我还是要给用户推荐多家餐厅,排名要考虑UGC,也就是用户评论的数量。但是我研究过我所有的餐厅,发现大部分的评论都在100-300之间,有一部分是1000+,不算多,但是对于用户来说,评论数无非一条。300多的梅干勉强够踩坑的概率,所以有些餐厅虽然评论量很大,但是他们在这一项上的得分应该不是正常水平的几倍,所以你需要一个非线性的评价曲线,这样评论数超过一定阈值后,同样的评论数会增加,得分会越来越低。这里一般采用y=a*log10(x)+b的形式,通过调整a和b可以根据数据调整曲线。
在标准化的过程中,还要考虑数据可能出现的问题,比如因为维度划分过细,样本量小,数据异常,可能导致一个对象在单项中没有数值。对于这种情况,是否考虑在单次评价中按比例转移物品的权重?还是有垫底的分数?等一下。
不同的标准化方法实际上适用于不同的业务需求(数据精度、粒度等。).在多指标评价中,你可能最后会认为权重的设定起了更重要的作用,但归根结底还是两个部分:数据+公式(处理)。清楚地知道自己要评价对象的哪些方面,明确界定口径,是评价体系客观性的重要体现。
其实很明显,多指标评价是对不同对象之间差距的描述。可以理解为描述的是竞争关系,是相对的,横向的。比如在自媒体后台,平台给的评分绝对值不能完全代表你的水平波动,但对你的创作水平和你的评分提升一定是有用的,因为你改变了竞争关系~
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 ZLME@xxxxxxxx@hotmail.com 举报,一经查实,立刻删除。