【江哥小助手】【熵值】副图指标,适用于通达信,用以评估系统的离散状况,无未来

【江哥小助手】【熵值】副图指标,适用于通达信,用以评估系统的离散状况,无未来

熵的数值,是衡量一个系统混乱(或离散)程度的标尺。

当熵值增大时,意味着系统的无序状态加剧,能量分布趋于均匀,系统中有效能量的含量减少。

相反,熵值减小时,表明系统的有序性增强,能量分布变得不均衡,系统中有效能量的含量增多。

在数据处理领域,熵值方法常被用于实现数据的无量纲化及非负化处理。

由于所选指标各自采用不同的度量单位,导致数据之间缺乏可比性。

因此,对指标进行去量纲处理,既能消除变量间的量纲差异,又能保留数据的相对重要性。

原始数据经过去量纲处理后,指标数据可能包含零值,直接计算熵值时的对数运算将变得无意义,因此需对无量纲化后的数据整体进行平移调整。

频数转化为概率

在朴素贝叶斯分类器的应用中,

当我们计算某一特征的条件概率时,

常会遇到该特征值在训练集中未曾出现的情况,

此时,若仅依据频数进行统计,其估计值将为零,这一问题被称为“零概率困境”。

拉普拉斯平滑技术的核心,就在于有效应对这一困境。


相关阅读

服务热线

18020657357

微信客服

微信客服