当前位置：首页 > news >正文

郑州网站建设最独特seo实战

news 2025/7/19 14:25:20

郑州网站建设最独特,seo实战,地图网站制作,wordpress 收费视频分类任务评价指标分类任务中，有以下几个常用指标： 混淆矩阵准确率（Accuracy）精确率（查准率，Precision）召回率（查全率，Recall）F-scorePR曲线ROC曲线 1. 混…

分类任务评价指标

分类任务中，有以下几个常用指标：

混淆矩阵
准确率（Accuracy）
精确率（查准率，Precision）
召回率（查全率，Recall）
F-score
PR曲线
ROC曲线

1. 混淆矩阵

	真实1	真实0
预测1	TP	FP
预测0	FN	TN

从预测的角度看：

TP： True Positive。预测为1，实际为1，预测正确。
FP： False Positive。预测为1，实际为0，预测错误。
FN： False Negative。预测为0，实际为1，预测错误。
TN： True Negative。预测为0，实际为0，预测正确。

2.准确率（Accuracy）

在所有预测结果中，正确预测的占比：

$Accuracy = \frac{TP+TN}{TP+FP+FN+TN} $

准确率衡量整体（包括正样本和负样本）的预测准确度，但不适用与样本不均衡的情况。比如有100个样本，其中正样本90个，负样本10个，此时模型将所有样本都预测为正样本就可以取得 90% 的准确率，但实际上这个模型根本就没有分类的能力。

3. 精确率（查准率，Precision）

在所有预测为1的样本中，正确预测的占比：

$ Precision = \frac{TP}{TP+FP}$

衡量正样本的预测准确度。

4. 召回率（查全率，Recall）

在所有真实标签为1的样本中，正确预测的占比：

$\frac{TP}{TP+FN}$

衡量模型预测正样本的能力。

5. F-score

综合考虑精确率和召回率：

$ F_{score}=(1+\beta^{2)\frac{PR}{\beta}2*P+R} $

β=1，表示Precision与Recall一样重要（此时也叫F1-score）
β<1，表示Precision比Recall重要
β>1，表示Recall比Precision重要

精确率和召回率相互“制约”：精确率高，则召回率就低；召回率高，则精确率就低。因此就需要综合考虑它们，最常见的方法就是 F-score 。F-score越大模型性能越好。

6. PR曲线

6.1 绘制方法

PR曲线以召回率R为横坐标、以精确率P为纵坐标，以下面的数据为例说明一下绘制方法：

	1	2	3	4	5
预测为正类的概率 score	0.9	0.8	0.7	0.5	0.3
实际类别 class	1	0	1	1	0

将每个样本的预测结果按照预测为正类的概率排序（上面已排序）
依次看每个样本

a) 对于样本1，将它的 score 0.9 作为阈值，即 score >= 0.9时样本预测为 1 ，反之预测为 0，得到以下混淆矩阵

真实1 真实0
预测1 1 0
预测0 2 2
b) 对于样本2，将它的 score 0.8 作为阈值，即 score >= 0.8时样本预测为 1 ，反之预测为 0，得到以下混淆矩阵

真实1 真实0
预测1 1 1
预测0 2 1
c) ……

d) ……

e) 对于样本5，将它的 score 0.3 作为阈值，即 score >= 0.3时样本预测为 1 ，反之预测为 0，得到以下混淆矩阵

真实1 真实0
预测1 3 2
预测0 0 0
根据上面的混淆矩阵，依次算出 5 对(R, R)，以召回率R为横坐标、以精确率P为纵坐标，将这些点连接起来即得到 PR 曲线。

6.2 模型性能衡量方法

请添加图片描述

如果曲线A完全“包住”曲线B，则A的性能优于B（P和R越高，代表算法分类能力越强）；
曲线AB发生交叉时：以PR曲线下的面积作为衡量指标（这个指标通常难以计算）；
使用 “平衡点”（P=R时的取值），值越大代表效果越优（这个点过于简化，更常用的是F1-score）。

7. ROC曲线

真阳性率（真实1里面正确预测为1的概率）： $\frac{TP}{TP+FN}$

假阳性率（真实0里面错误预测为1的概率）： $\frac{FP}{FP+TN}$

7.1 绘制方法

ROC曲线以假阳性率FPR为横坐标、以真阳性率TPR为纵坐标，以下面的数据为例说明一下绘制方法：

	1	2	3	4	5
预测为正类的概率 score	0.9	0.8	0.7	0.5	0.3
实际类别 class	1	0	1	1	0

将每个样本的预测结果按照预测为正类的概率排序（上面已排序）
依次看每个样本

a) 对于样本1，将它的 score 0.9 作为阈值，即 score >= 0.9时样本预测为 1 ，反之预测为 0，得到以下混淆矩阵

真实1 真实0
预测1 1 0
预测0 2 2
b) 对于样本2，将它的 score 0.8 作为阈值，即 score >= 0.8时样本预测为 1 ，反之预测为 0，得到以下混淆矩阵

真实1 真实0
预测1 1 1
预测0 2 1
c) ……

d) ……

e) 对于样本5，将它的 score 0.3 作为阈值，即 score >= 0.3时样本预测为 1 ，反之预测为 0，得到以下混淆矩阵

真实1 真实0
预测1 3 2
预测0 0 0
根据上面的混淆矩阵，依次算出 5 对(FPR, TPR)，以假阳性率FPR为横坐标、以真阳性率TPR为纵坐标，将这些点连接起来即得到 ROC 曲线。

7.2 模型性能衡量方法

请添加图片描述

ROC曲线下的面积（AUC）作为衡量指标，面积越大，性能越好。

7.3 AUC的计算

在有M个正样本，N个负样本的数据集里。一共有MN对样本（一对样本即一个正样本与一个负样本）。统计这MN对样本里，正样本的预测概率大于负样本的预测概率的个数：

$\frac{\sum I(P_\text{正样本},P_\text{负样本})}{M^*N}$

其中：

$I(P_\text{正样本},P_\text{负样本})=\begin{cases}1,P_\text{正样本}>P_\text{正样本}\\0.5,P_\text{正样本}=P_\text{负样本}\\0,P_\text{正样本}<P_\text{负样本}\end{cases}$

http://www.khdw.cn/news/47993.html

相关文章：

顺德医疗网站建设口碑营销案例分析

网站seo策划方案设计网站seo文章

logo在线设计生成器小智合肥百度推广优化排名

郑州网站建设公司怎么选百度指数是干嘛的

二手车辆交易网站如何做自媒体平台

广东省建设教育协会是什么网站站长之家网站模板

利用切片做网站背景图片百度成都总部

外贸公司网站制作价格seo策略主要包括

浙江建设日本公司网站购买域名

日本风格网站竞价推广开户多少钱

宁波建站价格软文营销

菏泽网站建设同城推广有什么平台

网站技术维护seo百度快速排名

班级网站设计毕业论文友情链接还有用吗

视频新闻网站建设google引擎入口

怎么样让百度搜到自己的网站南京seo代理

网站导入链接百度客服24小时人工服务在线咨询

公司网站怎样做维护厦门关键词排名提升

如果创建网站河南百度关键词优化排名软件

做网站的属于什么岗位网店代运营公司

今日重大新闻头条财经seo引擎搜索

通过模版做网站重庆seo公司

专业做淘宝网站绍兴教育培训报名

怎么做外语网站亚马逊关键词排名查询工具

河源哪有做网站北京seo排名外包

企业网站内容模块线上营销策划方案

为什么后台编辑内容和网站上面显示的内容不一致百度关键词快排

自己做的网站怎么在百度能搜到seo资讯

自己做的网站网页滑动不百度关键词优化策略

wordpress算数的插件谷歌sem和seo区别