属于机器学习常见流程的是
品牌型号:华为MateBook D15
系统:Windows 10
属于机器学习常见流程的是数据获取、特征提取、模型训练和验证、线下测试、线上测试。
1、数据获取:首先从线上拉取用户真实数据,用现有模型过一遍这些数据得到一些有用的信息作为标注人员的一个参考,加快标注速度;标注完成后,数据入库并解决冲突,冲突即是同一个query,两次标注结果不一致,解决冲突的办法一般是人工check,得到一个更准确的标注;
2、特征抽取:NLP任务一般需要抽取数据的特征,如ngram、词典特征、词向量特征、上游模块的输出等。一般离线和在线均需要特征抽取,所以离在线的这部分代码是共用的,避免在线特征抽取和离线不一致。抽取特征时有个小技巧是把能想到的特征均抽取出来,并保存成文本文件,避免重复的执行特征抽取的步骤,在实验的时候用mask的方式去屏蔽掉那些对模型没用的特征,因为针对神经网络这样的模型,值为0的特征一般不影响最终结果(如tanh/ReLU等,但sigmoid激活层可能会影响)。这样抽取出来的特征的格式一般还不能满足机器学习框架的要求,通过脚本转化成机器学习框架要求的格式即可。
3、模型训练和验证:常用的模型训练和验证步骤是:首先以一个简易的算法开始,快速的进行实现,并在交叉验证集上进行验证;然后画出它的学习曲线,通过学习曲线确定是否更多的数据或者更多的特征会对模型的优化有帮助。接着人为地检测交叉验证集中被错误的进行分类的或者预测的样本的共同特征,从实际入手对模型进行调整,不断调整并验证在交叉验证集上的误差,寻找最优的结果,优化模型。
4、线下测试:指在模型验证有提升后,在测试集上测试模型的性能指标。线下测试可以将模型集成在应用程序里测试,也可以单独测试模型。线下测试的指标一般跟具体的业务需求相关,包括:准确率(accuracy)、精确率(precesion)、召回率(recall)、F1值等。
5、线上测试:是模型上线后的测试,是跟业务紧密相关的一个指标。在实际工作中,一般先将版本上线至一个复制小流量环境,打到这个环境的流量同时也打到线上环境,然后同时取出线上环境的结果和复制小流量环境的结果,抽出两者的diff,人工做gsb(goodbadsame),即针对有diff的case,人工标注小流量好(good),还是线上好(bad),或者两者打平(same),如果good多于bad,说明gsb通过,可以上线供用户体验。这种方法与A/Btesting类似。模型上到线上后,可以通过用户行为反馈模型的好坏,如用户点击、pv等。
-
95铝芯电缆380V可带多少千瓦
品牌型号:德力西电线RVV95铝芯电缆380V可带212.586千瓦。计算方法如下:如果用380V50HZ的交流电,铝电缆的安全电流密度=4A/平方毫米,95平方毫米载流量=95x4=380(A)。功率P=√3UIcosa=1.732×380×380×0.85=212585.68(W)≈212.586(KW)。95平方毫米的四芯铝电缆,电流面积按9...
-
ac24v电源是什么电源
品牌型号:联想拯救者Y9000P系统:Windows11ac24v电源是交流电24V的的电源。ac24v是给需要交流24V的用电元器件供电,不能给直流元件供电。通常交流电(简称AC)波形为正弦曲线。交流电可以有效传输电力。但实际上还有应用其他的波形,例如三角形波、正方形波。生活中使用...
-
如何关闭苹果手机自动扣费
1、首先我们需要找到手机桌面上的“AppStore”点击进去,也就是我们平时下载软件的应用商城。2、当我们进入AppStore之后可以看见界面顶部的头像,点进去后点击最顶部的“AppleID”进行验证即可进入到账户设置界面。3、在账户设置界面中往下滑,即可看见“订阅”的选...
-
2p的功率相当于多少瓦
品牌型号:小米空调KFR-50GW2p的功率相当于1500-1800瓦左右,制冷量在5000W左右,适合25平米左右的房间使用。2p空调的额定制冷功率一般在1500-1800瓦左右,具体要看该空调的能效比是几级的了,平均每小时耗电量大约在1-1.8度之间。制热功率一般加上辅电的功率(一般在120...