66读书

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

机器学习是“让机器从数据中长本事”的技术(第3页)

巧妇难为无米之炊,数据就是机器学习的“米”。

- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。

- 数据预处理:这步特别关键,就像淘米要去沙。包括:

- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。

- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。

- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。

2. 特征工程:给数据“化妆”,让模型看得更清楚

“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。

- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。

- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。

3. 模型训练:让机器“刷题涨本事”

选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。

- 训练过程中,得注意过拟合和欠拟合:

- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。

- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。

解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。

4. 模型评估:给机器“考试”打分

训练好的模型得测试一下准不准。常用的指标有:

热门小说推荐
不循作者一寸方舟

不循作者一寸方舟

《不循作者一寸方舟》不循作者一寸方舟目录全文阅读,主角是赵若桐邵震虞小说章节完整质量高,包含结局、番外。?《不循》作者:一寸方舟[古装迷情]《不循》作者:一寸方舟【完结】晋江2021-02-02完结总书评数:38234当前被收藏数:74832营养液数:122091文章积分:905,618,368文案:邵循是英国公府的嫡长女。父亲是一品公侯,母亲是世家贵女,宫里的淑妃娘娘是她姑姑,太子之位的有力竞...

他正在赴死

他正在赴死

塔莫尔沙漠放逐区的众人皆知,时榫是个又丧又损的歹货。该货日常状态就是——遇到危险,时榫:大不了去死。碰到难题,时榫:我怎么还没死?有人问话,时榫:你们就当我死了。遭到质疑,时榫:爱信不信,不信去死。被人求助,时榫:那能怎么办,要不我去死?放逐区一干罪犯们日常就是想打死这家伙。但时日一长,他们就发现:这家伙不止打不死......

民国诡事

民国诡事

堂前擂鼓召灵官,我请老仙出大关。灵宝入烟乘云升,道炁长存敕庭坛。相传乱世之中必出妖孽,动荡年代必有殃灾。是极煞、是妖邪、是阴祟、是幽藏,最后也都不过是人祸二字。这是顶香没多久的我,偶然得知老祖辈故事的故事。附读者交流群-开席上菜:72950469......

穿书之循规蹈矩

穿书之循规蹈矩

上个厕所,老子就穿书了,来到一本带有玄幻题材的网络名著,虽然是个炮灰,但老子绝对不会干扰这里的秩序……...

清梦大帝

清梦大帝

故事设定在一个不存在的世界,泰威帝国末年,民不聊生,生灵涂炭,宦官轮流交替掌权,一心想完成统一大梦的青年张清梦,凭借着自己高超的军事才能和领导,以及遇到的许许多多伙伴,他的命运开始了扭转顺带说一下作者是学生,文笔不好,请大家轻喷(*/ω\*)希望大家多多提出宝贵意见,我会......尽量使我的文笔更好的【展开】【收起】...

暗欲 作者:圣妖

暗欲 作者:圣妖

《暗欲作者:圣妖》暗欲作者:圣妖目录全文阅读,主角是南夜爵恩恩小说章节完整质量高,包含结局、番外。?暗欲作者:圣妖简介:他们的开始,没有爱,只有性,他想从她身上得到畅快淋漓的极致,不眠沉沦,却也只是身体的缠绵。他的手,修长好看,可在她的眼中,那却是一张束缚不了的巨网,她挣脱不了。她渴望自由呼吸,可这个男人,她始终冲不过去,真的,只有他死了自己才能解脱吗?既然活不了,就拉着他坠入地狱吧。爱情,早已在不知不...