机器学习在零售业中的十个关键应用 近年来,在封锁、宵禁、供应链中断和能源紧缩之间,零售商一定感觉很恐慌。但,幸运的是,零售业可以依靠全方位的技术创新来更好地应对这些困难时期的挑战。 这些技术中最有影响力的工具之一肯定是人工智能,包括其... 人工智能# 机器学习 2年前2540
稀疏特征和密集特征 在机器学习中,特征是指对象、人或现象的可测量和可量化的属性或特征。特征可以大致分为两类:稀疏特征和密集特征。 稀疏特征 稀疏特征是那些在数据集中不连续出现的特征,并且大多数值为零。稀疏特征的示例包括文... 人工智能# 机器学习 2年前2130
无监督学习的12个最重要的算法介绍及其用例总结 无监督学习(Unsupervised Learning)是和监督学习相对的另一种主流机器学习的方法,无监督学习是没有任何的数据标注只有数据本身。 无监督学习算法有几种类型,以下是其中最重要的12种: ... 人工智能# 机器学习 2年前1810
年终盘点:2022年最炙手可热的十家数据科学和机器学习初创公司 随着企业要应对越来越多的数据(包括组织内部生成的和从外部来源收集的数据),找到有效的方法来分析和“操作”这些数据以获得竞争优势,变得越来越具有挑战性。 这也推动了数据科学和机器学习领域对新工具和新技术... 人工智能# 机器学习 2年前1780
时间序列机器学习数据集的非常规拆分技术 确保机器学习模型在未知环境中泛化的一种尝试是拆分数据。这可以通过多种方式实现,从3-way(训练、测试、评估)拆分到交叉验证的k拆分。其基本原理是,通过在数据子集上训练机器学习模型,并在未知数据上进行... 人工智能# 机器学习 2年前1730
利用模型性能管理(MPM)解决机器学习模型监控挑战 译者 | 李睿 审校 | 孙淑娟 在过去几年,世界的数字化给组织和企业带来了独特的机遇和挑战。虽然数据的蓬勃发展为提高决策准确度提供了更多的机会,但现在分析和利用这些信息更加耗时和昂贵。因此,各种规... 人工智能# 机器学习 2年前960
机器学习评估指标的十个常见面试问题 评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模... 人工智能# 机器学习 2年前890
自组织映射神经网络(SOM)实战 译者 | 朱先忠 审校 | 孙淑娟 自组织映射的演变迭代gif动画示意图 1. 简介 自组织映射(SOM)是由芬兰赫尔辛基理工大学的Teuvo Kohonen在20世纪80年代提出的一种无监督机器学习... 人工智能# 机器学习 2年前850
使用机器学习评估异质治疗效果 译者 | 朱先忠 审校 | 孙淑娟 引言 在许多情况下,我们不仅对估计因果效应感兴趣,而且对不同用户的这种效应是否不同也感兴趣。我们可能有兴趣了解一种药物是否对不同年龄的人有不同的副作用。或者,我们... 人工智能# 机器学习 2年前710
MLOps:企业是否在重复同样的 DIY 错误? 译者 | 崔皓 审校 | 孙淑娟 开篇 一般而言,企业不会主动构建自有的云计算基础设施是有原因的。过去十年,IT 基础架构团队试图构建自己的私有云,因为他们认为与公共云相比,私有云会以性价比更高的方... 人工智能# 机器学习 2年前680
Wandb不可缺少的机器学习分析工具 wandb wandb全称Weights & Biases,用来帮助我们跟踪机器学习的项目,通过wandb可以记录模型训练过程中指标的变化情况以及超参的设置,还能够将输出的结果进行可视化的比对... 人工智能# 机器学习 2年前630
五分钟技术趣谈 | 机器学习的前世今生 Part 01 机器学习是什么? 实现人工智能的方法我们称之为“机器学习”,在1956年的美国达特茅斯会议上,Arthur Samuel正式提出了“Machine Learning”这个概念。机器学... 人工智能# 机器学习 2年前620
Pytorch创建多任务学习模型 MTL最著名的例子可能是特斯拉的自动驾驶系统。在自动驾驶中需要同时处理大量任务,如物体检测、深度估计、3D重建、视频分析、跟踪等,你可能认为需要10个以上的深度学习模型,但事实并非如此。 HydraN... 人工智能# 机器学习 2年前580
盘点20多个强大且免费的数据源,任何人都能以此来构建AI 当我们谈论当今商业领域和社会中的人工智能时,我们其实指的是机器学习。机器学习是一种应用,通过使用算法(一组指令)变得越来越擅长执行某项特定任务,因为它接触了越来越多与这项任务相关的数据。 这些任务可以... 人工智能# 机器学习 2年前560
AI开发大一统:谷歌OpenXLA开源,整合所有框架和AI芯片 在去年 10 月的 Google Cloud Next 2022 活动中,OpenXLA 项目正式浮出水面,谷歌与包括阿里巴巴、AMD、Arm、亚马逊、英特尔、英伟达等科技公司推动的开源 AI 框架合... 人工智能# 机器学习 2年前520
宾大机器学习PhD:我是如何从头开始写一篇顶级论文的? 最近完成了一篇很满意的论文,不仅整个过程愉快、回味无穷,而且真正做到了「学术有影响,工业有产出」。我相信这篇文章会改变差分隐私(differential privacy;DP)深度学习的范式。 因为这... 人工智能# 机器学习 2年前520
图解最常用的十大机器学习算法! 在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。 举个例子来说,你不能说神经网络永远比决策树好... 人工智能# 机器学习 2年前490
从决策树到Transformer——餐厅评论情感分析模型比较 译者 | 朱先忠 审校 | 孙淑娟 本文将展示各种流行机器学习模型和嵌入技术对马其顿餐厅评论情感分析的有效性,探索并比较几种经典的机器学习模型以及包括神经网络和Transformers在内的现代深... 人工智能# 机器学习 2年前470
机器学习如何应对气候变化 近年来,人工智能(AI)因其彻底改变从医疗保健到金融等行业的潜力而成为头条新闻。但人工智能被证明特别有前途的一个领域是应对气候变化。机器学习是人工智能的一个子集,正被用于解决当今面临的一些最紧迫的环境... 人工智能# 机器学习 2年前460
大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务 当前,大型语言模型(LLM)已经掀起自然语言处理(NLP)领域的变革浪潮。我们看到 LLM 具备强大的涌现能力,在复杂的语言理解任务、生成任务乃至推理任务上都表现优异。这启发人们进一步探索 LLM 在... 人工智能# 机器学习 2年前450
结合基于规则和机器学习的方法构建强大的混合系统 经过这些年的发展,我们都确信ML即使不能表现得更好,至少也可以在几乎所有地方与前ML时代的解决方案相匹配。比如说一些规则约束,我们都会想到能否把它们替换为基于树的ml模型。但是世界并不总是黑白分明的... 人工智能# 机器学习 2年前450
使用CLIP构建视频搜索引擎 CLIP(Contrastive Language-Image Pre-training)是一种机器学习技术,它可以准确理解和分类图像和自然语言文本,这对图像和语言处理具有深远的影响,并且已经被用作流... 人工智能# 机器学习 2年前450
用 PySpark ML 构建机器学习模型 Spark 是一种专门用于交互式查询、机器学习和实时工作负载的开源框架,而 PySpark 是 Python 使用 Spark 的库。 PySpark 是一种用于大规模执行探索性数据分析、构建机器学... 人工智能# 机器学习 2年前450
一文读懂什么是机器学习 世界充满了数据——由人和计算机生成的图像、视频、电子表格、音频和文本充斥着互联网,将我们淹没在信息的海洋中。 传统上,人类分析数据以做出更明智的决策,并设法调整系统以控制数据模式的变化。然而,随着传入... 人工智能# 机器学习 2年前440
集成时间序列模型提高预测精度 使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测。 集成各种弱学习器可以提高预测精度,但是如果我们的模型已经很强大了,集成学习往往也能够起到锦上添花的作用。流行的机器学习... 人工智能# 机器学习 2年前440
清华大学发布首个课程学习开源库CurML 在机器学习的发展过程中,人类的学习方式常常会对各种算法的设计产生启发。而作为人类学习的一个重要范式,通过课程进行学习,已经被借鉴到机器学习中形成了名为课程学习(Curriculum Learning... 人工智能# 机器学习 2年前440
机器学习真能产生智能决策吗? 历经三年时间,我们在2022年完成了图灵奖获得者、加州大学洛杉矶分校计算机科学教授,美国国家科学院院士,被誉为“贝叶斯网络之父”的朱迪亚·珀尔大作《因果论:模型、推理和推断》。 这本书原版的第1版写于... 人工智能# 机器学习 2年前420
PathAI利用机器学习推动药物开发 译者 | 朱先忠 审校 | 孙淑娟 位于美国波士顿的病理人工智能技术公司PathAI是病理学(疾病研究)人工智能技术工具和服务的领先供应商。他们开发的平台旨在利用机器学习中的现代方法,如图像分割、图... 人工智能# 机器学习 2年前420
使用马尔可夫链构建文本生成器 本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。 文本生成器简介 文本生成在各个行业都很受欢迎,特别是在移动、应用和数据科学... 人工智能# 机器学习 2年前410
强化学习大牛Sergey Levine新作:三个大模型教会机器人认路 内置大模型的机器人,在不看地图的情况下,学会了按照语言指令到达目的地,这项成果来自强化学习大牛 Sergey Levine 的新作。 给定一个目的地,在没有导航轨迹的情况下顺利到达,有多难? 对于方... 人工智能# 机器学习 2年前410
年中盘点:2022年炙手可热的十家数据科学和机器学习初创公司 企业要应对越来越多的数据,无论是在组织内部生成的数据,还是从外部来源收集的数据,如何寻找有效的方法来分析和“操作”所有这些数据从而获得竞争优势,正在变得越来越具有挑战性。 这也推动了数据科学和机器学习... 人工智能# 机器学习 2年前400
通过使用因果机器学习做出有效的可操作决策以优化业务KPI 译者 | 李睿 审校 | 孙淑娟 在不同的场景中,常用的机器学习建模技术可能会误解数据中的真实关系。因此在这里试图改变这种范式,以基于估计因果关系和衡量目标关键绩效指标(KPI)结果的治疗效果... 人工智能# 机器学习 2年前390
生成式AI应用的五大优势 生成式AI是指使用AI和机器学习算法使机器能够创建新的数字视频、图像、文本、音频或代码的技术。生成式AI由算法驱动,这些算法具有识别输入的底层模式、生成类似输出并提供高质量内容的潜力。一种更升级的生成... 人工智能# 机器学习 2年前390
Nature子刊:AI算法破解癌细胞基因特征,准确率可达99%! AI又立功了。 这次一项新的AI机器学习算法「Ikarus」,可破解癌细胞和正常细胞的基因特征差别。 这项研究由MDC生物信息学家Altuna Akalin团队完成,并发表在Nature子刊「Geno... 人工智能# 机器学习 2年前380
机器学习正在赋能制药行业 机器学习一直在各个行业掀起波澜,包括制药行业。 通过利用先进的算法和大量数据,机器学习正在彻底改变药物的开发、制造和分销方式。在本文中,我们将探讨机器学习如何为制药行业赋能。 药物发现与开发 机器学习... 人工智能# 机器学习 2年前370
机器学习如何使农业更具可持续性 在气候迅速变化的时代,实现农业可持续性对于确保地球的健康和福祉至关重要。 由于资源有限,人口不断增加,传统的耕作方式已无法支持可持续的粮食系统。 好在,当前机器学习的技术进步为实现更可持续的农业实践提... 人工智能# 机器学习 2年前370
度小满自动机器学习平台实践 随着 AI 技术的发展,不同业务涉及的 AI 技术越来越多样,同时 AI 模型参数量逐年爆发式增长,如何克服 AI 算法落地面临的开发成本高、对人工依赖强、算法不稳定及落地周期长等问题,成为困扰人工智... 人工智能# 机器学习 2年前370
11个常见的分类特征的编码技术 机器学习算法只接受数值输入,所以如果我们遇到分类特征的时候都会对分类特征进行编码,本文总结了常见的11个分类变量编码方法。 1、ONE HOT ENCODING 最流行且常用的编码方法是One Hot... 人工智能# 机器学习 2年前370
机器学习:73%的企业迷途求生 大家都知道,机器学习(ML)是人工智能的关键技术之一,也是一项逐渐走向成熟的应用技术。具体说来,这一技术可以为未来的数据科学带来变革,能够让应用企业作出基于更多数据分析的驱动决策,从而改善用户的业务体... 人工智能# 机器学习 2年前370
机器学习入门必备:如何用Python从头实现感知器算法 在本教程中,你将了解到如何利用 Python 从头开始实现感知器算法。 在完成本教程后,你将学会: 如何训练感知器的网络权重 如何利用感知器做出预测 如何对于现实世界的分类问题实现感知器算法 让我们开... 人工智能# 机器学习 2年前360
苹果 WWDC23 不提“人工智能”,更倾向使用“机器学习” 6 月 6 日消息,苹果公司在周一的 WWDC 2023 主题演讲中,除了发布了备受期待的 Mac Pro 和 Vision Pro 等新产品外,还展示了其在机器学习领域的最新进展。不过IT之家注意到... 人工智能# 机器学习 2年前350
机器学习中实施随机森林算法的指南 随着机器学习模型在预测和分析数据方面变得越来越流行,随机森林算法的使用正在获得动力。随机森林是一种监督学习算法,用于机器学习领域的回归和分类任务。它的工作原理是在训练时构建大量决策树并输出类,即类的模... 人工智能# 机器学习 2年前350
机器学习模型和高斯过程的不确定性 介绍 让我们以一个例子来说明我们所面临的问题。想象一下,我们训练一个神经网络模型来预测包含汽车图像的概率。当我们使用这些概率来对有汽车的图像进行分类时,我们的模型有很好的准确性。在某些时候,我们给神经... 人工智能# 机器学习 2年前350
机器学习回归模型相关重要知识点总结 1、线性回归的假设是什么? 线性回归有四个假设: 线性:自变量(x)和因变量(y)之间应该存在线性关系,这意味着x值的变化也应该在相同方向上改变y值。 独立性:特征应该相互独立,这意味着最小的多重共... 人工智能# 机器学习 2年前350
从机器学习中受益最大的四个行业 机器学习是人工智能的一个分支,具有最大的未来潜力并为行业带来最大的利益。据相关报告显示,到2025年,机器学习市场规模将达到967亿美元。与2018年的68亿美元相比,这将是一个巨大的增长。 在未来几... 人工智能# 机器学习 2年前350
机器学习理论基础到底有多可靠? 机器学习领域中,有些模型非常有效,但我们并不能完全确定其原因。相反,一些相对容易理解的研究领域则在实践中适用性有限。本文基于机器学习的效用和理论理解,探讨各个子领域的进展。 这里的实验效用是一种综合考... 人工智能# 机器学习 2年前350
机器学习、深度学习、神经网络之间的区别 机器学习、深度学习和神经网络是您在人工智能领域会听到的一些最常见的技术术语。 如果您不专注于构建 AI 系统,可能会感到困惑,因为这些术语经常互换使用。 在本文中,我将介绍机器学习、深度学习和神经网络... 人工智能# 机器学习 2年前330
为深度学习选择最好的GPU 在进行机器学习项目时,特别是在处理深度学习和神经网络时,最好使用GPU而不是CPU来处理,因为在神经网络方面,即使是一个非常基本的GPU也会胜过CPU。 但是你应该买哪种GPU呢?本文将总结需要考虑的... 人工智能# 机器学习 2年前330
使用PyTorch进行知识蒸馏的代码示例 随着机器学习模型的复杂性和能力不断增加。提高大型复杂模型在小数据集性能的一种有效技术是知识蒸馏,它包括训练一个更小、更有效的模型来模仿一个更大的“教师”模型的行为。 在本文中,我们将探索知识蒸馏的概念... 人工智能# 机器学习 2年前330
机器学习决策树实战演练 译者 | 朱先忠 审校 | 孙淑娟 机器学习中的决策树 现代机器学习算法正在改变我们的日常生活。例如,像BERT这样的大型语言模型正在为谷歌搜索提供支持,GPT-3正在为许多高级语言应用程序提供支持... 人工智能# 机器学习 2年前330
用机器学习解码一颗“失声”15年的大脑,让它“开口说话” 大数据文摘作品 作者:Miggy 对于瘫痪患者来说,最大的苦楚来自无法与外界进行沟通。虽然大脑依然活跃并且希望表达,但是无法驱动发声肌肉,会让这类患者的语言机制逐渐蜕化。 来自加州大学旧金山分校神经... 人工智能# 机器学习 2年前330
蔚来汽车深度学习算法实践 一、NIO Power 业务背景 1、蔚来汽车能源服务体系 NIO Power 业务团队的目标是构建全球创新的智能能源服务体系,基于移动互联网的加电解决方案,拥有广泛布局的充电换电设施网络,依托蔚来云... 人工智能# 机器学习 2年前320
图嵌入概述:节点、边和图嵌入方法及Python实现 近年来基于图的机器学习有了很大的发展。基于图的方法在数据科学中的许多常见问题中都有应用,例如链接预测、社群发现、节点分类等。根据如何组织问题和所拥有的数据,有许多解决问题的方法。本文将提供一个基于图的... 人工智能# 机器学习 2年前320
机器学习必知必会十大算法! 1.线性回归 线性回归(Linear Regression)可能是最流行的机器学习算法。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变... 人工智能# 机器学习 2年前320
机器学习超参调优:常用八种方法 机器学习算法需要用户定义的输入来实现准确性和通用性之间的平衡。这个过程称为超参数调整。有多种工具和方法可用于调整超参数。 我们整理了一份用于调整机器学习模型超参数的前八种方法的列表。 1.贝叶斯优化 ... 人工智能# 机器学习 2年前320
机器学习和物联网的交叉:智能设备和预测分析 智能家居的未来:集成机器学习和物联网,以增强预测分析。 机器学习和物联网(IoT)的交叉正在彻底改变我们生活、工作以及与环境互动的方式。这种技术融合使智能设备的发展成为可能,这些设备可以从周围环境中学... 人工智能# 机器学习 2年前310
基于信息论的校准技术,CML让多模态机器学习更可靠 多模态机器学习在各种场景下都取得了令人瞩目的进展。然而,多模态学习模型的可靠性尚缺乏深入研究。「信息是消除的不确定性」,多模态机器学习的初衷与这是一致的——增加的模态可以使得预测更为准确和可靠。然而... 人工智能# 机器学习 2年前310
为什么机器学习中的数据要用向量/矩阵来表示? 在数据科学和机器学习中,我们经常将数据表示为向量和矩阵。在数学和物理中,向量被定义大小和方向的量(例如,距离向量)。然而,通常我们处理的数据不一定会遵循向量的定义,但但我们仍然用向量来表示数据。例如... 人工智能# 机器学习 2年前310
使用Scikit-lwarn的Imputer 译者 | 布加迪 审校 | 孙淑娟 Imputer 如果您的数据集中有一些缺失值,您可能会删除缺失值行甚至列。强烈建议不使用这种方法,因为这会减少数据的大小,而且数据分析可能偏离事实。相反,我们应该... 人工智能# 机器学习 2年前310
人工智能如何诠释“眼睛是心灵之窗” 利用机器学习开发的软件可以通过分析某人眼睛中的静脉和动脉,在不到一分钟的时间内预测某人患心脏病的风险。 这项新研究发表在《英国眼科学杂志》上。如果这项发现在未来的临床试验中得到验证,将为快速、廉价的... 人工智能# 机器学习 2年前310
基于TensorFlow和QuestDB的时间序列预测 译者 | 朱先忠 审校 | 孙淑娟 时间序列预测的机器学习概述 当前,机器学习正在席卷全球,机器人能够以类似人类的精度完成许多领域中的任务。例如,在医疗领域,智能助手可以随时检查人们的健康状况;在... 人工智能# 机器学习 2年前310
机器学习如何防止列车延误 使用机器学习可以帮助预测列车延误,检测故障的早期迹象,并根据需求变化规划路线,可以在长期和短期内通过减少列车延误和确保高服务质量来改善铁路旅行。 晚点的列车影响着全世界数百万人,而运营商几乎不能做什么... 人工智能# 机器学习 2年前310
无监督机器学习如何使工业自动化受益? 现代工业环境充满了传感器和智能组件,所有这些设备一起产生了丰富的数据。当今大多数工厂尚未深入开发的这些数据,为各种令人兴奋的新应用提供了动力。事实上,据 IBM 称,平均每个工厂每天都会产生 1TB ... 人工智能# 机器学习 2年前310
TabTransformer转换器提升多层感知机性能深度解析 如今,转换器(Transformers)成为大多数先进的自然语言处理(NLP)和计算机视觉(CV)体系结构中的关键模块。然而,表格式数据领域仍然主要以梯度提升决策树(GBDT)算法为主导。于是,有人... 人工智能# 机器学习 2年前310
和TensorFlow一样,英伟达CUDA的垄断格局将被打破? 十年来,机器学习软件开发的格局发生了重大变化。许多框架如雨后春笋般涌现,但大多数都严重依赖于英伟达的 CUDA,并在英伟达的 GPU 上才能获得最佳的性能。然而,随着 PyTorch 2.0 和 O... 人工智能# 机器学习 2年前300
如何使用机器学习来分析情感 我们使用了不同的机器学习算法进行情感分析,然后将各个算法的准确率结果进行比较,以确定哪一种算法最适合这个问题。 情感分析是自然语言处理(NLP)中的一个重要的内容。情感指的是我们对某一事件、物品、情况... 人工智能# 机器学习 2年前300
带掩码的自编码器MAE在各领域中的应用总结 机器学习算法应该理解数据从中提取有用的特征才能够解决复杂的任务。通常训练泛化模型需要大量带注释的数据。这个是非常费时费力的,并且一般情况下都很难进行。 所以各种基于带掩码的自编码器技术就出现了,这种技... 人工智能# 机器学习 2年前300
用机器学习解决非结构化数据问题 译者 | 布加迪 审校 | 孙淑娟 数据革命如火如荼。未来五年内创建的数字数据总量将是迄今生成的数据总量的两倍,非结构化数据将定义这个倡导数字体验的新时代。 非结构化数据指不遵循传统模型或不适合结构... 人工智能# 机器学习 2年前300
终于有人把分布式机器学习讲明白了 分布式机器学习也称分布式学习,是指利用多个计算节点(也称工作节点,Worker)进行机器学习或者深度学习的算法和系统,旨在提高性能、保护隐私,并可扩展至更大规模的训练数据和更大的模型。 联邦学习可以... 人工智能# 机器学习 2年前300
借助独特2D材料和机器学习,CV像人一样「看见」数百万种颜色 人的眼睛可以看见数百万种颜色,现在人工智能也可以。 近日,来自美国东北大学的一个跨学科研究团队使用新的人工智能技术构建了一种可以识别数百万种颜色的新设备 A-Eye,这让机器视觉领域迈出了一大步,将被... 人工智能# 机器学习 2年前300
MLFlow打包和部署机器学习模型实战 译者 | 朱先忠 审校 | 孙淑娟 简介 ML模型生命周期开发每个阶段的基本活动之一是协作。从ML模型的概念到部署,需要构建模型所涉及的不同角色之间的参与和交互。此外,ML模型开发的本质涉及实验、工... 人工智能# 机器学习 2年前290
机器学习模型以出色的精度进行有机反应机理分类 化学反应的发现不仅受到获得实验数据的速度的影响,还受到化学家理解这些数据的难易程度的影响。揭示新的催化反应的机理基础是一个特别复杂的问题,通常需要计算和物理有机化学的专业知识。然而,研究催化反应很重要... 人工智能# 机器学习 2年前280
一日一卡挑战:RTX2080Ti搞定大模型训练,算力节省136倍,学界欢呼 在一块消费级 GPU 上只用一天时间训练,可以得到什么样的 BERT 模型? 最近一段时间,语言模型再次带火了 AI 领域。预训练语言模型的无监督训练属性使其可以在海量样本基础上进行训练,并获得大量语... 人工智能# 机器学习 2年前280
在表格数据上,为什么基于树的模型仍然优于深度学习? 深度学习在图像、语言甚至音频等领域取得了巨大的进步。然而,在处理表格数据上,深度学习却表现一般。由于表格数据具有特征不均匀、样本量小、极值较大等特点,因此很难找到相应的不变量。 基于树的模型不可微,不... 人工智能# 机器学习 2年前280
机器学习中的集成方法概述 想象一下,你正在网上购物,你发现有两家店铺销售同一种商品,它们的评分相同。然而,第一家只有一个人的评分,第二家有 100 人评分。您会更信任哪个评分呢?最终您会选择购买哪家的商品呢?大多数人的答案很... 人工智能# 机器学习 2年前280
用Python监测MLOps管道中的模型性能 点击参加51CTO网站内容调查问卷 译者 | 布加迪 审校 | 重楼 机器学习模型只有在生产环境中用于解决业务问题时才有帮助。然而,业务问题和机器学习模型在不断发展变化。这就要求我们维护机器学习,以便... 人工智能# 机器学习 2年前270
浅谈图嵌入算法 Part 01 ● 什么是图嵌入 ● 图嵌入是将图结构数据映射为低维稠密向量的过程,同时使得原图中拓扑结构相似或属性接近的节点在向量空间上的位置也接近,能够很好地解决图结构数据难以高效输入机器学习... 人工智能# 机器学习 2年前270
十个用于 AutoML 的 GitHub 存储库 人工智能和机器学习的突破是过去二十年中最激动人心的两个话题。机器学习和数据科学工程师需要广泛的研究和努力工作才能有效地理解和运行他们的模型。 虽然它们可能因人而异,但传统的机器学习步骤包括: 数据采集... 人工智能# 机器学习 2年前270
机器学习11种特征选择策略总结! 太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。 “特征选择”意味着可以保留一些特征... 人工智能# 机器学习 2年前270
12个常用的图像数据增强技术总结 机器学习或深度学习模型的训练的目标是成为“通用”模型。这就需要模型没有过度拟合训练数据集,或者换句话说,我们的模型对看不见的数据有很好的了解。数据增强也是避免过度拟合的众多方法之一。 扩展用于训练模型... 人工智能# 机器学习 2年前270
机器学习如何彻底改变客户体验 机器学习通过增加更多的简单性、效率和生产力来改善客户体验。 客户体验(CX)是机器学习产生重大影响的一个领域,因为企业寻求利用这项技术与客户建立更加个性化、高效和有效的交互。在本文中,我们将通过解释企... 人工智能# 机器学习 2年前260
探索量子机器学习的未来:综合指南 量子机器学习是量子计算和人工智能交叉领域中一个快速发展的领域,有望彻底改变我们处理和分析数据的方式。随着世界越来越多地成为数据驱动,对更高效、更强大的计算系统的需求从未如此强烈。进入量子机器学习,其利... 人工智能# 机器学习 2年前260
机器学习中入门级必学的算法有哪些? K-近邻算法 什么是k-近邻算法? 就是根据你的邻居推断出你的类别 概念: K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对... 人工智能# 机器学习 2年前260
如何处理生产环境中的数据和机器学习偏误? 译者 | 布加迪 审校 | 重楼 您是否需要确定自己的数据集存在性别或种族方面的偏误?是否需要确保所使用的机器学习模型没有偏误,即使数据有偏误?如果您对上述问题的回答是肯定的,那么这篇文章就适合您阅读... 人工智能# 机器学习 2年前260
机器学习天降福音!数据科学家、Kaggle大师发布「ML避坑宝典」 数据科学和机器学习正变得越来越流行。 进入这个领域的人数,每天都在增长。 这意味着,很多数据科学家在构建第一个机器学习模型时,并没有丰富的经验,所以很容易发生错误。 以下就是机器学习解决方案中一些最... 人工智能# 机器学习 2年前260
一文综述「联邦图机器学习」,概念、技术、应用全都有 近年来,图已被广泛应用于表示和处理很多领域的复杂数据,如医疗、交通运输、生物信息学和推荐系统等。图机器学习技术是获取隐匿在复杂数据中丰富信息的有力工具,并且在像节点分类和链接预测等任务中,展现出很强的... 人工智能# 机器学习 2年前260
声学领域的机器学习研究可以开启多模态元宇宙 麻省理工学院和IBM Watson AI Lab的研究人员创建了一个机器学习模型,用于预测听众在3D空间内的不同位置上会听到什么。 研究人员首先使用这个机器学习模型来了解房间中的任何声音是如何在空间中... 人工智能# 机器学习 2年前260
量子机器学习Variational Quantum Classifier (VQC)简介 变分量子分类器(Variational Quantum Classifier,简称VQC)是一种利用量子计算技术进行分类任务的机器学习算法。它属于量子机器学习算法家族,旨在利用量子计算机的计算能力,潜... 人工智能# 机器学习 2年前250
机器学习正以惊人方式破解宇宙奥秘 太空旅行、探索和观测当中,往往涉及人类历史上最复杂、最危险的一系列科学与技术操作。在这些领域,人工智能(AI)已经证明了自己强大的辅助作用。 正因为如此,宇航员、科学家和其他以探索并记录终极边界为己任... 人工智能# 机器学习 2年前250
还不会机器学习模型部署?15 张图带你走进TensorFlow 部署框架! 开篇 前几日与一位从事开发3年的朋友小李聊天,得知他所在的企业正在进行机器学习相关的项目。最近,他接到了一个任务,就是将训练好的机器学习模型进行部署。这可愁坏了小李,他接触机器学习开发差不多有小半年了... 人工智能# 机器学习 2年前250
生成式人工智能在物联网中的地位如何? 近期,主流媒体都十分担心Alexa、Siri和Google的数字助理。这是因为,到目前为止,这些产品还没有使用生成式人工智能。生成式人工智能,是一组机器学习模型,经过训练可以根据提示猜测下一组单词或正... 人工智能# 机器学习 2年前240
涨知识!用逻辑规则进行机器学习 Skope-rules使用树模型生成规则候选项。首先建立一些决策树,并将从根节点到内部节点或叶子节点的路径视为规则候选项。然后通过一些预定义的标准(如精确度和召回率)对这些候选规则进行过滤。只有那些精... 人工智能# 机器学习 2年前240
机器学习必备:如何防止过拟合? 其实正则化的本质很简单,就是对某一问题加以先验的限制或约束以达到某种特定目的的一种手段或操作。在算法中使用正则化的目的是防止模型出现过拟合。一提到正则化,很多同学可能马上会想到常用的L1范数和L2范数... 人工智能# 机器学习 2年前240
持续学习常用六种方法总结:使ML模型适应新数据的同时保持旧数据的性能 持续学习是指在不忘记从前面的任务中获得的知识的情况下,按顺序学习大量任务的模型。这是一个重要的概念,因为在监督学习的前提下,机器学习模型被训练为针对给定数据集或数据分布的最佳函数。而在现实环境中,数据... 人工智能# 机器学习 2年前240
使用可视化工具和统计方法检测异常值 异常值(离群值)是指距离其他数据值太远的数据值。数据异常值可能是自然产生的,也可能是由于测量不准确、或系统故障造成的。与缺失值类似,异常值会破坏数据科学项目并返回错误的结果或预测。异常值也可能出现在倾... 人工智能# 机器学习 2年前240
科学家利用机器学习,用于区分可降解塑料和传统塑料 食品包装袋、咖啡杯、塑料袋……,塑料在我们的日常生活中随处可见。近年来随着国家政策的引导和居民环保意识的提高,越来越多的人开始使用可降解的塑料制品。 只是这些可降解的塑料制品和传统塑料之间,在外观上很... 人工智能# 机器学习 2年前230
机器学习的三大“疑难杂症”,因果学习是突破口 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 重庆和许多西部城市一样,常常被诟病为“互联网荒漠”,但它却有着很好的物联网土壤。 有数据显示,重庆有着近2000家物联网相... 人工智能# 机器学习 2年前230
基于机器学习和约束优化的数字孪生建模 译者 | 朱先忠 审校 | 孙淑娟 简介 如今,数据科学被广泛用于创建数字孪生(Digital Twins)——数字孪生是现实世界物理系统或过程的数字对应物,可用于输入行为、监控、维护、规划等的模拟和... 人工智能# 机器学习 2年前230
与生成模型相比,为何机器人研究还在用几年前的老方法? 目前机器人领域取得了显著进展,这些进展预示着未来机器人可以做更多事情。但是也有让人困扰的事情,因为与生成模型相比,机器人的进展还是有点逊色,尤其是 GPT-3 等模型的出现,这一差距更加突出。 生成模... 人工智能# 机器学习 2年前220
决策树和随机森林的理论、实现和超参数调整 在本文中,我们将详细介绍决策树和随机森林模型。此外,我们将展示决策树和随机森林的哪些超参数对它们的性能有重要影响,从而使我们能够在欠拟合和过拟合之间找到最佳方案。在了解了决策树和随机森林背后的理论之后... 人工智能# 机器学习 2年前220